Deuxième Maîtrise, cours de Méthodes de l’Investigation Economique
CORRIGE SOMMAIRE N°1
Etude de marché des sardinelles (Thiès- Nord)
|_read(econo\Sardkay.txt) kpr kpp spr spp kqr kqp sqr sqp
UNIT 88 IS NOW ASSIGNED TO: econo\Sardkay.txt
...SAMPLE RANGE IS NOW SET TO: 1 30
|_sample 10 30
|_stat kpr kpp spr spp kqr kqp sqr sqp /pmedian
NAME N MEAN ST. DEV VARIANCE MINIMUM MAXIMUM
KPR 21 46.137 20.488 419.76 14.900 100.00
KPP 21 39.610 25.949 673.38 9.5000 100.00
SPR 21 54.993 12.755 162.69 30.140 85.850
SPP 21 36.959 24.903 620.17 12.500 117.67
KQR 21 883.35 1179.0 0.13900E+07 2.1000 3980.9
KQP 21 263.23 281.33 79145. 2.0000 876.80
SQR 21 1540.3 1049.7 0.11019E+07 0.00000 3260.0
SQP 21 129.42 106.18 11274. 0.20000 410.60
VARIABLE = KPR
MEDIAN = 42.740
LOWER 25%= 34.260 UPPER 25%= 50.000 INTERQUARTILE RANGE= 15.74
MODE = 42.740 WITH 5 OBSERVATIONS
VARIABLE = KPP
MEDIAN = 30.600
LOWER 25%= 18.900 UPPER 25%= 59.650 INTERQUARTILE RANGE= 40.75
MODE NOT APPLICABLE
VARIABLE = SPR
MEDIAN = 55.700
LOWER 25%= 45.470 UPPER 25%= 60.985 INTERQUARTILE RANGE= 15.52
MODE NOT APPLICABLE
VARIABLE = SPP
MEDIAN = 27.570
LOWER 25%= 20.055 UPPER 25%= 46.595 INTERQUARTILE RANGE= 26.54
MODE NOT APPLICABLE
VARIABLE = KQR
MEDIAN = 299.50
LOWER 25%= 39.500 UPPER 25%= 1372.8 INTERQUARTILE RANGE= 1333.
MODE NOT APPLICABLE
VARIABLE = KQP
MEDIAN = 163.70
LOWER 25%= 61.450 UPPER 25%= 468.95 INTERQUARTILE RANGE= 407.5
MODE NOT APPLICABLE
VARIABLE = SQR
MEDIAN = 1288.7
LOWER 25%= 628.60 UPPER 25%= 2527.9 INTERQUARTILE RANGE= 1899.
MODE NOT APPLICABLE
VARIABLE = SQP
MEDIAN = 100.00
LOWER 25%= 41.400 UPPER 25%= 170.35 INTERQUARTILE RANGE= 128.9
MODE NOT APPLICABLE
Que conclure de cette première description des données ? D'une part, la sardinelle plate est d'importance négligeable par rapport à la sardinelle ronde (quantités très inférieures, prix inférieurs). D'autre part, Saint-Louis est un plus gros marché (deux fois plus de sardinelles rondes) que Kayar en moyenne sur une année, mais pas en saison de pointe (maxima de tailles comparables : 3300 et 4000 tonnes, respectivement). La sardinelle ronde est chère toute l'année à Saint-Louis (moyenne de prix plus élevée, variance plus faible) par rapport à Kayar. A part cette exception, les prix sont très volatiles (écart-type = 50% de la moyenne). Un troisième fait remarquable est la présence de mortes saisons, où la prise est quasiment nulle (minima des quantités proches de 0).
|_stat kqr kqp sqr sqp /pcor prankcor
NAME N MEAN ST. DEV VARIANCE MINIMUM MAXIMUM
KQR 21 883.35 1179.0 0.13900E+07 2.1000 3980.9
KQP 21 263.23 281.33 79145. 2.0000 876.80
SQR 21 1540.3 1049.7 0.11019E+07 0.00000 3260.0
SQP 21 129.42 106.18 11274. 0.20000 410.60
CORRELATION MATRIX OF VARIABLES - 21 OBSERVATIONS
KQR 1.0000
KQP 0.42023 1.0000
SQR 0.34252 0.10627 1.0000
SQP 0.32950 0.56442E-01 0.16202E-01 1.0000
KQR KQP SQR SQP
SPEARMAN RANK CORRELATION MATRIX - 21 OBSERVATIONS
KQR 1.0000
KQP 0.63766 1.0000
SQR 0.59740 0.10000 1.0000
SQP 0.28312 0.28571E-01 -0.72727E-01 1.0000
KQR KQP SQR SQP
On pourrait croire que les corrélations entre quantités débarquées sont étonnamment basses. Les prises de sardinelles rondes à Kayar sont corrélées à 30%-40% avec les autres prises, et c'est tout ! Il ne faut cependant pas oublier que la sardinelle plate représente une part négligeable du marché. Cela signifie que le seul coefficient vraiment important est la corrélation de 34% entre les prises de sardinelles rondes à Kayar et à Saint-Louis. Les pêcheurs peuvent donc diversifier leurs activités en migrant temporairement entre Kayar et Saint-Louis, mais cela ne leur procure qu'une forme d'assurance imparfaite car les prises sont positivement corrélées. Pour les familles où une seule personne est pêcheur, cette assurance est particulièrement inappropriée : la corrélation des rangs est très élevée, ce qui semble indiquer que les saisons de pointe (rangs élevés) et les saisons mortes (derniers rangs) sont en fait les mêmes à Kayar et à Saint-Louis.
|_genr kyr = kpr*kqr
|_genr syr = spr*sqr
|_genr kyp = kpp*kqp
|_genr syp = spp*sqp
|_stat kyp kyr syp syr /pmedian
NAME N MEAN ST. DEV VARIANCE MINIMUM MAXIMUM
KYP 21 12005. 16946. 0.28718E+09 99.000 62253.
KYR 21 46337. 78251. 0.61232E+10 105.00 0.33463E+06
SYP 21 4016.1 3263.5 0.10650E+08 8.6000 10578.
SYR 21 85257. 63665. 0.40532E+10 0.00000 0.25170E+06
VARIABLE = KYP
MEDIAN = 3237.5
LOWER 25%= 1269.9 UPPER 25%= 20920. INTERQUARTILE RANGE= 0.1965E+05
MODE NOT APPLICABLE
VARIABLE = KYR
MEDIAN = 9184.8
LOWER 25%= 2433.4 UPPER 25%= 57075. INTERQUARTILE RANGE= 0.5464E+05
MODE NOT APPLICABLE
VARIABLE = SYP
MEDIAN = 3243.5
LOWER 25%= 1608.8 UPPER 25%= 6161.9 INTERQUARTILE RANGE= 4553.
MODE NOT APPLICABLE
VARIABLE = SYR
MEDIAN = 72556.
LOWER 25%= 37772. UPPER 25%= 0.13282E+06 INTERQUARTILE RANGE= 0.9505E+05
MODE NOT APPLICABLE
Remarquez les statistiques sur la recette totale en sardinelles rondes à Kayar : la médiane est le cinquième de la moyenne et l'écart-type est le double de la moyenne ! Cela montre qu'à Kayar, la saison de pointe est très courte et représente une part cruciale de la recette annuelle. D'ailleurs, les statistiques descriptives sur les recettes montrent des écarts-types très élevés par rapport aux moyennes. Un coup d'œil sur les histogrammes des recettes devrait encore préciser notre idée sur la variabilité de l'activité.
Pour avoir une idée de la grandeur des recettes, il faut se souvenir que les prix étaient libellés en francs CFA par pièce, les quantités en tonnes et qu'une sardinelle pèse environ 50g (soit 20 par kg ou encore 20 000 par tonne). Il faut donc multiplier les moyennes par 20 000 pour obtenir une recette mensuelle en francs CFA (100 franc CFA = 1 franc français = 6 francs belges). Sachant qu'environ 4000 ménages vivent de la pêche à Kayar et un peu plus à Saint-Louis et qu'environ la moitié des pêcheurs partent en haute mer pour pêcher la dorade (entre autres), vous pouvez arriver facilement à une idée de la recette mensuelle par ménage dans l'activité de pêche de sardinelle.
|_plot kyp kyr syp syr /histo
REQUIRED MEMORY IS PAR= 4 CURRENT PAR= 500
FOR MAXIMUM EFFICIENCY USE AT LEAST PAR= 5
21 OBSERVATIONS
GROUP COUNTS
GROUP 1 2 3 4 5 6
COUNT 0. 0. 15. 3. 2. 1.
HISTOGRAM - KYP
PCT. N
0.762 16 I
0.714 15 I XXXXXXXXXX
0.667 14 I XXXXXXXXXX
0.619 13 I XXXXXXXXXX
0.571 12 I XXXXXXXXXX
0.524 11 I XXXXXXXXXX
0.476 10 I XXXXXXXXXX
0.429 9 I XXXXXXXXXX
0.381 8 I XXXXXXXXXX
0.333 7 I XXXXXXXXXX
0.286 6 I XXXXXXXXXX
0.238 5 I XXXXXXXXXX
0.190 4 I XXXXXXXXXX
0.143 3 I XXXXXXXXXXXXXXXXXXXX
0.095 2 I XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
0.048 1 I XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
I------I------I------I------I------I------I
-0.388E+05-0.219E+05-0.494E+04 0.120E+05 0.290E+05 0.459E+05 0.628E+05
GROUP COUNTS
GROUP 1 2 3 4 5 6
COUNT 0. 0. 15. 4. 1. 1.
HISTOGRAM - KYR
PCT. N
0.762 16 I
0.714 15 I XXXXXXXXXX
0.667 14 I XXXXXXXXXX
0.619 13 I XXXXXXXXXX
0.571 12 I XXXXXXXXXX
0.524 11 I XXXXXXXXXX
0.476 10 I XXXXXXXXXX
0.429 9 I XXXXXXXXXX
0.381 8 I XXXXXXXXXX
0.333 7 I XXXXXXXXXX
0.286 6 I XXXXXXXXXX
0.238 5 I XXXXXXXXXX
0.190 4 I XXXXXXXXXXXXXXXXXXXX
0.143 3 I XXXXXXXXXXXXXXXXXXXX
0.095 2 I XXXXXXXXXXXXXXXXXXXX
0.048 1 I XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
I------I------I------I------I------I------I
-0.188E+06-0.110E+06-0.319E+05 0.463E+05 0.125E+06 0.203E+06 0.281E+06
GROUP COUNTS
GROUP 1 2 3 4 5 6
COUNT 0. 3. 9. 6. 2. 1.
HISTOGRAM - SYP
PCT. N
0.476 10 I
0.429 9 I XXXXXXXXXX
0.429 9 I XXXXXXXXXX
0.381 8 I XXXXXXXXXX
0.381 8 I XXXXXXXXXX
0.333 7 I XXXXXXXXXX
0.333 7 I XXXXXXXXXX
0.286 6 I XXXXXXXXXXXXXXXXXXXX
0.286 6 I XXXXXXXXXXXXXXXXXXXX
0.238 5 I XXXXXXXXXXXXXXXXXXXX
0.238 5 I XXXXXXXXXXXXXXXXXXXX
0.190 4 I XXXXXXXXXXXXXXXXXXXX
0.190 4 I XXXXXXXXXXXXXXXXXXXX
0.143 3 I XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
0.143 3 I XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
0.095 2 I XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
0.095 2 I XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
0.048 1 I XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
0.048 1 I XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
I------I------I------I------I------I------I
-0.577E+04-0.251E+04 753. 0.402E+04 0.728E+04 0.105E+05 0.138E+05
GROUP COUNTS
GROUP 1 2 3 4 5 6
COUNT 0. 3. 9. 6. 2. 1.
HISTOGRAM - SYR
PCT. N
0.429 9 I XXXXXXXXXX
0.429 9 I XXXXXXXXXX
0.381 8 I XXXXXXXXXX
0.381 8 I XXXXXXXXXX
0.333 7 I XXXXXXXXXX
0.333 7 I XXXXXXXXXX
0.286 6 I XXXXXXXXXXXXXXXXXXXX
0.286 6 I XXXXXXXXXXXXXXXXXXXX
0.238 5 I XXXXXXXXXXXXXXXXXXXX
0.238 5 I XXXXXXXXXXXXXXXXXXXX
0.190 4 I XXXXXXXXXXXXXXXXXXXX
0.190 4 I XXXXXXXXXXXXXXXXXXXX
0.143 3 I XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
0.143 3 I XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
0.095 2 I XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
0.095 2 I XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
0.048 1 I XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
0.048 1 I XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX
I------I------I------I------I------I------I
-0.106E+06-0.421E+05 0.216E+05 0.853E+05 0.149E+06 0.213E+06 0.276E+06
(NB: J'ai un peu raboté les histogrammes avec le traitement de texte de manière à ce qu'ils n'occupent pas une demi-page chacun ; ensuite, je les ai fait passer dans une police de caractères plus petits.) La leçon principale à tirer de ces graphiques est qu'à Saint-Louis, la distribution est plus regroupée autour du mode tandis qu'à Kayar, le mode est la catégorie tout à droite de la distribution. Qu'est-ce que cela veut dire? Primo, nous avons une confirmation du fait qu'à Kayar, la saison de pointe est courte et cruciale. A Saint-Louis, il y a une catégorie importante de recettes élevées hors de la période de pointe.
Pour interpréter l'axe des abscisses, n'oubliez pas la petite échelle de conversion utilisée pour interpréter les recettes. Un petit point de repère : sauf erreur dans mes calculs mentaux, la deuxième catégorie la plus fréquente de recette en sardinelles rondes à Saint-Louis se situe entre 50 000 et 90 000 francs belges par ménage.
|_genr lkpr = log(1+kpr)
|_genr lkqr = log(1+kqr)
|_genr lkpp = log(1+kpp)
|_genr lspp = log(1+spp)
|_genr lsqr = log(1+sqr)
|_genr lspr = log(1+spr)
Un petit truc : quand certaines variables prennent la valeur 0, il est impossible d'en calculer le logarithme, sauf si on y ajoute un petit nombre positif (ici, j'ai ajouté 1 aux prix et aux quantités). Le moment crucial de l'étude de marché est arrivé. Quelle est la valeur des élasticités de demande ? Un petit graphique en nuage de points peut nous renseigner.
|_plot lkpr lkqr
REQUIRED MEMORY IS PAR= 5 CURRENT PAR= 500
FOR MAXIMUM EFFICIENCY USE AT LEAST PAR= 6
21 OBSERVATIONS
*=LKPR
M=MULTIPLE POINT
4.8000 |
4.6737 |
4.5474 | *
4.4211 | *
4.2947 | *
4.1684 |
4.0421 | *
3.9158 |
3.7895 | * **
3.6632 | * * * * * * *
3.5368 | * *
3.4105 | * *
3.2842 |
3.1579 | *
3.0316 | *
2.9053 |
2.7789 |
2.6526 | *
2.5263 |
2.4000 |
______
0.000 3.000 6.000 9.000 12.000
LKQR
Gloups ! On ne voit pas grand'chose qui ressemble à une demande, sur ce graphique. Pas de panique… La quantité demandée ne dépend pas seulement du prix du bien, mais aussi du prix des biens substituts. Il est clair que les commerçants qui achètent à Kayar connaissent les prix à Saint-Louis et changent de marché si les coûts de transport sont inférieurs à la différence de prix. De même, la sardinelle plate fait concurrence à la sardinelle ronde. Il faut donc estimer une équation complète de demande ! Personnellement, je préfère estimer des demandes inverses ( p =f(q,p*) ) ; c'est plus lisible !
|_ols lkpr lkqr lkpp lspr /rstat anova gf pcor
REQUIRED MEMORY IS PAR= 7 CURRENT PAR= 500
OLS ESTIMATION
21 OBSERVATIONS DEPENDENT VARIABLE = LKPR
...NOTE..SAMPLE RANGE SET TO: 10, 30
R-SQUARE = 0.3748 R-SQUARE ADJUSTED = 0.2645
VARIANCE OF THE ESTIMATE-SIGMA**2 = 0.14183
STANDARD ERROR OF THE ESTIMATE-SIGMA = 0.37660
SUM OF SQUARED ERRORS-SSE= 2.4111
MEAN OF DEPENDENT VARIABLE = 3.7421
LOG OF THE LIKELIHOOD FUNCTION = -7.07113
Pas génial, le R²… Etant donné que les prix dépendent aussi de paramètres saisonniers pour lesquels nous n'avons pas d'information (consommation de poissons lors de certaines fêtes,…), on peut quand même s'estimer satisfait.
MODEL SELECTION TESTS - SEE JUDGE ET AL. (1985,P.242)
AKAIKE (1969) FINAL PREDICTION ERROR - FPE = 0.16885
(FPE IS ALSO KNOWN AS AMEMIYA PREDICTION CRITERION - PC)
AKAIKE (1973) INFORMATION CRITERION - LOG AIC = -1.7835
SCHWARZ (1978) CRITERION - LOG SC = -1.5845
MODEL SELECTION TESTS - SEE RAMANATHAN (1992,P.167)
CRAVEN-WAHBA (1979)
GENERALIZED CROSS VALIDATION - GCV = 0.17520
HANNAN AND QUINN (1979) CRITERION = 0.17547
RICE (1984) CRITERION = 0.18547
SHIBATA (1981) CRITERION = 0.15855
SCHWARZ (1978) CRITERION - SC = 0.20504
AKAIKE (1974) INFORMATION CRITERION - AIC = 0.16805
ANALYSIS OF VARIANCE - FROM MEAN
SS DF MS F
REGRESSION 1.4454 3. 0.48181 3.397
ERROR 2.4111 17. 0.14183 P-VALUE
TOTAL 3.8565 20. 0.19283 0.042
ANALYSIS OF VARIANCE - FROM ZERO
SS DF MS F
REGRESSION 295.51 4. 73.877 520.888
ERROR 2.4111 17. 0.14183 P-VALUE
TOTAL 297.92 21. 14.187 0.000
VARIABLE ESTIMATED STANDARD T-RATIO PARTIAL STANDARDIZED ELASTICITY
NAME COEFFICIENT ERROR 17 DF P-VALUE CORR. COEFFICIENT AT MEANS
LKQR -0.29155E-01 0.4414E-01 -0.6606 0.518-0.158 -0.1343 -0.0429
LKPP 0.36371 0.1277 2.848 0.011 0.568 0.5625 0.3372
LSPR 0.47608 0.3673 1.296 0.212 0.300 0.2571 0.5065
CONSTANT 0.74543 1.461 0.5102 0.617 0.123 0.0000 0.1992
L'influence des quantités sur les prix est négative, mais on ne peut pas rejeter l'hypothèse selon laquelle elle serait nulle. En tout cas, on peut rejeter l'hypothèse selon laquelle elle serait inférieure à –1, seuil à partir duquel l'offreur peut augmenter sa recette en diminuant sa prise. Les pêcheurs n'ont donc pas intérêt à réduire leurs prises pour essayer de vendre plus cher, car ils ne vendraient en fait pas plus cher ! Le déterminant principal des prix semble être la concurrence avec la sardinelle plate ; on ne peut rejeter l'hypothèse d'une concurrence inexistante avec Saint-Louis.
CORRELATION MATRIX OF COEFFICIENTS
LKQR 1.0000
LKPP -0.21975 1.0000
LSPR -0.23944 -0.37189E-01 1.0000
CONSTANT 0.13985 -0.22942 -0.94973 1.0000
LKQR LKPP LSPR CONSTANT
La colinéarité entre régresseurs est faible (max. 24%) comparée à la régression de base (R²=38%).
DURBIN-WATSON = 1.4599 VON NEUMANN RATIO = 1.5329 RHO = 0.25440
RESIDUAL SUM = 0.48850E-14 RESIDUAL VARIANCE = 0.14183
SUM OF ABSOLUTE ERRORS= 5.6194
R-SQUARE BETWEEN OBSERVED AND PREDICTED = 0.3748
RUNS TEST: 8 RUNS, 12 POS, 0 ZERO, 9 NEG NORMAL STATISTIC = -1.5036
COEFFICIENT OF SKEWNESS = -0.4134 WITH STANDARD DEVIATION OF 0.5012