Deuxième Maîtrise, cours de Méthodes de l’Investigation Economique

CORRIGE SOMMAIRE N°1

Etude de marché des sardinelles (Thiès- Nord)

|_read(econo\Sardkay.txt) kpr kpp spr spp kqr kqp sqr sqp
UNIT 88 IS NOW ASSIGNED TO: econo\Sardkay.txt
...SAMPLE RANGE IS NOW SET TO: 1 30

|_sample 10 30

|_stat kpr kpp spr spp kqr kqp sqr sqp /pmedian

NAME N MEAN ST. DEV VARIANCE MINIMUM MAXIMUM

KPR 21 46.137 20.488 419.76 14.900 100.00

KPP 21 39.610 25.949 673.38 9.5000 100.00

SPR 21 54.993 12.755 162.69 30.140 85.850

SPP 21 36.959 24.903 620.17 12.500 117.67

KQR 21 883.35 1179.0 0.13900E+07 2.1000 3980.9

KQP 21 263.23 281.33 79145. 2.0000 876.80

SQR 21 1540.3 1049.7 0.11019E+07 0.00000 3260.0

SQP 21 129.42 106.18 11274. 0.20000 410.60

VARIABLE = KPR
MEDIAN = 42.740
LOWER 25%= 34.260 UPPER 25%= 50.000 INTERQUARTILE RANGE= 15.74
MODE = 42.740 WITH 5 OBSERVATIONS
VARIABLE = KPP
MEDIAN = 30.600
LOWER 25%= 18.900 UPPER 25%= 59.650 INTERQUARTILE RANGE= 40.75

MODE NOT APPLICABLE

VARIABLE = SPR

MEDIAN = 55.700

LOWER 25%= 45.470 UPPER 25%= 60.985 INTERQUARTILE RANGE= 15.52

MODE NOT APPLICABLE

VARIABLE = SPP

MEDIAN = 27.570

LOWER 25%= 20.055 UPPER 25%= 46.595 INTERQUARTILE RANGE= 26.54

MODE NOT APPLICABLE

VARIABLE = KQR

MEDIAN = 299.50

LOWER 25%= 39.500 UPPER 25%= 1372.8 INTERQUARTILE RANGE= 1333.

MODE NOT APPLICABLE

VARIABLE = KQP

MEDIAN = 163.70

LOWER 25%= 61.450 UPPER 25%= 468.95 INTERQUARTILE RANGE= 407.5

MODE NOT APPLICABLE

VARIABLE = SQR

MEDIAN = 1288.7

LOWER 25%= 628.60 UPPER 25%= 2527.9 INTERQUARTILE RANGE= 1899.

MODE NOT APPLICABLE

VARIABLE = SQP

MEDIAN = 100.00

LOWER 25%= 41.400 UPPER 25%= 170.35 INTERQUARTILE RANGE= 128.9

MODE NOT APPLICABLE

Que conclure de cette première description des données ? D'une part, la sardinelle plate est d'importance négligeable par rapport à la sardinelle ronde (quantités très inférieures, prix inférieurs). D'autre part, Saint-Louis est un plus gros marché (deux fois plus de sardinelles rondes) que Kayar en moyenne sur une année, mais pas en saison de pointe (maxima de tailles comparables : 3300 et 4000 tonnes, respectivement). La sardinelle ronde est chère toute l'année à Saint-Louis (moyenne de prix plus élevée, variance plus faible) par rapport à Kayar. A part cette exception, les prix sont très volatiles (écart-type = 50% de la moyenne). Un troisième fait remarquable est la présence de mortes saisons, où la prise est quasiment nulle (minima des quantités proches de 0).

|_stat kqr kqp sqr sqp /pcor prankcor
NAME N MEAN ST. DEV VARIANCE MINIMUM MAXIMUM

KQR 21 883.35 1179.0 0.13900E+07 2.1000 3980.9

KQP 21 263.23 281.33 79145. 2.0000 876.80

SQR 21 1540.3 1049.7 0.11019E+07 0.00000 3260.0

SQP 21 129.42 106.18 11274. 0.20000 410.60

CORRELATION MATRIX OF VARIABLES - 21 OBSERVATIONS

KQR 1.0000

KQP 0.42023 1.0000

SQR 0.34252 0.10627 1.0000

SQP 0.32950 0.56442E-01 0.16202E-01 1.0000

KQR KQP SQR SQP

SPEARMAN RANK CORRELATION MATRIX - 21 OBSERVATIONS
KQR 1.0000
KQP 0.63766 1.0000
SQR 0.59740 0.10000 1.0000
SQP 0.28312 0.28571E-01 -0.72727E-01 1.0000

KQR KQP SQR SQP

On pourrait croire que les corrélations entre quantités débarquées sont étonnamment basses. Les prises de sardinelles rondes à Kayar sont corrélées à 30%-40% avec les autres prises, et c'est tout ! Il ne faut cependant pas oublier que la sardinelle plate représente une part négligeable du marché. Cela signifie que le seul coefficient vraiment important est la corrélation de 34% entre les prises de sardinelles rondes à Kayar et à Saint-Louis. Les pêcheurs peuvent donc diversifier leurs activités en migrant temporairement entre Kayar et Saint-Louis, mais cela ne leur procure qu'une forme d'assurance imparfaite car les prises sont positivement corrélées. Pour les familles où une seule personne est pêcheur, cette assurance est particulièrement inappropriée : la corrélation des rangs est très élevée, ce qui semble indiquer que les saisons de pointe (rangs élevés) et les saisons mortes (derniers rangs) sont en fait les mêmes à Kayar et à Saint-Louis.

|_genr kyr = kpr*kqr
|_genr syr = spr*sqr
|_genr kyp = kpp*kqp
|_genr syp = spp*sqp
|_stat kyp kyr syp syr /pmedian
NAME N MEAN ST. DEV VARIANCE MINIMUM MAXIMUM
KYP 21 12005. 16946. 0.28718E+09 99.000 62253.

KYR 21 46337. 78251. 0.61232E+10 105.00 0.33463E+06

SYP 21 4016.1 3263.5 0.10650E+08 8.6000 10578.

SYR 21 85257. 63665. 0.40532E+10 0.00000 0.25170E+06

VARIABLE = KYP

MEDIAN = 3237.5

LOWER 25%= 1269.9 UPPER 25%= 20920. INTERQUARTILE RANGE= 0.1965E+05

MODE NOT APPLICABLE

VARIABLE = KYR

MEDIAN = 9184.8

LOWER 25%= 2433.4 UPPER 25%= 57075. INTERQUARTILE RANGE= 0.5464E+05

MODE NOT APPLICABLE

VARIABLE = SYP

MEDIAN = 3243.5

LOWER 25%= 1608.8 UPPER 25%= 6161.9 INTERQUARTILE RANGE= 4553.

MODE NOT APPLICABLE

VARIABLE = SYR

MEDIAN = 72556.

LOWER 25%= 37772. UPPER 25%= 0.13282E+06 INTERQUARTILE RANGE= 0.9505E+05

MODE NOT APPLICABLE

Remarquez les statistiques sur la recette totale en sardinelles rondes à Kayar : la médiane est le cinquième de la moyenne et l'écart-type est le double de la moyenne ! Cela montre qu'à Kayar, la saison de pointe est très courte et représente une part cruciale de la recette annuelle. D'ailleurs, les statistiques descriptives sur les recettes montrent des écarts-types très élevés par rapport aux moyennes. Un coup d'œil sur les histogrammes des recettes devrait encore préciser notre idée sur la variabilité de l'activité.

Pour avoir une idée de la grandeur des recettes, il faut se souvenir que les prix étaient libellés en francs CFA par pièce, les quantités en tonnes et qu'une sardinelle pèse environ 50g (soit 20 par kg ou encore 20 000 par tonne). Il faut donc multiplier les moyennes par 20 000 pour obtenir une recette mensuelle en francs CFA (100 franc CFA = 1 franc français = 6 francs belges). Sachant qu'environ 4000 ménages vivent de la pêche à Kayar et un peu plus à Saint-Louis et qu'environ la moitié des pêcheurs partent en haute mer pour pêcher la dorade (entre autres), vous pouvez arriver facilement à une idée de la recette mensuelle par ménage dans l'activité de pêche de sardinelle.


|_plot kyp kyr syp syr /histo
REQUIRED MEMORY IS PAR= 4 CURRENT PAR= 500
FOR MAXIMUM EFFICIENCY USE AT LEAST PAR= 5
21 OBSERVATIONS
GROUP COUNTS
GROUP 1 2 3 4 5 6
COUNT 0. 0. 15. 3. 2. 1.

HISTOGRAM - KYP

PCT. N

0.762 16 I
0.714 15 I XXXXXXXXXX
0.667 14 I XXXXXXXXXX
0.619 13 I XXXXXXXXXX
0.571 12 I XXXXXXXXXX

0.524 11 I XXXXXXXXXX

0.476 10 I XXXXXXXXXX

0.429 9 I XXXXXXXXXX

0.381 8 I XXXXXXXXXX

0.333 7 I XXXXXXXXXX

0.286 6 I XXXXXXXXXX

0.238 5 I XXXXXXXXXX

0.190 4 I XXXXXXXXXX

0.143 3 I XXXXXXXXXXXXXXXXXXXX

0.095 2 I XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

0.048 1 I XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

I------I------I------I------I------I------I

-0.388E+05-0.219E+05-0.494E+04 0.120E+05 0.290E+05 0.459E+05 0.628E+05

GROUP COUNTS

GROUP 1 2 3 4 5 6

COUNT 0. 0. 15. 4. 1. 1.

HISTOGRAM - KYR

PCT. N

0.762 16 I
0.714 15 I XXXXXXXXXX
0.667 14 I XXXXXXXXXX
0.619 13 I XXXXXXXXXX

0.571 12 I XXXXXXXXXX

0.524 11 I XXXXXXXXXX

0.476 10 I XXXXXXXXXX

0.429 9 I XXXXXXXXXX

0.381 8 I XXXXXXXXXX

0.333 7 I XXXXXXXXXX

0.286 6 I XXXXXXXXXX

0.238 5 I XXXXXXXXXX

0.190 4 I XXXXXXXXXXXXXXXXXXXX

0.143 3 I XXXXXXXXXXXXXXXXXXXX

0.095 2 I XXXXXXXXXXXXXXXXXXXX

0.048 1 I XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

I------I------I------I------I------I------I

-0.188E+06-0.110E+06-0.319E+05 0.463E+05 0.125E+06 0.203E+06 0.281E+06

GROUP COUNTS

GROUP 1 2 3 4 5 6

COUNT 0. 3. 9. 6. 2. 1.

HISTOGRAM - SYP

PCT. N

0.476 10 I

0.429 9 I XXXXXXXXXX

0.429 9 I XXXXXXXXXX

0.381 8 I XXXXXXXXXX

0.381 8 I XXXXXXXXXX

0.333 7 I XXXXXXXXXX

0.333 7 I XXXXXXXXXX

0.286 6 I XXXXXXXXXXXXXXXXXXXX

0.286 6 I XXXXXXXXXXXXXXXXXXXX

0.238 5 I XXXXXXXXXXXXXXXXXXXX

0.238 5 I XXXXXXXXXXXXXXXXXXXX

0.190 4 I XXXXXXXXXXXXXXXXXXXX

0.190 4 I XXXXXXXXXXXXXXXXXXXX

0.143 3 I XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

0.143 3 I XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

0.095 2 I XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

0.095 2 I XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

0.048 1 I XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

0.048 1 I XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

I------I------I------I------I------I------I

-0.577E+04-0.251E+04 753. 0.402E+04 0.728E+04 0.105E+05 0.138E+05

GROUP COUNTS

GROUP 1 2 3 4 5 6

COUNT 0. 3. 9. 6. 2. 1.

HISTOGRAM - SYR

PCT. N

0.429 9 I XXXXXXXXXX

0.429 9 I XXXXXXXXXX

0.381 8 I XXXXXXXXXX

0.381 8 I XXXXXXXXXX

0.333 7 I XXXXXXXXXX

0.333 7 I XXXXXXXXXX

0.286 6 I XXXXXXXXXXXXXXXXXXXX

0.286 6 I XXXXXXXXXXXXXXXXXXXX

0.238 5 I XXXXXXXXXXXXXXXXXXXX

0.238 5 I XXXXXXXXXXXXXXXXXXXX

0.190 4 I XXXXXXXXXXXXXXXXXXXX

0.190 4 I XXXXXXXXXXXXXXXXXXXX

0.143 3 I XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

0.143 3 I XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

0.095 2 I XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

0.095 2 I XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

0.048 1 I XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

0.048 1 I XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

I------I------I------I------I------I------I

-0.106E+06-0.421E+05 0.216E+05 0.853E+05 0.149E+06 0.213E+06 0.276E+06

(NB: J'ai un peu raboté les histogrammes avec le traitement de texte de manière à ce qu'ils n'occupent pas une demi-page chacun ; ensuite, je les ai fait passer dans une police de caractères plus petits.) La leçon principale à tirer de ces graphiques est qu'à Saint-Louis, la distribution est plus regroupée autour du mode tandis qu'à Kayar, le mode est la catégorie tout à droite de la distribution. Qu'est-ce que cela veut dire? Primo, nous avons une confirmation du fait qu'à Kayar, la saison de pointe est courte et cruciale. A Saint-Louis, il y a une catégorie importante de recettes élevées hors de la période de pointe.

Pour interpréter l'axe des abscisses, n'oubliez pas la petite échelle de conversion utilisée pour interpréter les recettes. Un petit point de repère : sauf erreur dans mes calculs mentaux, la deuxième catégorie la plus fréquente de recette en sardinelles rondes à Saint-Louis se situe entre 50 000 et 90 000 francs belges par ménage.

|_genr lkpr = log(1+kpr)
|_genr lkqr = log(1+kqr)
|_genr lkpp = log(1+kpp)
|_genr lspp = log(1+spp)
|_genr lsqr = log(1+sqr)
|_genr lspr = log(1+spr)

Un petit truc : quand certaines variables prennent la valeur 0, il est impossible d'en calculer le logarithme, sauf si on y ajoute un petit nombre positif (ici, j'ai ajouté 1 aux prix et aux quantités). Le moment crucial de l'étude de marché est arrivé. Quelle est la valeur des élasticités de demande ? Un petit graphique en nuage de points peut nous renseigner.

|_plot lkpr lkqr

REQUIRED MEMORY IS PAR= 5 CURRENT PAR= 500

FOR MAXIMUM EFFICIENCY USE AT LEAST PAR= 6

21 OBSERVATIONS

*=LKPR

M=MULTIPLE POINT

4.8000 |

4.6737 |

4.5474 | *

4.4211 | *

4.2947 | *

4.1684 |

4.0421 | *

3.9158 |

3.7895 | * **

3.6632 | * * * * * * *

3.5368 | * *

3.4105 | * *

3.2842 |

3.1579 | *

3.0316 | *

2.9053 |

2.7789 |

2.6526 | *

2.5263 |

2.4000 |

______

0.000 3.000 6.000 9.000 12.000

LKQR

Gloups ! On ne voit pas grand'chose qui ressemble à une demande, sur ce graphique. Pas de panique… La quantité demandée ne dépend pas seulement du prix du bien, mais aussi du prix des biens substituts. Il est clair que les commerçants qui achètent à Kayar connaissent les prix à Saint-Louis et changent de marché si les coûts de transport sont inférieurs à la différence de prix. De même, la sardinelle plate fait concurrence à la sardinelle ronde. Il faut donc estimer une équation complète de demande ! Personnellement, je préfère estimer des demandes inverses ( p =f(q,p*) ) ; c'est plus lisible !


|_ols lkpr lkqr lkpp lspr /rstat anova gf pcor
REQUIRED MEMORY IS PAR= 7 CURRENT PAR= 500

OLS ESTIMATION

21 OBSERVATIONS DEPENDENT VARIABLE = LKPR

...NOTE..SAMPLE RANGE SET TO: 10, 30

R-SQUARE = 0.3748 R-SQUARE ADJUSTED = 0.2645

VARIANCE OF THE ESTIMATE-SIGMA**2 = 0.14183

STANDARD ERROR OF THE ESTIMATE-SIGMA = 0.37660

SUM OF SQUARED ERRORS-SSE= 2.4111

MEAN OF DEPENDENT VARIABLE = 3.7421

LOG OF THE LIKELIHOOD FUNCTION = -7.07113

Pas génial, le R²… Etant donné que les prix dépendent aussi de paramètres saisonniers pour lesquels nous n'avons pas d'information (consommation de poissons lors de certaines fêtes,…), on peut quand même s'estimer satisfait.


MODEL SELECTION TESTS - SEE JUDGE ET AL. (1985,P.242)
AKAIKE (1969) FINAL PREDICTION ERROR - FPE = 0.16885
(FPE IS ALSO KNOWN AS AMEMIYA PREDICTION CRITERION - PC)

AKAIKE (1973) INFORMATION CRITERION - LOG AIC = -1.7835

SCHWARZ (1978) CRITERION - LOG SC = -1.5845

MODEL SELECTION TESTS - SEE RAMANATHAN (1992,P.167)

CRAVEN-WAHBA (1979)

GENERALIZED CROSS VALIDATION - GCV = 0.17520

HANNAN AND QUINN (1979) CRITERION = 0.17547

RICE (1984) CRITERION = 0.18547

SHIBATA (1981) CRITERION = 0.15855

SCHWARZ (1978) CRITERION - SC = 0.20504

AKAIKE (1974) INFORMATION CRITERION - AIC = 0.16805

ANALYSIS OF VARIANCE - FROM MEAN

SS DF MS F

REGRESSION 1.4454 3. 0.48181 3.397

ERROR 2.4111 17. 0.14183 P-VALUE

TOTAL 3.8565 20. 0.19283 0.042

ANALYSIS OF VARIANCE - FROM ZERO

SS DF MS F

REGRESSION 295.51 4. 73.877 520.888

ERROR 2.4111 17. 0.14183 P-VALUE

TOTAL 297.92 21. 14.187 0.000

VARIABLE ESTIMATED STANDARD T-RATIO PARTIAL STANDARDIZED ELASTICITY

NAME COEFFICIENT ERROR 17 DF P-VALUE CORR. COEFFICIENT AT MEANS

LKQR -0.29155E-01 0.4414E-01 -0.6606 0.518-0.158 -0.1343 -0.0429

LKPP 0.36371 0.1277 2.848 0.011 0.568 0.5625 0.3372

LSPR 0.47608 0.3673 1.296 0.212 0.300 0.2571 0.5065

CONSTANT 0.74543 1.461 0.5102 0.617 0.123 0.0000 0.1992

L'influence des quantités sur les prix est négative, mais on ne peut pas rejeter l'hypothèse selon laquelle elle serait nulle. En tout cas, on peut rejeter l'hypothèse selon laquelle elle serait inférieure à –1, seuil à partir duquel l'offreur peut augmenter sa recette en diminuant sa prise. Les pêcheurs n'ont donc pas intérêt à réduire leurs prises pour essayer de vendre plus cher, car ils ne vendraient en fait pas plus cher ! Le déterminant principal des prix semble être la concurrence avec la sardinelle plate ; on ne peut rejeter l'hypothèse d'une concurrence inexistante avec Saint-Louis.


CORRELATION MATRIX OF COEFFICIENTS
LKQR 1.0000
LKPP -0.21975 1.0000
LSPR -0.23944 -0.37189E-01 1.0000
CONSTANT 0.13985 -0.22942 -0.94973 1.0000
LKQR LKPP LSPR CONSTANT

La colinéarité entre régresseurs est faible (max. 24%) comparée à la régression de base (R²=38%).


DURBIN-WATSON = 1.4599 VON NEUMANN RATIO = 1.5329 RHO = 0.25440
RESIDUAL SUM = 0.48850E-14 RESIDUAL VARIANCE = 0.14183

SUM OF ABSOLUTE ERRORS= 5.6194

R-SQUARE BETWEEN OBSERVED AND PREDICTED = 0.3748

RUNS TEST: 8 RUNS, 12 POS, 0 ZERO, 9 NEG NORMAL STATISTIC = -1.5036

COEFFICIENT OF SKEWNESS = -0.4134 WITH STANDARD DEVIATION OF 0.5012