Cours d'économétrie
Commentaires Composés : Cours d'économétrie. Rechercher de 53 000+ Dissertation Gratuites et Mémoirespas poser de problèmes particuliers. Mais comme la grande majorité des étudiants (j'imagine), j'avais surtout étudié dans l'optique de restituer, pour préparer les examens quoi (un peu pour la programmer aussi, d'où le logiciel REGRESS qui a près de 20 ans aujourd'hui, et qui est toujours en ligne
http://eric.univ-lyon2.fr/~ricco/regress.html même si, honnêtement, il doit y avoir très peu
d'utilisateurs je pense). Ici, l'aaire est autrement plus corsée. Il s'agit d'expliquer à d'autres personnes. La diérence est énorme. C'est donc non sans inquiétude que j'ai sorti mes anciennes notes de cours (entres autres les fameux polycopiés de Patrick Sylvestre-Baron de la Faculté de Sciences Économiques de l'Université Lyon 2) et que j'ai fait l'acquisition de plusieurs ouvrages qui allaient me servir de base de préparation.
1. La courbe bleue tracée à une allure d'escargot au milieu des points verts (on n'avait droit qu'à 16 couleurs en mode graphique), c'était jouissif !
Page: 3 job: econometrie_regression macro: svmono.cls date/time: 7-Jun-2011/18:10
4
Avant-propos
Je me suis rendu compte que la régression linéaire est toujours aussi passionnante. Plus même, les années post DEA passées à étudier les techniques de Data Mining, en particulier l'apprentissage supervisé, m'ont apporté un recul que je n'avais pas (quelques années en plus, il faut bien que ça serve à quelque chose aussi). Tout de suite, j'ai pu raccrocher ce que je lisais à ce que je savais par ailleurs. Quand même, ils avaient vraiment découvert beaucoup de choses ces économètres. Par exemple, pouvoir calculer une erreur de prédiction en leave-one-out sans avoir à construire explicitement le modèle sur les (n − 1) observations grâce au concept de
levier est tout bonnement fabuleux. En retour, j'ai mieux compris certains aspects
de l'apprentissage supervisé en étudiant les techniques économétriques. Bref c'est tout bonus. Ce travail m'a d'ailleurs permis par la suite de monter mon cours de régression logistique, et de rédiger le support associé [14]. Reste une question. A quoi peut bien servir un polycopié supplémentaire sur la régression linéaire simple et multiple. En eet, ils sont légions sur internet (tapez "économétrie" dans Google pour voir). S'il s'agit de reproduire ce qui est déjà (très bien) écrit par ailleurs, on ne voit pas vraiment où est l'intérêt. La première raison est mon cours de licence. Au l des années, le nombre d'heures dont je dispose pour le faire a été réduit comme une peau de chagrin. Ce qui ne manque pas de me chagriner d'ailleurs (ok, ok, elle est facile celle-là). Comme je ne souhaite absolument pas diminuer le nombre des séances TD sur machine, je suis obligé de rogner sur les CM. De fait, il ne m'est plus possible de détailler certaines démonstrations au tableau comme je pouvais le faire naguère. De même, en utilisant de plus en plus des slides pour le cours, je fais des ellipses à de nombreux endroits. Je me suis dit que la seule manière de donner des repères identiques à tous les étudiants est de leur épargner la prise de notes en fournissant le cours rédigé. En cela, mon cours d'économétrie se rapproche de plus en plus de mon cours de Data Mining où je parle de beaucoup de choses en très peu de temps en me focalisation sur les aspects opérationnels (en cours tout du moins), mais en donnant accès aux étudiants à une abondante documentation gratuite. La seconde raison est que cela me permet tout simplement de présenter les choses à ma manière, en donnant la part belle aux exemples traités sur tableur . Ce qui est une de mes principales marques de fabrique. Parfois, je ferais le parallèle avec les résultats fournis par les logiciels de statistique, en privilégiant toujours les outils libres (Tanagra, Regress et R principalement) ! . Ainsi, le lecteur pourra refaire tous les calculs décrits dans ce document. A cet eet, les chiers de données qui ont servi à sa préparation sont également accessibles en ligne. Ils sont énumérés en annexes. Bien évidemment, selon l'expression consacrée, ce support n'engage que son auteur. Toutes suggestions ou commentaires qui peuvent en améliorer le contenu sont bienvenus.
2. Excel, mais sous Open Oce les traitements sont identiques. 3. Parfois je m'autoriserai des digressions sur des outils un peu moins gratuits, mais ayant pignon sur rue (SAS, SPAD, SPSS et STATISTICA pour ne pas les nommer). Parce que certains d'entre vous les rencontreront en entreprise. Je ne suis pas sectaire non plus.
Page: 4 job: econometrie_regression macro: svmono.cls date/time: 7-Jun-2011/18:10
Table des matières
Partie I Régression Linéaire Simple 1 Modèle de régression linéaire simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
1.1 Modèle et hypothèses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.1 Régression linéaire simple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.1.2 Hypothèses . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2 Principe de l'ajustement des moindres carrés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.1 Estimateur des moindres carrés ordinaires (MCO) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.2 Calculs pour les données "Rendements agricoles" . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.2.3 Quelques remarques . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3 Décomposition de la variance et coecient de détermination . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.1 Décomposition de la variance - Équation d'analyse de variance . . . . . . . . . . . . . . . . . 1.3.2 Coecient de détermination . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.3 Coecient de corrélation linéaire multiple . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1.3.4 L'exemple des rendements agricoles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3 3 5 5 5 7 8 9 9 11 12 13 15 15 17 17 18 19 19 20 21 21 21 23 24
2
Propriétés des estimateurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.1 Biais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Variance - Convergence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.1 Variance de la pente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.2 Convergence de la pente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.3 Variance et convergence de la constante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2.2.4 Quelques remarques sur la précision des estimateurs . . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Théorème de Gauss-Markov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3
Inférence statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1 Évaluation globale de la régression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.1.1 Tableau d'analyse de Variance - Test de signicativité globale . . . . . . . . . . . . . . . . . . 3.1.2 Exemple : les rendements agricoles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2 Distribution des coecients estimés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Page: 5
job: econometrie_regression
macro: svmono.cls
date/time: 7-Jun-2011/18:10
6
Table des matières
3.2.1 Distribution de a et ˆ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ˆ b 3.2.2 Estimation de la variance de l'erreur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.3 Distribution des coecients dans la pratique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3 Étude de la pente de la droite de régression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.1 Test de signicativité de la pente . . . . . . . . . . . . . . . . . . . . . . . . . .
...