Économétrie : Régression linéaire à partir du modèle de la formation des salariés
Lettre type : Économétrie : Régression linéaire à partir du modèle de la formation des salariés. Rechercher de 53 000+ Dissertation Gratuites et MémoiresPar adrien kalt • 9 Janvier 2022 • Lettre type • 4 380 Mots (18 Pages) • 469 Vues
[pic 1]
L3-S5 ÉCONOMÉTRIE
DEVOIR N°2 : RÉGRÉSSION LINÉAIRE À PARTIR DU MODÈLE DE LA FORMATION DES SALAIRES
KALT Adrien, L3 Économie-Gestion, Groupe 8, parcours Analyse-Économique
SECTION 1 : INTRODUCTION
- OBJECTIF DE L’ÉTUDE
- PRÉSENTATION DU MODÈLE
SECTION 2 : CADRE STATISTIQUE
- DONNÉES UTILISÉES / SOURCE ET STATISTIQUES DESCRIPTIVES
- Données utilisées et sources
- Statistiques descriptives
- RÉSULTATS DES ESTIMATIONS ET COMMENTAIRES
- Première équation : [pic 2]
- Seconde équation : [pic 3]
- Étude des discriminations salariales entres les hommes et les femmes
[pic 4]
- ANOVA des différentes équations
SECTION 3 : CONCLUSION
- CRITIQUES DU MODÈLE ET DE SES POSSIBLES EXTENSIONS
SECTION 4 : ANNEXE
- BIBLIOGRAPHIE
- CODE R
SECTION 1 : INTRODUCTION
- OBJECTIF DE L’ÉTUDE
L’objectif, que nous allons mener tout au long de notre étude, sera d’évaluer si les variables exogènes comme le niveau d’éducation ou d’expérience ont un quelconque effet sur la variable endogène de notre modèle, le salaire. De plus, nous serons donc amenés à en conclure si ces derniers sont des facteurs déterminants dans la formation des salaires ou non. Pour préciser notre analyse, nous utiliserons la régression linéaire pour mesurer l’espérance du revenu d’un agent économique i en fonction des variables explicatives et des paramètres , et qui mesurent l’efficacité marginale des facteurs exogènes. [pic 5][pic 6][pic 7]
- PRÉSENTATION DU MODÈLE
Dans notre étude, nous allons estimer un modèle qui se basera sur des travaux empiriques et qui démontreront que le salaire pourra être obtenu comme le montre les différentes équations suivantes :
= , i=1…, n (1)
[pic 8][pic 9]
où , désignent respectivement le salaire, le niveau d’éducation et l’expérience accumulée. représente les autres facteurs affectant le revenu, est une perturbation aléatoire supposée de moyenne nulle et de variance constante. En supposant d’abord que seuls les rendements de l’éducation peuvent expliquer le salaire, on peut donner une première spécification au modèle (1) : [pic 10][pic 11][pic 12][pic 13]
(2)[pic 14]
où , β 1 représentent le revenu minimum et le taux de rendement de l’éducation. [pic 15]
Mincer (1974) généralise cette spécification en tenant compte de la formation acquise dans l’emploi effectué :
, (3)[pic 16]
où , , et désignent respectivement le revenu minimum, le taux de rendement de l’éducation, le taux de rendement de la formation dans l’emploi et la part du temps de travail consacrée à la formation, qui dans notre modèle sera égale à 1. est l’expérience professionnelle (en nombre d’années). représente le terme d’erreur. [pic 17][pic 18][pic 19][pic 20][pic 21][pic 22]
Par rapport à l’étude des discriminations salariales entre les hommes et les femmes, nous pouvons présenter notre modèle avec des variables indicatrices comme suit :
Si l’on suppose que la population est composée de deux catégories d’individus, catégorie 1 (si les individus en question possèdent la caractéristique) et catégorie 0 (si les individus en question ne possèdent pas la caractéristique). On peut alors écrire l’équation (5) en incorporant une variable indicatrice qui prend la valeur 1 si l’individu est membre de la catégorie et 0 sinon sinon : [pic 23]
(6)[pic 24]
où α1 représente ainsi la différence (constante) entre le logarithme du revenu d’un individu faisant partie de la catégorie 1 et le logarithme du revenu d’un membre de la catégorie 0, toutes choses égales par ailleurs.
La spécification simple des variables indicatrices (appelées également variables muettes) peut être étendue en supposant une différence du revenu selon que l’individu est un homme ou une femme (le taux de rendement de l’éducation et de l’expérience étant identiques) ou encore en tenant compte des effets interactifs entre catégories (0 ou 1) et genres (homme ou femme). Dans notre cas, nous considèrerons que la valeur 1 sera prise quand c’est une femme et 0 lorsque c’est un homme.
SECTION 2 : CADRE STATISTIQUE
- DONNÉES UTILISÉES / SOURCES ET STATISTIQUES DESCRIPTIVES
- Données utilisées
Pour mener à bien notre projet, nous allons utiliser le package « wooldridge » qui se trouve dans le logiciel R. Plus précisément, nous serons amenés à extraire des données de 526 agents économiques dans la base de données « Wage1 » de « Wooldridge ». Nous serons, à ce moment-là, en possession d’une série de données individuelles assujettie à de nombreuses caractéristiques. Cependant, dans notre étude nous nous contenterons au revenu, au niveau d’étude, à l’expérience de l’individu et à la différenciation du genre.
- Statistiques descriptives
Tout au long de notre étude, nous serons amenés à étudier des variables par rapport à leurs caractéristiques qui sont soit quantitatives soit qualitatives. Nous serons donc en moyen d’étudier le salaire, le niveau d’éducation, l’expérience mais aussi en fonction du genre des individus, hommes ou femmes.
En ce qui concerne les variables quantitatives de notre modèle, qui sont le salaire, le niveau d’éducation ainsi que l’expérience accumulée, nous pouvons faire un résumé des variables ainsi que de leurs indicateurs dans le tableau suivant :
Tableau résumé des statistiques descriptives des différentes variables :
VARIABLES / INDICATEURS | MINIMUM | 1ER QUARTILE | ÉCART-TYPE | MÉDIANE | MOYENNE | 3ÈME QUARTILE | MAXIMUM |
SALAIRE | 0.530 | 3.330 | 3.693 | 4.650 | 5.896 | 6.880 | 24.980 |
NIVEAU D’ÉDUCATION | 0.00 | 12.00 | 2.769 | 12.00 | 12.56 | 14.00 | 18.00 |
NIVEAU D’EXPÉRIENCE | 1.00 | 5.00 | 13.572 | 13.50 | 17.02 | 26.00 | 51.00 |
Après avoir éditer le tableau résumé des statistiques descriptives, nous pouvons aussi maintenant éditer les boîtes à moustaches (box plot) qui vont nous aider à visualiser la dispersion des différentes distributions.
[pic 25][pic 26][pic 27]
Nous venons d’éditer les différentes boîtes à moustaches qui nous sont utiles dans l’interprétation du positionnement de chacune des variables quantitatives. En guise d’exemple, nous pouvons prendre la distribution du niveau d’éducation. Nous avons donc la capacité de voir qu’il y a sept valeurs très faibles qui se situent en dehors des quartiles, ce sont des valeurs dîtes atypiques ou aberrantes. De plus, nous pouvons remarquer que plus de 50% des personnes ont un niveau d’éducation supérieure à 12 années d’études.
[pic 28]En ce qui concerne la seule variable qualitative du modèle, le genre, nous n’allons non pas éditer une boîte à moustaches mais plutôt un diagramme en bâton afin de pouvoir visualiser la répartition entre les hommes et les femmes au sein de notre échantillon :
Nous pouvons donc remarquer une proportion d’Hommes plus importante que pour les Femmes : en effet, les Hommes représentent 52% de l’échantillon alors que les Femmes sont seulement représentées à hauteur de 48%.
À présent, pour clore notre partie sur la présentation des statistiques descriptives, nous allons éditer les différents nuages de points pour représenter la corrélation entre le niveau d’éducation et le salaire, le niveau d’expérience et le salaire et le genre femme et le salaire.
...