Le Khi 2
Rapports de Stage : Le Khi 2. Rechercher de 53 000+ Dissertation Gratuites et Mémoireseurs domaines. Puis l'objectif de ce test, qui est de déterminer si les variables étudiées sont indépendantes. Dans la suite de notre écrit nous avons développé le fondement théorique du khi-deux où nous avons essayé d'expliquer pourquoi on dit qu'une variables suit une loi de khi-deux. Pour finir, nous avons réalisé un projet personnel en étudiant les deux variables drogue et VIH, d'après cette étude nous pouvons dire que ces deux variables son indépendantes au seuil de risque de 5%.
1)Historique
PEARSON Karl, anglais, 1857-1936
* Pearson: Mathématicien, physicien, historien, eut Burnside, Cayley et Stockes comme professeurs à l'université de Cambridge. Il fut impressionné par son compatriote Francis Galton (savant), physiologiste, fondateur de l'eugénisme visant à parfaire les caractères génétiques de l'espèce humaine. Il sera l'éditeur de Biometrika, et à l'origine des Annals of Eugenics (1925).
* L'influence de ce dernier, qui fut tuteur de sa thèse (1879), le conduit vers les statistiques et il enseignera à l'Université College de Londres après avoir poursuivi des études en sciences humaines en Allemagne (métaphysique, darwinisme).
* Il fera de très importants travaux sur les distributions statistiques, la corrélation, les problèmes d'estimation sur échantillons pour lesquels il collabora avec Gosset et Fischer (malgré des désaccords). Pearson est souvent considéré comme le fondateur de la statistique moderne. Son fils Egon Sharpe fut également statisticien.
Loi de Pearson, dite loi du 2 , lire « khi 2 » , test du 2 :
*Introduite par Pearson en 1900, cette célèbre loi de probabilités fut en fait préalablement étudiée par l'astronome et géodésien allemand Friedrich Robert Helmert (1843-1917), auteur d'une Théorie mathématique et physique de géodésie supérieure (1880) dans le cadre de la théorie des erreurs.
*(1893) le terme de déviation standard pour signifier ce que l'on appelle aujourd'hui l'écart-type, racine carrée de la variance, laquelle apparaît implicitement chez Gauss et chez Legendre au début du 19è siècle dans la méthode des moindres carrés cherchant à rendre minimum la moyenne des carrés des erreurs (de mesure) : si {x1, x2, x3, ...} désigne une série de valeurs aléatoires de moyenne m = nixi/ni , ni désignant l'effectif de la i-ème valeur observée xi, la variance de cette série est la moyenne des carrés des "écarts par rapport à la moyenne" : ni(xi - m)2/ni = nixi2/ni - m2 : la variance est égale à la moyenne des carrés diminuée du carrée de la moyenne.
2) Contexte et objectif du test:
*Les mathématiques sont une science basé sur le raisonnement, les calculs, la logique et les figures. On y trouve donc plusieurs parties, tel que la géométrie, les probabilités, les statistiques et bien d'autres.
Pour notre sujet nous allons étudier une partie du domaine des statistiques. Dans les statistiques, on y classe deux catégories:
- les statistiques descriptives
- les statistiques mathématiques.
Les statistiques descriptives sont utilisées pour décrire un échantillon à partir de grandeurs telle que la moyenne, l'écart type ainsi que d'autre données. Tandis que les statistiques mathématiques permettent d'étudier les données d'une population grâce aux données d'un échantillon. Le test d'indépendance du khi-deux se place dans les statistiques mathématiques.
Nous avons trouver divers domaines ou le test d'indépendance du khi-deux a été utilisé. Par exemple:
On veux savoir si dans un échantillon de la population de Nuremberg si la couleur des yeux est indépendant ou non de la couleur des cheveux des individus.
On cherche à déterminer dans un échantillon d'une population si la stérilité est indépendante ou non du fait d'être fumeur ou non.
On veut étudier grâce au test d'indépendance du khi-deux sur une population, L’influence des composantes du climat de travail sur l’habilitation des individus.
Le but est de tenter d’évaluer les difficultés aux quelles sont confrontés les médecins généralistes dans leur recherche de remplaçants. Les données recueillies ont été analysées dans Le test statistique : le test bilatéral du Khi-deux à 1 degré de liberté avec un risque α de première espèce de 5%.
On constate que le test est donc utilisé dans un contexte particulier. En effet ce test sera appliqué pour l'étude des caractères d'un échantillon que l'on va pouvoir ramener au niveau de la population. Dans notre entourage il existe divers paramètres qui soulèvent des questions, mais, ces paramètres sont classés. Les divers paramètres sont qualifiés de variables et, il existe des variables qualitatives et des variables quantitatives. Les variables qualitatives contiennent des valeurs qui exprimes la «qualité ». Une variable qualitative peut être nominale ( nom d'un personne, non d'un journal...) ou ordinale ( désigne un rang,une préférence: moyen,peu). Tandis que les variables quantitatives contiennent des valeurs mesurables. Le contexte du test d'indépendance du khi-deux est donc l'étude de deux variables qualitatives dans une même population.
*L'origine de la recherche d'une telle loi est simple;on constate sur les exemples d'utilisation du test, que la question, donc l'objectif du test est toujours le même. On veut pouvoir répondre grâce à des calculs, donc grâce à un raisonnement fondé, scientifique, à une hypothèse d'indépendance. D'où son non test «d'indépendance». Une hypothèse d'indépendance est simplement le fait de déterminer si les deux variables étudiés sont indépendantes l'une de l'autre ou non. L'objectif du test est donc de déterminer grâce à la loi d'indépendance du khi-deux si les deux variables sont indépendantes ou non.
3)Fondements théoriques du test:
Pour la réalisation de l'étude du fondement théorique du test nous allons tout d'abord rappeler le principe ainsi que la méthode de réalisation du khi-deux.
Le test du khi-deux est une comparaison entre :
-les effectifs réels: ceux que l’on observe dans l’enquête
-et les effectifs théoriques : ceux que l’on aurait dû obtenir s’il n’y a aucune relation entre les deux variables
Méthode de réalisation du test.
On réalise tout d'abord une succession de 8 tableaux pour obtenir la valeur du khi-deux des valeurs obtenues que l'on doit analyser.
1)Tableau de contingence des effectifs conjoints et marginaux
Grâce a ce tableau on obtient:
-nij qui sont les effectifs conjoints.
-ni. les effectif marginaux correspondant à la modalité xi de X.
c'est a dire:
nombre de variables yni.=∑ * nijj= 1 |
formule 1:
Calcul des effectif marginaux correspondant a la modalité yi de Y.
n.j etant les effectifs marginaux correspondant a la modalité yi de Y.
nombre de variables xn.j=∑ * nijI=1 |
formule 2:
Calcul des effectifs correspondant a la modalité xi de X.
On obtient alors un tableau ressemblant à cela:
Tableau A: Explications du contenue du tableau des effectifs
2)Tableau de contingence des fréquences et des effectifs marginaux.
Dans ce tableau nous calculons:
fi. qui sont les fréquences marginales correspondant à la modalité xi de X.
nombre des variables yfi.=∑ * fijj=1 |
Formule 3:
Calcul des fréquences marginales correspondant à la modalité xi de X.
f.j qui sont les fréquences marginales correspondant à la modalité yi de Y.
nombre des variables xf.J=∑ * fijj=1 |
Formule 4:
Calcul des fréquences marginales correspondant à la modalité yi de Y.
3)Tableau des profils lignes
4)Tableau des profils colonnes
5)Tableau de contingence théoriques des effectifs conjoints et marginaux sous hypothèse d'indépendance.
6)Tableau
...