Cours Statistique Staps M2
Documents Gratuits : Cours Statistique Staps M2. Rechercher de 53 000+ Dissertation Gratuites et Mémoires’utilise lors que la tendance est à la forte augmentation.
Exemple 2
Ajustement de type logarithmique
Même chose mais ici la tendance est à la baisse.
4. Qualité de l’ajustement
a) Coefficient de corrélation
Utiliser la formule « coefficient corrélation » pour calculer le coefficient de corrélation r.
Le coefficient est égal à 0,85. Il est positive donc la corrélation est positive, lorsque x augmente y fait de même.
Plus r est élevé, plus la corrélation est forte. Ce coefficient ne peut pas dépasser 1 ni se trouvait en dessous de -1.
Si r égal 1, les points de nuage sont parfaitement alignés sur la courbe.
Si r égale – 1, les points du nuage sont parfaitement alignés en descendant.
Si r égal à 0, absence de corrélation entre les x et les y.
b) Coefficient de détermination
On peut utiliser le coefficient de détermination qui correspond à r au carré.
R2= 0,852= 0,72
Ce coefficient est la variation expliquée sur la variation totale.
Dans le modèle que l’on vient de faire, on explique 72% des écarts des points du nuage par rapport à la droite de corrélation. On connait le poids de l’explication de mon modèle pour les écarts.
Tendance linéaire r2 = 0,73
Tendance logarithmique r2 = 0,86
Application
Sur le doc Excel
Eléments sur la distribution d’échantillonnage
I. Problématique
Lorsqu’on calcule des écart-types sur des échantillons, il faut le corriger avec la taille de l’échantillon en se basant sur un écart type d’estimation et pas sur l’écart type classique.
Inférence= déduire des résultats globaux des observations de l’échantillon et les appliquer à la population entière
II. Distribution de la moyenne
1. Exemple
La moyenne d’une population est différente de la moyenne d’un échantillon.
Lorsque je connais la distribution de la population totale, comment puis-je connaitre la distribution des moyennes des échantillons ?
Les moyennes des échantillons tournent autour de la moyenne de la population principale.
X : variable aléatoire qui mesure les tailles des individus de la population
La distribution de la moyenne des moyennes des échantillons est beaucoup plus resserrée car la fluctuation de l’échantillonnage est moins forte que celle de la population. La probabilité que mon échantillon est une taille moyenne de 1,90m est très faible. La fluctuation dépend de la taille de l’échantillon. Si la fluctuation est nulle, c'est-à-dire que l’échantillon se compose de toute la population, retrouve une moyenne égale à 1,70m.
2. Distribution d’échantillonnage de la moyenne
III. Distribution de la fréquence
1. Exemple
2. Distribution d’échantillonnage de la fréquence
IV. Lois de référence
1. La loi normale
Ne pas hésiter à faire un graphique pour faciliter les calculs.
Déterminer, à l’aide d’Excel, les probabilités suivantes :
1) Si X suit une loi N (0;1) calculer :
Quelle est la probabilité que je choisisse un jour où la température était inférieure à 1 ?
P(X inférieur ou égal à 1) = 0,96
P(X supérieur ou égal à 3)= 1 – P(X inférieur ou égal à 3) = 0,002
P(2≤X≤3)= P(X≤3) – (P(X≤2)= 0,9986 – 0,979 = 0,021
2) Déterminer a pour que :
P(X≤a)=0,75, à partir de la loi normale standard inverse on peut trouver la valeur du a=0,674
P(X≥a)= 0,3= 1 – P(X≤a)
Donc P(X≤a)=0,7 donc a=0,52
3) Si X suit une loi N(6 ;2), calculer
Espérance=6
Ecart-type=2
Cumulative= vrai
2. La loi de Student
Loi adaptée aux petits échantillons
Un petit échantillon est, en général, inférieur à 30 individus.
La taille de l’échantillon est introduite avec le degré de liberté (le n-1).
Calcul avec Excel :
X suit une distribution de Student de ddl=9 (échantillon de 10)
P(X≤2,262)= 0,0025 avec unilatéral
P(-2≤X≤2)= 1-P(X≤2)=1-0,076=0,924
P(X≤t)=0,05 avec la loi de Student inverse en unilatéral t=2,26
Intervalle de confiance
I. Intervalle de confiance d’une proportion
1) Principe
Un intervalle permet d’avoir une marge d’erreur et donc d’estimer une probabilité qui peut être juste quelque soit la période.
Fn est une proportion de gens qui votent C dans un échantillon pris au hasard. C’est donc une variable aléatoire.
Fn suit une loi normale (p ; racine carrée de pq/n)
Racine carrée de pq/n = écart type
L’intervalle dépend de la confiance que l’on va donner à nos résultats.
Fn est centrée sur p. Les deux bornes de l’intervalle délimite une zone qui représente une probabilité de 95%.
P(Ic contient p)= 0,95
Ic = p ± z (racine carrée pq/n)
Mais on ne connait pas p, il faut donc transformer cette formule en estimant p.
Ic= fn ± z (racine carrée fn(1-fn) /n)
Avec la loi normale standard inverse, on obtient le z, étant donné que nous devons laisser de chaque côté de la borne de l’intervalle de confiance 2,5%, il faut demander une loi sur 97,5%.
Donc le z est égal à 1,96. COMMENT FAIRE SUR EXCEL ????
Ic = 0,48 ± 1,96 (racine carrée (0,48.0,52)/500)
Ic= 0,48 ± 0,04
0,02 est la marge d’erreur ou la précision
Ic= [0,44 ; 0,52]
L’amplitude est la différence entre les deux bornes, ici c’est 0,08.
Comment améliorer la confiance d’un intervalle ?
On peut jouer sur le n ou le z.
Calculer le nouvel intervalle avec un n égale à 2000.
Nouvelle marge d’erreur 0,022
Ic = [0,458 ; 0,502]
On peut aussi fixer l’amplitude. On se fixe par exemple une amplitude à 6%.
La marge d’erreur est de 0,03.
Il faut alors prendre un échantillon d’environ de 1000 personnes.
Ic= 1,96 (racine carrée (0,48.0,52)/n)= 0,03
n= 1065 personnes
La précision coûte chère. Pour n=500, la marge d’erreur était de 4%, pour n=2000, la marge d’erreur était de 2%.
On peut aussi jouer sur z, en jouant sur le risque, en le diminuant.
Calculer Ic avec un intervalle de confiance à 99% pour n= 500
Pour calculer le z, on laisse de chaque côté des deux bornes 0,05, on calcule alors la loi standard inverse pour 0,995. Donc z=2 ,57
Ic= 0,48 ± 2,57 (racine carrée (0,48.0,52)/500)
Ic= 0,48 ± 0,057
Ic= [0,42 ; 0,54]
II. Intervalle de confiance d’une moyenne
Avoir une idée de la moyenne de la population.
On calcule alors la moyenne d’échantillon. Mais
...