Statistiques Terminale
Recherche de Documents : Statistiques Terminale. Rechercher de 53 000+ Dissertation Gratuites et Mémoires 1 n Cx y = (xi – x )(yi – y ) = xi yi – x y . n n i=1 i=1 La seconde expression est plus commode pour les calculs à la main. 1 Dans l’exemple précédent, Cx y = (1 8 + 2 9 + 3 12 + 4 12 + 5 13) – 3 10,8 5 = 35 – 32,4 = 2,6. II. Ajustement affine par la méthode des moindres carrés Lorsque les points du nuage paraissent presque alignés, on peut chercher une relation de la forme y = ax + b qui exprime de façon approchée y en fonction de x, autrement dit, une fonction affine f telle que l’égalité y = f(x) s’ajuste au mieux avec les données. Graphiquement, cela signifie qu’on cherche une droite qui passe au plus près de tous les points du nuage. Une telle relation permettrait notamment de faire des prévisions. Pour mesurer la qualité d’une telle formule, on considère, pour chaque valeur xi, la différence entre la valeur observée, c’est à dire yi, et la valeur calculée par la formule, c’est à dire axi + b. On souhaite que toutes les différences : yi – axi – b appelées erreurs, ou résidus, ou perturbations, soient les plus petites possible. La méthode la plus couramment employée, dite méthode des moindres carrés, consiste à choisir a et b de façon que la somme des carrés des résidus soit la plus petite possible. On considère par la suite un nuage de points Ai(xi ; yi) (avec 1 i n). Définition : Il existe une droite unique associée au nuage de points Ai (xi ; yi), avec i = 1, 2, …, n , telle que la somme S des AiPi² soit minimale. Cette droite passe par le point moyen G( x , y ) du nuage. Elle a une équation y = ax + b avec a = Cx y et b = y – a x . Vx
Définition : Cette droite s’appelle la droite de régression de y en x. Utilisation de la calculatrice pour la détermination de l’équation de la droite de régression : Texas Instrument (TI – 80) Casio Graph 25 Dans le menu STAT, entrer les valeurs de x dans STAT 1 : Edit… permet d’entrer les valeurs de List 1, puis celles de y dans List 2. x dans L1, puis celles de y CALC dans L2 STAT CALC 3 : LINREG(aX+b) puis SET , entrer dans 2VarXList : List 1 2VarYList : List 2 (2nd L1 , 2nd L2 ) ENTER EXE puis Calc Reg 1-Linear Ceci nous donne les nombres a et b Ceci nous donne les nombres a et b
Exercice : Considérons la série statistique à deux variables (xi ; yi), pour i = 1, 2, …, 6 : xi 10 500 10 590 10 750 10 845 10 963 11 020 yi 880 822 783 697 632 640 1. Placer, dans un repère orthogonal, le nuage de points Ai(xi ; yi) et constater que la forme « allongée » du nuage justifie un ajustement affine. 2. Placer le point moyen G de ce nuage. 3. Tracer la droite d de régression de y en x. Solution : 2. Le point moyen G a pour coordonnées ( x ; y ). On obtient grâce à la calculatrice : x = 10 778 et y = 742,3.
3. La droite d passe par G ; pour la tracer, il suffit de connaître son coefficient directeur a. D’après la calculatrice, a -0,487.
III. Exemple d’ajustement non affine Ajustement logarithmique On considère les données suivantes : xi 1 2 3 4 yi 198 881 1256 1489 xi yi
4000 3500 3000 2500 2000 1500 1000 500 0 5 10 15 20
5 1804 17 3005
6 1983
7 2104 20 3125
8 2247 21 3155
9 2312 22 3221
10 2468 23 3333
11 2541 24 3365
12 2639 25 3392
13 2728
14 2811
15 2850
16 2890
18 3010
19 3087
La forme du nuage suggère un ajustement de la forme y = a ln x + b.
25
30
On peut le vérifier en posant x’ = ln x et en plaçant les points de coordonnées (x’ ; y) dans un nouveau repère :
4000 3500 3000 2500 2000 1500 1000 500 0 0,5 1 1,5 2 2,5 3 3,5
Ces points sont presque alignés, ce qui permet d’envisager un ajustement affine du type y = ax’ + b. Alors la formule y = a ln x + b sera un bon ajustement de y en x.
Avec la calculatrice, on obtient : y = 989 ln x + 180 (en arrondissant les coefficients à l’unité).
IV. Alignement de points et lien de causalité On considère le tableau suivant : ti : Année 1995
xi : Nombre d’inscrits dans un club de belote yi : Nombre de hamburgers vendus dans un restaurant de Moscou
1996 53 7450
1997 57 8000
1998 62 8500
1999 68 9050
...