DissertationsEnLigne.com - Dissertations gratuites, mémoires, discours et notes de recherche
Recherche

Statistique

Recherche de Documents : Statistique. Rechercher de 53 000+ Dissertation Gratuites et Mémoires
Page 1 sur 6

recherchée. Remarquons au passage que le cas d’égalité se produit lorsque le discriminant de l’équation (3.1) est nul. Dans ce cas, l’équation admet une racine double : a = − = 2Cov(X, Y ) Cov(X, Y ) =− . 2V ar(Y ) V ar(Y ) − σX σY

σX σY

si Cov(X, Y ) = +σX σY si Cov(X, Y ) = −σX σY

Dans le premier cas, cela signifie que X − σX Y a une variance nulle, donc est une constante, σY d’où σX X= Y + constante. σY Dans le second cas, σX X = − Y + constante. σY Ces deux cas sont les seuls cas d’égalité dans la Proposition 2. Ils correspondent au fait que les variables X et Y s’obtiennent l’une à partir de l’autre par une application affine.

Statistique descriptive - L1 MASS 2010-2011 - Hélène Boistard - www.boistard.fr

23

3.1.2

Coefficient de corrélation

Cov(X, Y ) . σX σY

Définition 2. Le coefficient de corrélation r(X, Y ) est défini par : r(X, Y ) =

C’est un coefficient sans unité. Sa valeur absolue est invariante par translation et changement d’échelle des variables : pour toutes constantes réelles a = 0, b, c = 0 et d, ac r(X, Y ). r(aX + b, cY + d) = |ac| Exemple : reprendre l’exemple précédent du couple (T, P ) et calculer le coefficient de corrélation entre les deux variables.

Propriété 2. Il découle de la Proposition 2 que −1 ≤ r(X, Y ) ≤ 1. De plus, les cas d’égalité sont les suivants : • r(X, Y ) = 1 si et seulement si les deux variables satisfont une relation affine du type Y = aX + b avec a > 0. • r(X, Y ) = −1 si et seulement si les deux variables satisfont une relation affine du type Y = aX + b avec a < 0. Lorsque le nuage des points (xi , yi ) est exactement situé sur une droite (cas idéal), on est dans la situation où r(X, Y ) = ±1. Lorsque r(X, Y ) est proche de ±1 (pour fixer les idées : |r(X, Y )| ≥ 0.8), alors il y a une liaison linéaire importante entre X et Y . Lorsqu’au contraire r(X, Y ) est proche de 0, alors il n’existe pas de relation linéaire entre X et Y . Attention, il peut y avoir quand même un autre type de liaison entre X et Y .

3.1.3

Régression linéaire

On suppose à présent que les observations du couple de variables (X, Y ) satisfont une relation de la forme suivante : yi = axi + b + i , i = 1, . . . , n, (3.2)

où a et b sont des coefficients réels. Il s’agit ici de la régression de Y sur X. Le terme i désigne un bruit, c’est à dire une perturbation supposée petite. Dans ce cours, on ne cherchera pas à donner un sens précis à la mesure de ce bruit. Disposant des observations (xi , yi )n du couple (X, Y ), on cherche à trouver les coeffii=1 cients a et b qui permettent le mieux d’ajuster les données à une relation du type (3.2), au sens du critère des moindres carrés. On cherche

n

min

a,b i=1

(yi − b − axi )2 .

(3.3)

Statistique descriptive - L1 MASS 2010-2011 - Hélène Boistard - www.boistard.fr

24

La solution, qui s’obtient en annulant les dérivées partielles de la fonction de (a, b) qui est minimisée dans (3.3), est : a = ˆ Cov(X, Y ) , V ar(X)

ˆ = y − ax, b ¯ ˆ¯ où x et y désignent les moyennes respectives de X et Y . La droite des moindres carrés est la ¯ ¯ droite d’équation : y = ax + ˆ On peut remarquer qu’elle passe toujours par le barycentre ˆ b. (¯, y ) du nuage de points. Sa pente peut aussi s’écrire à l’aide du coefficient de corrélation : x ¯ σY a = r(X, Y ) σX . ˆ Exemple : droite des moindres carrés de régression de la pointure sur la taille. Reprendre les données relatives au couple (T, P ) des exemples précédents et calculer l’équation de la droite des moindres carrés de régression de la pointure sur la taille.

Le graphique suivant représente le nuage de points du couple (T, P ). Deux droites ont été ajoutées sur le graphique. Laquelle correspond à la droite de régression de la pointure sur la taille ? On verra en cours comment a été obtenue la deuxième droite.

Taille et pointure de 20 individus

48 Pointure 42 44 46

+

x

38

40

1.60

1.65

1.70

1.75 Taille en m

1.80

1.85

1.90

Statistique descriptive - L1 MASS 2010-2011

...

Télécharger au format  txt (6.9 Kb)   pdf (103.8 Kb)   docx (8.4 Kb)  
Voir 5 pages de plus »
Uniquement disponible sur DissertationsEnLigne.com