Introduction Au Statistique
Compte Rendu : Introduction Au Statistique. Rechercher de 53 000+ Dissertation Gratuites et Mémoiresables qualitatives ordinales (on peut ordonner les modalités, exemple : variable mention : P, AB, B, TB)
• Les variables quantitatives
Une variable quantitative a des modalités mesurables, pouvant être exprimées par des nombres.
Exemple : la variable revenu
On distingue les variables quantitatives discrètes ne pouvant prendre que certaines valeurs (exemple : variable nombre d’enfants ( 0,1,2,3,… mais pas 1.8)
et les variables quantitatives continues pouvant prendre n’importe quelle valeur dans un intervalle ou plusieurs intervalles (exemple : la taille d’un individu peut être de 1m75, celle d’un autre 1m80, mais toute valeur comprise entre 1m75 et 1m85 est possible et il y en a une infinité) ; en général sont considérées comme continues les variables liées à l’espace, la monnaie, la masse, le temps ou la température.
On définit alors le plus souvent des classes de grandeurs, c’est-à-dire que les individus sont regroupés selon des intervalles de la forme [pic] ou [pic].
La première forme est la plus usuelle (car elle permet de définir strictement la fonction de répartition, voir ci-après).
Pour caractériser les valeurs prises par les variables dans une population, on a recours à des tableaux et graphiques pour tous les types de variable (partie 2) et à des mesures numériques dont certaines ne sont pas définies pour tous les types de variable (partie 3).
c) Recueil des données
Il existe deux grands modes de recueil de données : recensement (recueil exhaustif) ou échantillon (recueil partiel aléatoire).
Lesdites méthodes présentent des avantages et inconvénients.
- Recensement : méthode très ancienne utilisée dans l’antiquité par les grecs pour mieux répartir la récolte de grains au sein de la communauté.
Avantage : connaissance parfaite de la population
Inconvénients : très coûteux, manipulation possible
- Echantillon : le tirage doit être aléatoire pour que ledit échantillon soit représentatif de la population
Avantages : peu coûteux, absence de manipulation
Inconvénient : ne permet pas de connaître parfaitement la population. Induction des valeurs des caractéristiques de la population à partir de l’échantillon
Remarques : moins de 10 % des données disponibles sont exploitées. Toutes les cartes de fidélité (hypermarchés, autres enseignes), transports génèrent une abondance d’information non utilisée en raison du manque d’exploitants.
2. Les distributions à une variable
a) Les tableaux de fréquences
• Les fréquences relatives
Le tableau permet le recensement des individus.
Tableau de données individuelles (recense par individu)
( individus [pic] variables ([pic] individus)
|Ind\Var |Y |
|[pic] |y1 |
|[pic] |y2 |
|[pic] | |
|[pic] |yn |
[pic]
On regroupe les individus par même valeur (appelée modalité) et on les dénombre (noté ni). On obtient ainsi, une variable X regroupant les valeurs de Y. Ces valeurs de Y sont appelés modalités et notées xk.
Tableau de fréquences (recense par modalités)
( Données classées par modalités ([pic] modalités)
|X |Effectif |Fréquence |
|[pic] | | |
| | | |
|[pic] |[pic] |[pic] |
| | | |
|[pic] | | |
|Total |[pic] |1 |
1ère colonne : les différentes modalités [pic] de la variable [pic]
2ème colonne : les effectifs ou fréquences absolues [pic]= nombre d'individus de la population présentant la modalité [pic]
3ème colonne : les fréquences relatives [pic] = proportion d'individus de la population présentant la modalité [pic]
Exemple 1
Population : 10 appartements
Variable quantitative discrète: nombre de pièces
Modalités : 1, 2, 3, 4 pièces
Calcul des Fréquences simples
• Les fréquences cumulées
Les fréquences cumulées [pic] sont définies seulement pour les variables qualitatives ordinales et quantitatives et permettent de définir la fonction de répartition.
Elles représentent la proportion d'individus de la population ayant au plus la modalité [pic], c’est-à-dire
[pic] pour [pic] pour les variables qualitatives ordinales et quantitatives discrètes.
[pic] pour [pic] si variable quantitative continue avec des données regroupées sous la forme de classes [pic]
et [pic] si classes [pic]
Tableau de fréquences cumulées
|X |Effectif |Fréq. |Fréq cumulées |
|[pic] |[pic] |[pic] |[pic] |
|[pic] |[pic] |[pic] |[pic] |
|[pic] |[pic] |[pic] |[pic] |
|Total |[pic] |1 | |
Exemple 1
fréquences cumulées
Exemple 2
Population : 10 étudiants
Variable quantitative continue: revenus
Regroupement en 3 classes d’amplitude 100
Tableau de données individuelles
|Etudiant |Revenus |
|1 |55 |
|2 |105 |
|3 |75 |
|4 |60 |
|5 |125 |
|6 |205 |
|7 |250 |
|8 |175 |
|9 |165 |
|10 |185 |
fréquences cumulées
b) Les représentations graphiques
On a l'habitude de représenter les fréquences relatives et les fréquences cumulées. Les représentations dépendent du type de la variable.
• Les variables qualitatives nominales
- fréquences absolues [pic] ou relatives [pic]
- ( diagramme en secteurs circulaires où chaque modalité est représentée par un secteur circulaire d'angle au centre [pic]
Exemple 3
Population : 10 étudiants célibataires
Variable qualitative nominale: sexe
Modalités : H, F
Tableau de données individuelles
|Eudiant |Sexe |
|1 |F |
|2 |F |
|3 |H |
|4 |F |
|5 |F |
|6 |H |
|7 |F |
|8 |F |
|9 |H |
|10
...