DissertationsEnLigne.com - Dissertations gratuites, mémoires, discours et notes de recherche
Recherche

Stat

Mémoires Gratuits : Stat. Rechercher de 53 000+ Dissertation Gratuites et Mémoires
Page 1 sur 8

lon peut être constitué de plusieurs façons :  par prélèvements aléatoires (éventuellement stratifiés, c’est-à-dire en ayant préalablement découpé la population en sous-ensembles plus homogènes).  par grappes, c’est-à-dire en n’examinant que certaines parties de la population, de façon soit exhaustive, soit partielle.  en utilisant, dans le cas de populations humaines (sondages d’opinion, études de marché...), la méthode des quotas ; cela consiste à respecter, dans l’échantillon, la distribution de quelques caractéristiques bien connues au niveau de la population : quotas par sexe, par âge, par catégorie socioprofessionnelle, par région, par taille de commune...

Sondage : Enquête portant sur un échantillon. Cas du recensement effectué par l’INSEE : En ce qui concerne le recensement de la population vivant en France, l’INSEE a depuis 2004 abandonné le principe de l’enquête exhaustive effectuée en une seule fois tous les 8 ou 9 ans. Désormais :   les communes de moins de 10 000 habitants, réparties en 5 groupes, sont recensées tous les 5 ans par roulement. les communes de 10 000 habitants ou plus sont soumises à une enquête par sondage tous les ans, portant sur 8% de la population de chacune d’entre elles ; au bout de 5ans, 40% des habitants de ces communes auront été recensés. A partir de 2008, chaque nouvelle enquête annuelle viendra remplacer celle réalisée 5 ans auparavant ; les résultats seront donc actualisés (partiellement) tous les ans, améliorant ainsi la qualité de l’information disponible. Voir le site www.insee.fr pour plus de détails.

Caractère, ou variable, ou facteur : Trait commun aux individus de la population de référence, et qui fait l’objet de l’étude. A chaque individu observé correspond une modalité, ou une valeur, du caractère étudié. Formellement, c’est une application (une fonction) de l’ensemble de référence dans un ensemble de modalités ou de valeurs.

2

Série statistique : Ensemble ou liste des données observées, chaque donnée étant constituée d’un individu et de la modalité correspondante du caractère étudié. Si l’on étudie simultanément plusieurs caractères, on parle de série statistique double, triple..., ou de série à deux, trois...caractères.

Effectifs, ou fréquence absolue : Le nombre d’individus de la série statistique est appelé effectif total ; généralement désigné par le symbole n. Le nombre d’individus présentant une modalité donnée du caractère considéré est appelé effectif partiel, ou encore fréquence absolue, de cette modalité ; l’effectif de la modalité numéro i est généralement noté ni. On doit bien sûr avoir :  ni = n

Fréquence, ou fréquence relative1 : La fréquence d’une modalité mesure l’importance relative de cette modalité. En notant fi la fréquence, on a : fi = ni /n Ce rapport, compris entre 0 et 1, est exprimé soit par un pourcentage, soit par un nombre décimal. Propriété :  fi = 1 ou 100% Distribution observée d’un caractère : Obtenue après dépouillement de la série brute, c’est la répartition des n observations par rapport aux différentes modalités possibles du caractère étudié. On la représente par un tableau d’effectifs ou de fréquences.

Caractère qualitatif, ou variable qualitative : Caractère dont les modalités ne sont pas mesurables : couleur, catégorie socioprofessionnelle, pays... On ne peut donc pas, en particulier, ordonner ces modalités sur un axe, ou calculer des paramètres comme la moyenne ou l’écart type. Le fait d’utiliser un codage numérique (par exemple, comme dans le numéro de sécurité sociale, « 1 » pour sexe masculin et « 2 » pour sexe féminin) ne change rien à l’affaire.

Caractère quantitatif, ou variable quantitative : Caractère dont les modalités (on dira plutôt les valeurs) sont mesurables, et donc pouvant être soumises à des opérations algébriques. Cela permettra de calculer, par exemple, leur moyenne ou leur écart type. On distingue deux catégories de variables quantitatives : les variables continues, et celles qui ne le sont pas.

Variable discontinue, ou discrète : Variable dont l’ensemble de définition est formé de points isolés, c’est à dire de nombres bien distincts (souvent entiers, mais pas nécessairement), entre lesquels il n’existe pas de valeurs intermédiaires. L’ensemble des valeurs possibles peut être fini, ou infini. Exemples : nombre de pièces d’un logement, nombre de parts d’un ménage pour l’impôt sur le revenu...

1

Attention à la terminologie anglaise (langue utilisée par la plupart des logiciels statistiques) : Frequency pour effectif, et

Relative Frequency pour fréquence.

3

Variable continue : Variable susceptible de prendre toutes les valeurs d’un intervalle de l’ensemble des nombres réels2. Entre deux valeurs distinctes données existent donc une infinité de valeurs intermédiaires possibles, bien qu’en pratique on soit limité par la précision de la mesure. Exemples : durées, longueurs, superficies, poids... Une variable discrète dont les valeurs sont nombreuses et très proches pourra être assimilée à une variable continue. Exemples : le nombre d’habitants d’une ville, le salaire d’un employé, le chiffre d’affaires d’une entreprise... Inversement, une variable continue pourra être discrétisée ; c’est ce qu’on fait souvent avec la variable temps, lorsqu’on considère par exemple des âges en années révolues.

Classes (pour une variable continue) : L’intervalle de définition d’une variable continue est souvent subdivisé en sous-intervalles (ou tranches) qu’on appelle classes, et dans lesquelles on répartit les observations. On impose évidemment aux classes d’être disjointes et de recouvrir l’ensemble des valeurs, ce qui fait qu’une observation ne peut appartenir qu’à une et une seule classe. Toute classe, en tant qu’intervalle, comporte deux extrémités ou bornes (sauf peut-être la première et la dernière classes) ; chaque extrémité, selon les cas, peut être incluse, ou au contraire exclue. L’important est qu’une extrémité donnée soit comprise dans un intervalle et un seul. L’amplitude d’une classe est la distance (la différence) entre ses deux extrémités, et le centre d’une classe est la demisomme de ses extrémités. Remarque : regroupement en classes et perte d’information Lorsqu’on décide de procéder à des regroupements en classes, on essaie de choisir des extrémités telles qu’à l’intérieur de chaque classe la répartition des valeurs observées soit à peu près régulière. En effet, lorsqu’un utilisateur n’ayant pas connaissance de cette répartition voudra calculer des paramètres, toute observation sera assimilée au centre de la classe à laquelle elle appartient ; la validité des résultats (et aussi des graphiques comme les histogrammes ou les courbes cumulatives) obtenus repose sur la répartition homogène des données dans les classes. C’est une des raisons pour lesquelles, bien souvent, les différentes classes ne sont pas de même amplitude. On fera attention à ne pas confondre systématiquement centre de classe et moyenne de classe (c’est particulièrement vrai pour la première et la dernière classes), même si ces deux valeurs sont le plus souvent voisines, et bien qu’on puisse être contraint, faute d’information, à faire cette confusion. Ainsi, la « masse » d’une classe, c’est-à-dire la somme des valeurs observées qu’elle contient, n’est généralement pas égale à ni fois xi , où ni et xi désignent respectivement l’effectif et le centre de la classe considérée...

Variable ordinale : Ni vraiment qualitative, ni vraiment quantitative, c’est une variable associée aux rangs dans un classement. Exemples : préférences dans une liste de possibilités, niveau scolaire. Les valeurs d’une telle variable sont donc numériques, et on peut les ordonner, mais les rares opérations algébriques qu’on peut leur appliquer sont à manipuler et interpréter avec précaution.

2

Autre définition d’une variable continue : variable dont la fonction de répartition est continue.

4

PRINCIPALES REPRESENTATIONS GRAPHIQUES A CONNAÎTRE ET A SAVOIR TRACER (ou faire tracer par un logiciel)

Représentations

...

Télécharger au format  txt (13.5 Kb)   pdf (126.5 Kb)   docx (10.7 Kb)  
Voir 7 pages de plus »
Uniquement disponible sur DissertationsEnLigne.com