Analyse des données quantitatives
Compte Rendu : Analyse des données quantitatives. Rechercher de 53 000+ Dissertation Gratuites et Mémoires75%)
12 notes :
4 5 7 8 8 9 10 10 10 11 13 16
Q2 : 9.5Q1 : 7.5Q3 : 10.5
13 notes :
4 5 7 8 8 10 10 10 11 12 13 16
Q2 : le premier 10Q1 : le premier 8Q3 : 11
chapitre 2
on souhaite souvent étendre les résultats observés sur un échantillon à la population toute entière. Il s'agit de tirer des conclusions au niveau de la population à partir des données de l'échantillon.
Si l'échantillon est représentatif de la population étudiée, alors il est possible de procéder à de l'inférence statistique : consiste à déduire des résultats d'une population à partir des résultats d'un échantillon.
Focus groupe : étude d'un petit groupe qui va parler du produit.
Une méthode probabiliste nécessite que vous connaissiez avec exactitude les caractéristiques de la population de départ. Si on ne les connaît pas → méthode non probabiliste
la différence entre les deux : on ne pourra pas généraliser les résultats à la population.
Chaque unité de sondage est sélectionnée aléatoirement pour méthode probabiliste.
Pour l'autre méthode choix arbitraire.
Non probabiliste : basé sur un jugement
échantillon de convenance : méthode préférée des étudiants
échantillon par jugement : méthode subjective, dangereuse quand on est nouveau
raison financière et humaine dans le choix des enquêtes.
Méthode boule de neige= méthode de proche en proche
Estimation d'une proportion
l'intervalle de confiance : le risque d'erreur que l'on se fixe
u1-(a/2) représente le fractile d'ordre 1-a/2 de la loi
tri croisé : voir s'il existe ou non une relation significative entre les 2 variables
Quelle est la nature de la variable qui va me pousser à utiliser tel ou tel test ?
Test du qui2 Ki2
dire que la csp
coefficient de corrélation
Spearman
test d'hypothèse : cherhce à affirmer ou rejeter une affirmation.
Si la valeur calculée est supérieure à la valeur théorique : vous acceptez l'hypothèse alternative.
Si la valeur calculée est inférieure à la valeur théorique : vous acceptez l'hypothèse nulle.
Lien entre le sexe et l'alcool ?
Pas de relation significative → hypothèse nulle.
Hypothèse alternative : il existe une relation significative entre le sexe et l'alcool.
Test d'estimation :
HO= pi = 0.40 la population
on peut imaginer qu'un magasin soit contraint d'étudier la liste d'achat par internet,
si plus de 40% utilise ce canal de distribution je le met en place. Si moins de 40% l'utilise je ne le mets pas en place.
Je calcule la proportion sur mon échantillon.
Le test d'hypothèse : conduire à l'acceptation de l'hypothèse alternative c'est à dire obtenir H1.
La probabilité d'acceptation doit nous permettre de nous situer dans l'intervalle de confiance.
Étape 1 : je formule mes hypothèses, qu'est ce que je vais vouloir confirmer ou infirmer ?
De quelle table statistique vais-je avoir besoin pour vérifier que la proportion de mon échantillon est satisfaisant?
Normale (intervalle de confiance), student (moyenne), khi-2(variance) ??
La valeur calculée va être comparée a une valeur théorique issues de la table...
Section 4 : les tris croisés
Trier les réponses données à 2 variables. Chercher à savoir s'il y a un lien entre deux variables.
Le choix du test statistique pour savoir si les deux variables sont liées dépend de la nature des deux variables.
Lien entre n° de secu et profession : test du khi-2
2variables ordinales : spirman
2variables quantitatives : test de corrélation de pierson
Les tests de comparaison :
2 familles : paramétriques et non paramétriques
lorsqu'on travaille sur deux échantillons ou plus : appariés
non paramétrique : je travaille sur des données qualitatives, variables qualitatives ordinaires, je vais comparer des fréquences de réponses données avec des variables qualitatives, avec des distributions théoriques.
Toujours le même test statistique c'est à dire celui de student.
Pbq : Est ce que la part de marché de l'entreprise est supérieure ou non a 15% ?
H0 : elle est inférieure à 15%
H1 : elle est supérieure à 15%
est ce que les clients d'une marque se différencient des non clients dans leur manière dont il perçoivent la marque en question ?
Échantillons appariés :
les moyennes sont issues de variables différentes
Tests non paramétriques :
variables qualitatives, tests sur variables ordinales (présentent un ordre, un classement)
Les tests sont différents selon les échantillons
échantillon unique : test K-S
propose un test d'ajustement d'une distribution observée à une distribution théorique. Ce test repose sur la valeur maximale de la différence absolue entre toutes les valeurs calculées avec les valeurs théoriques.
Niveau de revenu comparé au niveau national de tous les étudiants, est ce que le notre est différent significativement du revenu national de tous les étudiants ?
Mann Whitney propose un test de deux échantillons qualifiés d'indépendants.
Exemple : niveau de revenu des M1 management comparé aux revenus des M1 finance
Wilcoxon : comparer deux distributions calculées issues d'un même échantillon mais de variables différentes.
Utilise la statistique Z de la loi normale.
Chapitre 3 : analyse de la variance et de la covariance
Présente un rapport avec la corrélation.
L'analyse de variance et de covariance servent à évaluer les écarts des valeurs moyennes d'une variable dépendante sous l’influence de variables indépendantes en tenant compte des relations contrôlées et non contrôlées entre ces variables indépendantes.
Exemple : vous vous interrogez de savoir si un échantillon de consommateurs caractérisé par une consommation importante moyenne occasionnelle ou nulle se différencie quant au niveau de préférence manifesté à l'égard de la marque red bull.
Combien
...