Examen d’analyse des donn´es
Mémoires Gratuits : Examen d’analyse des donn´es. Rechercher de 53 000+ Dissertation Gratuites et Mémoiresminants de Fisher (4 points) On observe les r´sultats suivants d’une ACP et d’une LDA effectu´es sur les iris de Fisher : e e 1. Rappelez tout d’abord en quoi diff`rent les objectifs de l’ACP et des axes discrimie nants de Fisher. 2. Commentez les r´sultats num´riques, choisissez le nombres d’axes ` retenir dans e e a chaque cas et analysez les diff´rents r´sultats graphiques pr´sent´s ci-apr`s. e e e e e > > > > library(MASS) data(iris) pc = princomp(iris[, 1:4]) summary(pc)
Importance of components: Comp.1 Comp.2 Comp.3 Comp.4 Standard deviation 2.0494032 0.49097143 0.27872586 0.153870700 Proportion of Variance 0.9246187 0.05306648 0.01710261 0.005212184 Cumulative Proportion 0.9246187 0.97768521 0.99478782 1.000000000 > disc = lda(iris[, 1:4], iris[, 5]) > print(disc)
2
Call: lda(iris[, 1:4], iris[, 5]) Prior probabilities of groups: setosa versicolor virginica 0.3333333 0.3333333 0.3333333 Group means: Sepal.Length Sepal.Width Petal.Length Petal.Width setosa 5.006 3.428 1.462 0.246 versicolor 5.936 2.770 4.260 1.326 virginica 6.588 2.974 5.552 2.026 Coefficients of linear discriminants: LD1 LD2 Sepal.Length 0.8293776 0.02410215 Sepal.Width 1.5344731 2.16452123 Petal.Length -2.2012117 -0.93192121 Petal.Width -2.8104603 2.83918785 Proportion of trace: LD1 LD2 0.9912 0.0088 > > > > par(mfrow = c(1, 2)) lbl = as.numeric(iris[, 5]) plot(pc$scores, col = lbl, pch = lbl) plot(predict(disc)$x[, 1], col = lbl, pch = lbl)
1.0
0.5
predict(disc)$x[, 1] −3 −2 −1 0 Comp.1 1 2 3 4
Comp.2
0.0
−0.5
−1.0
−5 0
0
5
10
50 Index
100
150
3
...