Tp Bioinformatique
Rapports de Stage : Tp Bioinformatique. Rechercher de 53 000+ Dissertation Gratuites et Mémoiresits, les vrais exons. C'est donc la probabilité de trouver des exons justes. Elle est donnée par la formule suivante : spécificité = Vrais positifs / (Vrais positifs + Faux positifs).
| Genscan | Augustus |
Exons prédits | 16 | 13 |
Transcrits prédits | 1 | 2 |
Sensibilité | 58 | 52 |
Spécificité | 46 | 63 |
Gescan
Exons prédits | Début | Fin | Probabilité |
1 | 5473 | 5532 | 0.576 |
2 | 9705 | 9812 | 0.177 |
3 | 27685 | 27868 | 0.999 |
4 | 30575 | 30706 | 0.663 |
5 | 34820 | 34954 | 0.055 |
6 | 45053 | 45141 | 0.336 |
7 | 55940 | 56007 | 0.140 |
8 | 67271 | 67467 | 0.162 |
9 | 69653 | 69788 | 0.997 |
10 | 70847 | 70916 | 0.975 |
11 | 75652 | 75708 | 0.768 |
12 | 78094 | 78267 | 0.913 |
13 | 78824 | 78957 | 0.984 |
14 | 79989 | 80054 | 0.844 |
15 | 82088 | 82203 | 0.977 |
16 | 85420 | 85467 | 0.018 |
16 exons prédits
Séquence protéique : (592aa) MSTAVLENPGLGRKLSDFGQETSYIEDNCNQNGAISLIFSLKEEVGALAKVLRLFEENDV
NLTHIESRPSRLKKDEYEFFTHLDKRSLPALTNIIKILRHDIGATVHELSRDKKKDTASQ
AASPMTALPCFFPATCSQQELQTLWTKGLPDPGAIQPLVGAARFEFHLTPFQMDDRFSFI
CEMEQRPTLPIPVAHGGDYVEYPVHKVPWFPRTIQELDRFANQILSYGAELDADHPGFKD
PVYRARRKQFADIAYNYRHGQPIPRVEYMEEEKKTWGTVFKTLKSLYKTHACYEYNHIFP
LLEKYCGFHEDNIPQLEDVSQFLQTCTGFRLRPVAGLLSSRDFLGGLAFRVFHCTQYIRH
GSKPMYTPEPDICHELLGHVPLFSDRSFAQFSQEIGLASLGAPDEYIEKLATVSLHPVKV
THKINHHRVCSQIDFPFQIYWFTVEFGLCKQGDSIKAYGAGLLSSFGELQYCLSEKPKLL
PLELEKTAIQNYTVTEFQPLYYVAESFNDAKEKVRPLTKKGKNYPFASSFTYLTFARNFA
ATIPRPFSVRYDPYTQRIEVLDNTQQLKILADSINNIKAQSIAMGFNKFPIX
Augustus
Augustus a prédit 13 exons sur chacun des 2 transcrits.
Transcrit 1 :
Séquence protéique MSTAVLENPGLGRKLSDFGQETSYIEDNCNQNGAISLIFSLKEEVGALAKVLRLFEENDV
NLTHIESRPSRLKKDEYEFFTHLDKRSLPALTNIIKILRHDIGATVHELSRDKKKDTVPW
FPRTIQELDRFANQILSYGAELDADHPGFKDPVYRARRKQFADIAYNYRHGQPIPRVEYM
EEEKKTWGTVFKTLKSLYKTHACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQFLQTCTGF
RLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFSDRSFA
QFSQEIGLASLGAPDEYIEKLATIYWFTVEFGLCKQGDSIKAYGAGLLSSFGELQYCLSE
KPKLLPLELEKTAIQNYTVTEFQPLYYVAESFNDAKEKVRNFAATIPRPFSVRYDPYTQR
IEVLDNTQQLKILADSINSEIGILCSALQKIK
Transcrit 2 :
Séquence protéique : MSTAVLENPGLGRKLSDFGQETSYIEDNCNQNGAISLIFSLKEEVGALAKVLRLFEENDV
NLTHIESRPSRLKKDEYEFFTHLDKRSLPALTNIIKILRHDIGATVHELSRDKKKDTVPW
FPRTIQELDRFANQILSYGAELDADHPGFKDPVYRARRKQFADIAYNYRHGQPIPRVEYM
EEEKKTWGTVFKTLKSLYKTHACYEYNHIFPLLEKYCGFHEDNIPQLEDVSQFLQTCTGF
RLRPVAGLLSSRDFLGGLAFRVFHCTQYIRHGSKPMYTPEPDICHELLGHVPLFSDRSFA
QFSQEIGLASLGAPDEYIEKLATVSLHPVKVTHKINHHRVCSQIDFPFQIYWFTVEFGLC
KQGDSIKAYGAGLLSSFGELQYCLSEKPKLLPLELEKTAIQNYTVTEFQPLYYVAESFND
AKEKVRNFAATIPRPFSVRYDPYTQRIEVLDNTQQLKILADSINSEIGILCSALQKIK
Format fasta : le format FASTA est un format basé sur du texte représentant des séquences
...