TP Bioinformatique (2h)
Module ED3BIOBM Biologie Moléculaire
Quelques liens
EBI
EMBOSS
nederlands EMBOSS
Génopole ExPASy
NCBI Pôle
BIoinfo Lyonnais Primer3
Quelques "trucs"
utiles :
- Ctrl A permet de tout sélectionner sur une page
- Ctrl C permet de copier un texte sélectionné
- Ctrl V permet de le coller.
- Ctrl F permet de chercher un mot sur une page
Avant de commencer :
Ouvrez l' éditeur de texte Bloc-notes (dans Menu Démarrez
=> Accessoires) où vous collerez certains
résultats.
|
Vous vous intéressez à une protéine humaine,
potentiellement impliquée dans l'apoptose, dont voici la
partie codante de la séquence d'ADNc :
>THAP1_humaine
ATGGTGCAGTCCTGCTCCGCCTACGGCTGCAAGAACCGCTACGACAAGGACAAGCCCGTTTCTTTCCACA
AGTTTCCTCTTACTCGACCCAGTCTTTGTAAAGAATGGGAGGCAGCTGTCAGAAGAAAAAACTTTAAACC
CACCAAGTATAGCAGTATTTGTTCAGAGCACTTTACTCCAGACTGCTTTAAGAGAGAGTGCAACAACAAG
TTACTGAAAGAGAATGCTGTGCCCACAATATTTCTTTGTACTGAGCCACATGACAAGAAAGAAGATCTTC
TGGAGCCACAGGAACAGCTTCCCCCACCTCCTTTACCGCCTCCTGTTTCCCAGGTTGATGCTGCTATTGG
ATTACTAATGCCGCCTCTTCAGACCCCTGTTAATCTCTCAGTTTTCTGTGACCACAACTATACTGTGGAG
GATACAATGCACCAGCGGAAAAGGATTCATCAGCTAGAACAGCAAGTTGAAAAACTCAGAAAGAAGCTCA
AGACCGCACAGCAGCGATGCAGAAGGCAAGAACGGCAGCTTGAAAAATTAAAGGAGGTTGTTCACTTCCA
GAAAGAGAAAGACGACGTATCAGAAAGAGGTTATGTGATTCTACCAAATGACTACTTTGAAATAGTTGAA
GTACCAGCATAA
I-
Criblage d'une banque d'ADNc
Afin d'étudier le rôle de cette protéine vous décidez
de travailler sur la souris.
- Vous disposez dans
votre laboratoire d'une banque d'ADNc de souris que
vous
allez cribler avec une sonde spécifique de votre séquence d'intérêt.
- On choisit de
prendre comme sonde les 27 premiers nucléotides
(soulignés).
- Vous allez maintenant uitiliser le programme
BLAST, sur le serveur du NCBI
- Coller le fragment
de séquence en haut et choisir la Database
"Mouse genomic
plus transcript" puis cliquer sur
- Le programme BLAST
permet de comparer rapidement une séquence à tout un
ensemble de séquences.
- - Trouvez-vous des ARNm de
souris alignés avec votre sonde ? Combien ?
- - Au(x)quel(s) la sonde est-elle complètement
alignée ?
- - Votre sonde vous paraît-elle
spécifique ?
II-
Recherche de la protéine codée par un ARNm
Votre
sonde vous permet donc d'hybrider un ADNc, que vous faites séquencer.
Cet ADNc devrait être exactement le même que celui obtenu avec BLAST.
Cliquer
donc sur le lien NM_199042.2.
En haut de la page, cliquez sur le lien FASTA (FASTA
est un format de présentation des séquences).
Coller cette séquence dans l'éditeur.
1- Cherchez sur cette séquence l'ORF la plus probable. Pour cela
:
Avec la suite logicielle
EMBOSS,
dans la rubrique
Nucleic
translation, utilisez
sixpack
en modifiant les
paramètres suivants :
ORF at the begining of the sequence: No
ORF at the end of the sequence: No
ORF start with an M : yes
Minimum size of ORFs=30
Regardez les
traductions dans les différents cadres de lecture
(les zones en
majuscules sont des ORF potentielles (régions entre 2 codons Stop, plus grandes que 30 AA après traduction).
Quelle ORF vous paraît être la
plus probable ? Pourquoi ?
2- Utilisez
maintenant le programme ORF Finder au NCBI pour
refaire la recherche
d'ORF :
Interprétez
le graphique obtenu.
Notez bien les positions de l'ORF.
Récupérez la séquence protéique. Collez cette séquence
dans l'éditeur.
III- Comparaison de séquences
Vous
devez maintenant vérifier que cette protéine est bien
l'homologue chez la souris de la protéine THAP humaine.
1- Il vous faut
donc d'abord déduire la protéine THAP humaine de sa séquence
d'ADNc : choisissez la méthode que vous voulez.
Pourquoi la protéine
correspond-elle à la totalité de la séquence nucléique ?
Collez la protéine
déduite dans l'éditeur.
2- Retournez sur EMBOSS,
dans la rubrique
Alignment global, utilisez needle
pour
aligner
les séquences protéiques de souris et humaine.
-
Quelle est votre conclusion ?
3- De la même manière, comparez les séquences d'ADNc : quelles
sont vos conclusions ?
IV-
Amplification par PCR et clonage
Vous voulez maintenant amplifier par PCR la séquence
codante de l'ARNm de THAP1 murine, puis la cloner dans un
vecteur.
1- A partir de
la séquence de l'ARNm NM_199042.2, faites une recherche
d'amorces PCR avec le programme Primer3
Pour amplifier la zone souhaitée, vous pourrez mettre comme paramètres :
Targets :
283,1 915,1
Excluded Regions
: 280,650
N'hésitez pas à regarder aussi
les autres paramètres !
Notez les positions
des
oligonucléotides.
Pour le clonage dans un vecteur, vous devez établir la
carte de restriction de la séquence et trouver des sites de restriction
uniques, aux extrémités du produit PCR.
2- Vous devez d'abord extraire le fragment amplifié par PCR : utiliser extractseq (rubrique Edit) de la suite
EMBOSS.
3- Puis faites la digestion du produit PCR avec Web
Map Preferences. (Cliquez sur
)
Trouvez-vous des enzymes qui
permettraient de cloner toute la séquence codante ?
Quelle(s) solution(s) pouvez-vous proposer ?
Principaux résultats :
Blastn
avec la sonde contre les
séquences de souris
Recherche
d'ORF avec sixpack
sur NM_199042.2
Recherche
d'ORF avec ORF finder
sur NM_199042.2
Alignement
des protéines avec needle
Alignement
des ADNc avec needle
Résultat
de Primer3
Résultat de
Web Map Preferences