Forum

Nome Utente:
Password:
Riconoscimi automaticamente
 Tutti i Forum
 Laboratorio
 Bioinformatica e Biostatistica
 Problemi nella risoluzione
 Nuova Discussione  Nuovo Sondaggio Nuovo Sondaggio
 Rispondi Aggiungi ai Preferiti Aggiungi ai Preferiti
Cerca nelle discussioni
I seguenti utenti stanno leggendo questo Forum Qui c'è:

Aggiungi Tag Aggiungi i tag

Quanto è utile/interessante questa discussione:

Autore Discussione  

Bruce
Nuovo Arrivato



6 Messaggi

Inserito il - 25 gennaio 2008 : 12:34:17  Mostra Profilo  Visita l'Homepage di Bruce Invia a Bruce un Messaggio Privato  Rispondi Quotando
Io dovrei risolvere questo esercizo:

Fare una ricerca di omologia nella banca dati di proteine usando la transtiretina umana (NP_000362).

1) quante sono le sequenze con somiglianza significativa (E<10-5)?
2) quale è la percentuale di identità con la sequenza più significativa in topo?
3) Sono presenti sequenze omologhe nei batteri?

Per farlo ho preso il codice NP_000362 e l'ho inserito in entrez->protein, dopo di che ho selezionato l'unico risultato che mi da, poi FASTA ed ho ottenuto la sequenza.
Ho aperto Blastp, ho inserito la sequenza, negli alghortim parameters ho inserito 0.00001 come limitizione ed ho premuto BLAST.
Ora mi vengono tutti i risultati della ricerca blast ma da tutti questi valori non riesco a trarre alcuna risposta alle tre domande che mi pone l'esercizio. Che devo fare ora e soprattutto finora i passaggi sono corretti oppure la sequenza che prendo è errata?
per la cronoca la sequanza che ottengo è:
MASHRLLLLCLAGLVFVSEAGPTGTGESKCPLMVKVLDAVRGSPAINVAVHVFRKAADDTWEPFASGKTS
ESGELHGLTTEEEFVEGIYKVEIDTKSYWKALGISPFHEHAEVVFTANDSGPRRYTIAALLSPYSYSTTA
VVTNPKE

Anticipatamente ringrazio
Mario

kORdA
Utente Attivo

newkORdA

Prov.: Milano
Città: Monza


1303 Messaggi

Inserito il - 25 gennaio 2008 : 12:55:20  Mostra Profilo  Visita l'Homepage di kORdA  Clicca per vedere l'indirizzo MSN di kORdA Invia a kORdA un Messaggio Privato  Rispondi Quotando
Partendo dalla sequenza che hai postato, con tre blastate veloci:

1 - Di sequenze significative ce ne sono un catafurgione: restringendo la ricerca solo sui PDB ho trovato 37 entry

Per restringere la ricerca su specie o generi, è sufficiente specificarlo nel campo opzionale Organism dell'interfaccia di blastp:

2 - La prima sequenza di topo allineata trovata è questa:

>ref|NP_038725.1| UniGene infoGene info transthyretin [Mus musculus]
sp|P07309|TTHY_MOUSE Gene info Transthyretin precursor (Prealbumin)
dbj|BAA00050.1| Gene info prealbumin [Mus musculus]
emb|CAA27057.1| UniGene infoGene info prealbumin [Mus musculus]
dbj|BAA13757.1| UniGene infoGene info prealbumin [Mus musculus]
dbj|BAB31352.1| UniGene infoGene info unnamed protein product [Mus musculus]
gb|AAH24702.1| UniGene infoGene info Ttr protein [Mus musculus]
dbj|BAC34098.1| UniGene infoGene info unnamed protein product [Mus musculus]
dbj|BAC35839.1| UniGene infoGene info unnamed protein product [Mus musculus]
gb|AAH86926.1| UniGene infoGene info Transthyretin [Mus musculus]
gb|EDK96952.1| Gene info transthyretin [Mus musculus]
prf||1201237A prealbumin
Length=147

GENE ID: 22139 Ttr | transthyretin [Mus musculus] (Over 100 PubMed links)

Score = 254 bits (648), Expect = 5e-68, Method: Compositional matrix adjust.
Identities = 120/147 (81%), Positives = 135/147 (91%), Gaps = 0/147 (0%)

Query 1 MASHRLLLLCLAGLVFVSEAGPTGTGESKCPLMVKVLDAVRGSPAINVAVHVFRKAADDT 60
MAS RL LLCLAGLVFVSEAGP G GESKCPLMVKVLDAVRGSPA++VAV VF+K ++ +
Sbjct 1 MASLRLFLLCLAGLVFVSEAGPAGAGESKCPLMVKVLDAVRGSPAVDVAVKVFKKTSEGS 60

Query 61 WEPFASGKTSESGELHGLTTEEEFVEGIYKVEIDTKSYWKALGISPFHEHAEVVFTANDS 120
WEPFASGKT+ESGELHGLTT+E+FVEG+Y+VE+DTKSYWK LGISPFHE A+VVFTANDS
Sbjct 61 WEPFASGKTAESGELHGLTTDEKFVEGVYRVELDTKSYWKTLGISPFHEFADVVFTANDS 120

Query 121 GPRRYTIAALLSPYSYSTTAVVTNPKE 147
G R YTIAALLSPYSYSTTAVV+NP+
Sbjct 121 GHRHYTIAALLSPYSYSTTAVVSNPQN 147



3 - Mentre la prima sequenza batterica:

>ref|ZP_01101052.1| Transthyretin-like protein [gamma proteobacterium KT 71]
gb|EAQ99153.1| Transthyretin-like protein [Congregibacter litoralis KT71]
Length=113

Score = 69.7 bits (169), Expect = 2e-11, Method: Compositional matrix adjust.
Identities = 39/108 (36%), Positives = 58/108 (53%), Gaps = 3/108 (2%)

Query 32 LMVKVLDAVRGSPAINVAVHVFRKAADDTWEPFASGKTSESGELHGLTTEEEFV-EGIYK 90
+ +LD RG PA V + +F + D W ASG T+E G + GL + + G Y+
Sbjct 4 ITTHILDTARGCPAAGVPLALFHRQ-DSDWVEIASGTTNEDGRVAGLLDGDRVLPAGTYR 62

Query 91 VEIDTKSYWKALGISPFHEHAEVVFTANDSGPRRYTIAALLSPYSYST 138
+ T Y+ AL ++ F+ + +VVF +D G Y I LLSP+ YST
Sbjct 63 MHFATGGYFSALDLNIFYPYVDVVFNLDDGG-EHYHIPLLLSPFGYST 109


http://www.linkedin.com/in/dariocorrada
Torna all'inizio della Pagina

Bruce
Nuovo Arrivato



6 Messaggi

Inserito il - 25 gennaio 2008 : 13:25:01  Mostra Profilo  Visita l'Homepage di Bruce Invia a Bruce un Messaggio Privato  Rispondi Quotando
Ho provato a fare quanto hai fatto tu ma non mi escono le 37 che dici tu o meglio non capisco nemmeno dove andare per ottenerle.
Per quanto riguarda il punto 2 ed il 3 quali sono i termini ch devo inserire nella limitazione sono topo e batteri oppure mus musculus prima e bactery dopo?
Grazie
Torna all'inizio della Pagina

kORdA
Utente Attivo

newkORdA

Prov.: Milano
Città: Monza


1303 Messaggi

Inserito il - 25 gennaio 2008 : 16:23:14  Mostra Profilo  Visita l'Homepage di kORdA  Clicca per vedere l'indirizzo MSN di kORdA Invia a kORdA un Messaggio Privato  Rispondi Quotando
3 screenshot chiari chiari









http://www.linkedin.com/in/dariocorrada
Torna all'inizio della Pagina
  Discussione  

Quanto è utile/interessante questa discussione:

 Nuova Discussione  Nuovo Sondaggio Nuovo Sondaggio
 Rispondi Aggiungi ai Preferiti Aggiungi ai Preferiti
Cerca nelle discussioni
Vai a:
MolecularLab.it © 2003-18 MolecularLab.it Torna all'inizio della Pagina