non riesco ad interpretare correttamente l'entries di ncbi: NM_033011, del "Tissue-type plasminogen activator Precursor". Mi dice che il trascritto è lungo 3035 pb e mi da per polyAsyte 2520: contrariamente però a tutte le altre entries che ho esaminato, dopo quel numero non ci sono tutte A. Io ho pensato che ciò fosse dovuto al fattore di cleavage che taglia in corrispondenza del nt 2520 dell'mRNA e aggiunge lì la coda di polyA. E' un'interpretazione corretta?
esaminando il trascritto su ensembl e ucsc la lunghezza data è sempre di 3035 e mi è venuto il dubbio che in realtà l'indicazione di ncbi sul polyA_syte potesse essere sbagliata. Per determinare la sequenza del trascritto da 2520 a 3035, nel caso in cui avvenga il taglio come ho pensato io, si sarebbero dovuti utilizzare come stampo trascritti non ancora polyadenilati, il che mi sembra strano!
Può succedere che ci siano errori nelle entries. Le sequenze vengono caricate tramite un processo semi-automatizzato, e qualcosa può sempre sfuggire. Ti conviene fare presente il problema ai gestori di genbank, e controllare che il numero di versione della sequenza sia il più alto fra quelli disponibili.
Il mio blog di bioinformatics (inglese): BioinfoBlog Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-)