mappatura con python

Forum

Registrati Discussioni Recenti Preferiti Utenti Cerca Regolamento RSS Statistiche

Utilità

I libri
consigliati:

Genetica del comportamento
Autori Vari

Dove ci porta la scienza
Alberto Oliverio

Il gene VI
Benjamin Lewin

Altri Libri

Nome Utente:	Password:
Riconoscimi automaticamente

Tutti i Forum

Laboratorio

Bioinformatica e Biostatistica

mappatura con python

Nuova Discussione

Nuovo Sondaggio

Rispondi

Aggiungi ai Preferiti

Cerca nelle discussioni

Risorse di Bioinformatica: Guide tools online Blog InsideBioinfo Siti di Bioinformatica Protocolli Ultime notizie	Pagina Precedente

Aggiungi i tag

Quanto � utile/interessante questa discussione:

Autore

Discussione

Pagina: di 2

dallolio_gm
Moderatore

Prov.: Bo!
Citt�: Barcelona/Bologna

2445 Messaggi

Inserito il - 28 maggio 2009 : 23:32:42

Citazione:
come faccio a creare delle matrici? questo mi porter� ad una maggiore velocit�?

Con una matrice (un dotplot) ti eviti di dover ricominciare da capo l'allineamento quando lo riesegui con una sequenza pi� corta di una base.

codice di esempio:

""" a simple dotplot"""

seq = 'CTGCTACG'
genome = 'GCATGTCGAGACTGCTACGCTGCTACTGCTAGCAAAAAAATACGAAGC'

# print upper header
print '-',
for j in genome: print (j),

# print the matrix
for i in seq:
    print ('\n' + i),
    for j in genome:
        if i == j:
            print ('X'),
        else:
            print (' '),

output di esempio:


- G C A T G T C G A G A C T G C T A C G C T G C T A C T G C T A G C A A A A A A A T A C G A A G C 
C   x         x         x     x     x   x     x     x     x       x                   x         x 
T       x   x             x     x         x     x     x     x                     x               
G x       x     x   x       x         x     x           x       x                       x     x   
C   x         x         x     x     x   x     x     x     x       x                   x         x 
T       x   x             x     x         x     x     x     x                     x               
A     x           x   x           x               x           x     x x x x x x x   x     x x     
C   x         x         x     x     x   x     x     x     x       x                   x         x 
G x       x     x   x       x         x     x           x       x                       x     x

Vedi che ad un certo punto vi * una diagonale completa? Quella corrisponde all'allineamento esatto della tua sequenza sul genoma.
Ti basta creare questa matrice, e poi cercare al suo interno una diagonale completa. Se ti fai i calcoli, vedi che � computazionalmente molto pi� veloce cercare il match di una base alla volta piuttosto che il match di una sequenza pi� lunga.


- G C A T G T C G A G A C T G C T A C G C T G C T A C T G C T A G C A A A A A A A T A C G A A G C 
C   x         x         x     x     x   x     x     x     x       x                   x         x 
T       x   x             x     x         x     x     x     x                     x               
G x       x     x   x       x         x     x           x       x                       x     x   
C   x         x         x     x     x   x     x     x     x       x                   x         x 
T       x   x             x     x         x     x     x     x                     x               
A     x           x   x           x               x           x     x x x x x x x   x     x x     
C   x         x         x     x     x   x     x     x     x       x                   x         x 
G x       x     x   x       x         x     x           x       x                       x     x

Inoltre, nel caso non riuscissi a trovare una diagonale completa, ti basterebbe eliminare l'ultima riga e ripetere la ricerca.

Puoi trovare del codice migliore del mio in questi appunti: http://www.biocomp.unibo.it/piero/corso/note/node71.html , e inoltre, potresti usare numpy per lavorare con le matrici.

In ogni caso, questo corrisponderebbe a riscrivere un programma di allineamento.
Io piuttosto utilizzerei exonerate oppure cercherei quali programmi di assembly vengono utilizzati per problemi simili.

Il mio blog di bioinformatics (inglese): BioinfoBlog
Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-)

HnACP
Nuovo Arrivato

Prov.: MI
Citt�: Milano

78 Messaggi

Inserito il - 09 giugno 2009 : 09:47:07

alla fine si � rilevata la soluzione migliore!
grazie!

dallolio_gm
Moderatore

Prov.: Bo!
Citt�: Barcelona/Bologna

2445 Messaggi

Inserito il - 08 luglio 2009 : 12:38:38

A quale situazione ti riferisci? :)

Qui una lista di tool per allineare piccole sequenze e assemblarle:
- http://www.sanger.ac.uk/Users/lh3/NGSalign.shtml