Forum

Nome Utente:
Password:
Riconoscimi automaticamente
 Tutti i Forum
 Laboratorio
 Bioinformatica e Biostatistica
 mappatura con python
 Nuova Discussione  Nuovo Sondaggio Nuovo Sondaggio
 Rispondi Aggiungi ai Preferiti Aggiungi ai Preferiti
Cerca nelle discussioni
I seguenti utenti stanno leggendo questo Forum Qui c'è:
Pagina Precedente

Aggiungi Tag Aggiungi i tag

Quanto è utile/interessante questa discussione:

Autore Discussione
Pagina: di 2

dallolio_gm
Moderatore


Prov.: Bo!
Città: Barcelona/Bologna


2445 Messaggi

Inserito il - 28 maggio 2009 : 23:32:42  Mostra Profilo  Visita l'Homepage di dallolio_gm  Clicca per vedere l'indirizzo MSN di dallolio_gm Invia a dallolio_gm un Messaggio Privato  Rispondi Quotando
Citazione:
come faccio a creare delle matrici? questo mi porterà ad una maggiore velocità?


Con una matrice (un dotplot) ti eviti di dover ricominciare da capo l'allineamento quando lo riesegui con una sequenza più corta di una base.

codice di esempio:
""" a simple dotplot"""

seq = 'CTGCTACG'
genome = 'GCATGTCGAGACTGCTACGCTGCTACTGCTAGCAAAAAAATACGAAGC'

# print upper header
print '-',
for j in genome: print (j),

# print the matrix
for i in seq:
    print ('\n' + i),
    for j in genome:
        if i == j:
            print ('X'),
        else:
            print (' '),


output di esempio:

- G C A T G T C G A G A C T G C T A C G C T G C T A C T G C T A G C A A A A A A A T A C G A A G C 
C   x         x         x     x     x   x     x     x     x       x                   x         x 
T       x   x             x     x         x     x     x     x                     x               
G x       x     x   x       x         x     x           x       x                       x     x   
C   x         x         x     x     x   x     x     x     x       x                   x         x 
T       x   x             x     x         x     x     x     x                     x               
A     x           x   x           x               x           x     x x x x x x x   x     x x     
C   x         x         x     x     x   x     x     x     x       x                   x         x 
G x       x     x   x       x         x     x           x       x                       x     x  

Vedi che ad un certo punto vi * una diagonale completa? Quella corrisponde all'allineamento esatto della tua sequenza sul genoma.
Ti basta creare questa matrice, e poi cercare al suo interno una diagonale completa. Se ti fai i calcoli, vedi che é computazionalmente molto più veloce cercare il match di una base alla volta piuttosto che il match di una sequenza più lunga.


- G C A T G T C G A G A C T G C T A C G C T G C T A C T G C T A G C A A A A A A A T A C G A A G C 
C   x         x         x     x     x   x     x     x     x       x                   x         x 
T       x   x             x     x         x     x     x     x                     x               
G x       x     x   x       x         x     x           x       x                       x     x   
C   x         x         x     x     x   x     x     x     x       x                   x         x 
T       x   x             x     x         x     x     x     x                     x               
A     x           x   x           x               x           x     x x x x x x x   x     x x     
C   x         x         x     x     x   x     x     x     x       x                   x         x 
G x       x     x   x       x         x     x           x       x                       x     x  

Inoltre, nel caso non riuscissi a trovare una diagonale completa, ti basterebbe eliminare l'ultima riga e ripetere la ricerca.

Puoi trovare del codice migliore del mio in questi appunti: http://www.biocomp.unibo.it/piero/corso/note/node71.html , e inoltre, potresti usare numpy per lavorare con le matrici.

In ogni caso, questo corrisponderebbe a riscrivere un programma di allineamento.
Io piuttosto utilizzerei exonerate oppure cercherei quali programmi di assembly vengono utilizzati per problemi simili.

Il mio blog di bioinformatics (inglese): BioinfoBlog
Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-)
Torna all'inizio della Pagina

HnACP
Nuovo Arrivato


Prov.: MI
Città: Milano


78 Messaggi

Inserito il - 09 giugno 2009 : 09:47:07  Mostra Profilo  Visita l'Homepage di HnACP Invia a HnACP un Messaggio Privato  Rispondi Quotando
alla fine si è rilevata la soluzione migliore!
grazie!
Torna all'inizio della Pagina

dallolio_gm
Moderatore


Prov.: Bo!
Città: Barcelona/Bologna


2445 Messaggi

Inserito il - 08 luglio 2009 : 12:38:38  Mostra Profilo  Visita l'Homepage di dallolio_gm  Clicca per vedere l'indirizzo MSN di dallolio_gm Invia a dallolio_gm un Messaggio Privato  Rispondi Quotando
A quale situazione ti riferisci? :)

Qui una lista di tool per allineare piccole sequenze e assemblarle:
- http://www.sanger.ac.uk/Users/lh3/NGSalign.shtml

Il mio blog di bioinformatics (inglese): BioinfoBlog
Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-)
Torna all'inizio della Pagina
Pagina: di 2 Discussione  

Quanto è utile/interessante questa discussione:

Pagina Precedente
 Nuova Discussione  Nuovo Sondaggio Nuovo Sondaggio
 Rispondi Aggiungi ai Preferiti Aggiungi ai Preferiti
Cerca nelle discussioni
Vai a:
MolecularLab.it © 2003-18 MolecularLab.it Torna all'inizio della Pagina