Bioinformatica e Web 2.0

Inside Bioinfo

22 novembre 2007 - 13:56

GALAXY (finalmente la genomica for dummies!)

Una nuova spettacolare piattaforma è ora disponibile per ogni bioinformatico pigro (categoria sempre piu’ corposa) :-)
Galaxy è un nuovo servizio che fa faville per comodità, portabilità e utilizzo.
Fate attenzione Galaxy da’ dipendenza. Non è semplicemente un altro tool, è invece un nuovo approccio vero e proprio all’analisi dei dati genomici.
Di cosa si tratta?
Come esplicitamente dichiarato nel wiki, Galaxy è una piattaforma disegnata per due comunità che raramente comunicano tra loro:
i biologi sperimentaliI really have no time to program but I want to do whole-genome analyses to find targets for experimental validation“, e i biologi computazionaliI develop algorithms but have no time to develop interfaces”.

L’idea di fondo è quella di sfruttare la sostanziale standardizzazione dei dati genomici che vengono prodotti negli angoli più
riposti del mondo e messi a disposizione in tabelle dell UCBS browser. Spesso le analisi genomiche, massive o finalizzate che siano, si possono condensare nell’applicazione di operazioni di filtraggio, conversione, data mining manipulation o analisi statistiche (più o meno adeguate). Naturalmente, le medesime operazioni su dati diversi generano risultati diversamente significativi, e necessitano successivamente una forte componente interpretativa.

Perchè allora non condividere tutti gli aspetti computazionali su un’unica piattaforma?

Ecco che allora Galaxy mette a disposizione un’interfaccia comodissima, per implementare l’upload dei propri dati, navigarci dentro, esaminarli, e quant’altro.

Ma questo non è tutto. Il sistema è costruito per permettere anche la customizzazione dei tools! Immaginate di aver realizzato uno spettacolare script in Perl in grado di fare l’analisi statistica piu’ raffinata al mondo.

>perl toolExample.pl $input $option1 $option2 $output

In pochi semplici passi potete inserirlo nella vostra directory personale “/myTools”, creando un file xml di configurazione
che vada ad indicare a Galaxy i dettagli di esecuzione:

<tool id=”chip-chip_analysis" name=”PeakPicker">
<description>Finding Peaks in a GFF Nimblegen File</description>
<command interpreter="perl">toolExample.pl $input $option1 $option2 $output</command>
<inputs>
<param format=”gff" name="input" type="data" label="Source file"/>
<param name=”option1" type=”integer” label=”Option 1" />
<param name=”option2" type="data_column" data_ref="input" numerical="True" label=”Option 2" />
</inputs>
<outputs>
<data format=”bed" name="output" />
</outputs>
</tool>

E a quel punto avrete a vostra disposizione nella colonna dei tools il vostro Script, integrato perfettamente all’interfaccia.
Magia!

Update: Ecco, grazie al bioamico Matteo Cesaroni una bella presentazione di Galaxy via slideshare, da cui avevo tratto ispirazione per il post. Lo trovate su Bioinfusion, grazie alle mille potenzialità di wordpress!

Related Posts

  1. Wired Science: Comunicare la scienza (for dummies)
  2. PCR song (La ricerca va a braccetto con la musica)
  3. La proprietà transitiva della Bioinformatica
  4. In arrivo la beta di MyExperiment!
Tags: analisi dati, bioinformatica, Galaxy, Genomica
  • Riccardo Fallini - 22 novembre 2007 # 1

    Davvero una segnalazione interessante!
    Continua cosi ;-)

    Riccardo

  • dalloliogm - 26 novembre 2007 # 2

    E’ molto buono Galaxy: lo conosco da un po’ di tempo.

    Personalmente non l’ho mai usato piu’ di tanto, pero’ mi piacerebbe provare ad installarlo in locale.

    Credo che uno degli sviluppatori partecipi anche al progetto biopython.

 

RSS feed per i commenti di questo post | TrackBack URI