Bioinformatica e Web 2.0

Inside Bioinfo

22 gennaio 2008 - 11:56

Openhelix (una risorsa importante per il bioinformatico)

La Newsletter del Bioforum mi fa notare l’apertura di un nuovo blog : OPENHELIX focalizzato su genomica e risorse bioinformatiche.
Secondo le intenzioni degli autori il blog dovrebbe essere uno strumento per rimanere aggiornati riguardo i cambiamenti delle risorse presenti in rete e i vari database genomici. MA NON SOLO. Il blog è strutturato in modo che, insieme ai post quotidiani, viene messo a disposizione, di solito al mercoledì, un “TIP of the WEEK“, ovvero un breve video di circa 4 minuti che descriva, all’uso pratico, come ottenere il meglio dai database disponibili, sottolineando nuove funzioni, o metodologie per estrarre informazioni “nascoste“.

Certo è che, nei Tips vi sono dei tutorial ottimamente fatti. La qualità è veramente elevata!
Ma non è tutto: insieme ai Tips, settimanalmente verra’ proposto un’area “What’s Your Problem?”, dove il lettore potrà proporre quesiti e aspettarsi quindi risposte competenti riguardo per esempio come poter estrarre le informazioni che gli servono da una specifica risorsa. Una specie di help desk personalizzato.
Vi lascio infine immaginare il contenuto di un’ultima sessione, chiamata “Guest Post:-)

Personalmente seguo con avidità questa nuova risorsa, e non mancherò di sottoporvi alcuni loro Tips che reputo di particolare interesse. Eccovi intanto il loro feed principale. Sono sicuro che questo nuovo blog – se mantiene le promesse – diventerà sempre più una risorsa indispensabile!

Tags: bioinformatica, Blog, Database, Genomica, Openhelix
22 novembre 2007 - 13:56

GALAXY (finalmente la genomica for dummies!)

Una nuova spettacolare piattaforma è ora disponibile per ogni bioinformatico pigro (categoria sempre piu’ corposa) :-)
Galaxy è un nuovo servizio che fa faville per comodità, portabilità e utilizzo.
Fate attenzione Galaxy da’ dipendenza. Non è semplicemente un altro tool, è invece un nuovo approccio vero e proprio all’analisi dei dati genomici.
Di cosa si tratta?
Come esplicitamente dichiarato nel wiki, Galaxy è una piattaforma disegnata per due comunità che raramente comunicano tra loro:
i biologi sperimentaliI really have no time to program but I want to do whole-genome analyses to find targets for experimental validation“, e i biologi computazionaliI develop algorithms but have no time to develop interfaces”.

L’idea di fondo è quella di sfruttare la sostanziale standardizzazione dei dati genomici che vengono prodotti negli angoli più
riposti del mondo e messi a disposizione in tabelle dell UCBS browser. Spesso le analisi genomiche, massive o finalizzate che siano, si possono condensare nell’applicazione di operazioni di filtraggio, conversione, data mining manipulation o analisi statistiche (più o meno adeguate). Naturalmente, le medesime operazioni su dati diversi generano risultati diversamente significativi, e necessitano successivamente una forte componente interpretativa.

Perchè allora non condividere tutti gli aspetti computazionali su un’unica piattaforma?

Ecco che allora Galaxy mette a disposizione un’interfaccia comodissima, per implementare l’upload dei propri dati, navigarci dentro, esaminarli, e quant’altro.

Ma questo non è tutto. Il sistema è costruito per permettere anche la customizzazione dei tools! Immaginate di aver realizzato uno spettacolare script in Perl in grado di fare l’analisi statistica piu’ raffinata al mondo.

>perl toolExample.pl $input $option1 $option2 $output

In pochi semplici passi potete inserirlo nella vostra directory personale “/myTools”, creando un file xml di configurazione
che vada ad indicare a Galaxy i dettagli di esecuzione:

<tool id=”chip-chip_analysis" name=”PeakPicker">
<description>Finding Peaks in a GFF Nimblegen File</description>
<command interpreter="perl">toolExample.pl $input $option1 $option2 $output</command>
<inputs>
<param format=”gff" name="input" type="data" label="Source file"/>
<param name=”option1" type=”integer” label=”Option 1" />
<param name=”option2" type="data_column" data_ref="input" numerical="True" label=”Option 2" />
</inputs>
<outputs>
<data format=”bed" name="output" />
</outputs>
</tool>

E a quel punto avrete a vostra disposizione nella colonna dei tools il vostro Script, integrato perfettamente all’interfaccia.
Magia!

Update: Ecco, grazie al bioamico Matteo Cesaroni una bella presentazione di Galaxy via slideshare, da cui avevo tratto ispirazione per il post. Lo trovate su Bioinfusion, grazie alle mille potenzialità di wordpress!

Tags: analisi dati, bioinformatica, Galaxy, Genomica