Bioinformatica e Web 2.0

Inside Bioinfo

23 novembre 2008 - 18:11

BioPython 1.50 e GenomeDiagram

La versione 1.49 di BioPython é stata rilasciata ufficialmente alcuni giorni fa, ed é piena di cambiamenti interessanti: uno di questi é l’introduzione del modulo doctest per la documentazione di alcune classi, cosa che avevo proposto io qualche tempo fa :) .

Comunque, credo che siano in arrivo novità ancora migliori nella 1.50. Una delle mie favorite é l’inclusione di un modulo chiamato GenomeDiagrams, che finalmente permetterà di generare diagrammi di sequenze e genomi direttamente da biopython.

Ecco un esempio di immagine generata con questa libreria:

Circular diagram of Erwinia carotovora ssp. atroseptica comparison against 229 bacterial genomes, constructed using GenomeDiagram

Credo che a biopython avesse veramente bisogno di integrazione con una libreria grafica come questa, visto che altri progetti Bio::* lo possiedono già.

Per esempio, é veramente semplice disegnare un diagramma di sequenze con bioperl:

A plot of sequence features with bioperl
A plot of sequence features with bioperl

Immagino che un diagramma equivalente, generato con il nuovo modulo di biopython, apparirà così:

A linear genome diagram created with the new biopython module
A linear genome diagram created with the new GenomeDiagram module

Devo ancora studiare a fondo il modulo, e non sono sicuro di quanto sia flessibile e facile da utilizzare. In ogni caso, siamo solo alla prima release :) .

Il modulo GenomeDiagram é stato scritto da Leighton Pritchard, e descritto in questo articolo:

Dovrebbe essere veramente ringraziato per questo contributo. Qui potete trovare la home page del module, e qui la proposta sul bug tracker di biopython.

Tags: bioinformatica, biopython, diagrammi, librerie grafiche, programmazione, python
9 febbraio 2008 - 13:06

Gioco di ruolo per bioinformatici

Su bioinformaticszen é apparso un posto molto spiritoso che equipara la scelta della propria carriera come bioinformatico alla creazione di un personaggio in un gioco di ruolo. Che tipo di personaggio/giocatore siete?

Ecco il link originale all’articolo:

Per fare qualche esempio, provo a tradurre i principali ‘archetipi’ di bioinformatico che vi potete creare:

  • Virtuoso di Linux (LV): il percorso del Virtuoso di Linux si specializza nell’uso di software e tool opensource , ma ottiene vantaggio anche dalla potenza del sistema operativo Linux.
    Utilizzando kernel compilati e ottimizzati per i loro computer a 8 core e 4 schermi, i LV hanno sempre installato in locale la ultima versione di qualsiasi database biologico, e la versione più recente di qualsiasi tool.
    Il LV conduce la propria ricerca dalla linea di comando: script di bash scritti con vim e concatenati insieme da pipes di shell.

  • Early Adopter (EA): questo personaggio lavora sempre nell’area di ricerca più recente, systems biology, synthetic biology, personal genomics, e cavalca sempre l’onda degli argomenti scientifici più recenti.
    Tutti i suoi script sono accessibili come servizi web, cosa necessaria dato che l’EA ha cambiato linguaggio di programmazione per 4 volte negli ultimi 3 anni.
    E i suoi dati? Sono tutti disponibili in formato OWL RDF sul suo sito web 2.0 programmato in ruby on rails.

  • Old School (OS): per qualche aspetto il contrario dell’EA, il bioinformatico vecchia scuola ha una grande determinazione nel porre quesiti, e quindi trovare risposte a importanti quesiti di ricerca. Accecato dal cambiamento di tool e tecnologie, il OS porta avanti le sue ricerche in Fortran sul suo Pentium II con Windows 95. In ogni caso questo bioinformatico non deve essere sottovalutato, visto che la mancanza di distrazione significa che egli é completamente concentrato sulla ricerca, cosa che viene riflessa nella sua grossa lista di pubblicazioni.

  • Data Miner (DM): il più misterioso di tutti i percorsi di carriera per bioinformatici, il DM é maestro di tutte le cose numeriche e statistiche. I tool che utilizza nella vita quotidiana sono effetti di regressione, modelli nascosti di Markov, e il temibile algoritmo della crescita neurale del gas. Essendo capace di trovare un risultato significativo da una distribuzione normale casuale di 1000 numeri, il DM ha molti collaboratori. In ogni caso, se un DM si trova nel pubblico durante un tuo seminario devi stare attento, visto che maledicono le tue scoperte con parole strane.

  • Perfect Coder (PC): Il PC fa esattamente quello che implica il suo nome: produce programmi perfetti, senza bug. Il loro uso edemplare di nomi di variabili, commenti, e indentanzione produce codice che sembra poesia, e che anche il tuo cane potrebbe comprendere dopo uno sguardo di 5 secondi. Inoltre, pattern di design, librerie di terze parti, sviluppo portato avanti dal comportamento e logging significano che il PC non sa nemmeno cosa la parola ‘bug’ significhi. In parole povere, il codice scritto da un PC ti fa sentire felice come il giorno del tuo matrimonio e la nascita del tuo primo figlio messi assieme.

  • Wet Lab Bioinformatician (WB): uno scienziato di laboratorio, che lavora in un laboratorio di biologia classica, il WB é il supporto per tutti i problemi di biologia computazionale del laboratorio. E’ abbastanza famigliare con il perl per scrivere dei semplici script, ma la vera forza del WB non sta nello scrivere codice, ma nell’utilizzare tool. Mentre gli altri bioinformatici sono più o meno al corrente di come trovare un gene di interesse, il WB utilizza questi tool quotidianamente, e induce molti a vergognarsi sulle proprie conoscenze di bioinformatica di base. Mentre gli altri hanno la loro testa tra le nuvole di teorie e algoritmi, il WB si sporca le mani con dati reali mentre questi stanno ancora venendo prodotti.

17 ottobre 2007 - 23:52

openbiosource.org: progetto bioinformatico italiano

Diamo il benvenuto ad un altro progetto che si propone di creare un luogo di incontro e di discussione per i bioinformatici e biologi italiani: openbiosource.org

Si tratta di un progetto decisamente innovativo e interessante, che mette a disposizione un forum e diversi link utili a chiunque abbia bisogno di discutere di problematiche relative all’uso dei computer per fare ricerca scientifica.

Il tutto condito da un perfetto spirito opensource: ovvero quello di condividere le proprie conoscenze e le proprie risorse, in modo da poter crescere e imparare più velocemente.

Un po’ di competizione per noi di molecularlab forse :) …. ma non é un problema, visto che contribuisce a migliorare al livello della ricerca nel nostro Paese e in generale.

In bocca al lupo! :)

29 luglio 2007 - 18:33

I 7 peccati capitali commessi dai bioinformatici.

Stavo leggendo questo post su nodalpoint, in cui si commentava un talk presentato all’ultimo Bioinformatic Open Source Conference (come mi piace questo nome) a Vienna, una settimana fa.

Si parla degli errori piu’ grandi commessi dalla comunita’ bioinformatica moderna, e onestamente, mi trovo d’accordo su molti punti.
Ecco le slides:

http://www.slideshare.net/dullhunk/the-seven-deadly-sins-of-bioinformatics/

Vediamo un po’, di primo acchito io aggiungerei:

  • mancanza di organizzazione.
  • mancanza di comunicazione (incapacita’ di organizzarsi in un gruppo, di dialogare con gli altri colleghi, di presentare delle buone documentazioni, di studiare il lavoro degli altri, di comunicare via Internet – pensate a quanto pochi sono i bioinfi che partecipano a ML o a forum o a blogs scientifici).
  • ignoranza su molte questioni importanti legate alla programmazione: molti bioinformatici per esempio ignorano cosa sia lo Unit Testing, ovvero non testano i loro script prima di utilizzarli.
  • incapacita’ di riutilizzare il codice e le idee di altri colleghi: per esempio, pochi usano BioPython o BioPerl, preferendo scrivere tutto da soli; questo e’ quanto di peggio si possa fare se si vuole programmare bene.
  • incapacita’ di sedersi correttamente davanti al computer: in tutti i laboratori di bioinfo che ho visto, non ho mai trovato nessuno che si sedesse con la postura corretta davanti al monitor, spesso gli schermi erano troppo in basso, addirittura chi lavorava 8 ore al giorno davanti ad un portatile.

E qui mi fermo, va’.
Cmq, io credo che molti di questi difetti siano dovuti ad una mancanza di istruzione: le specialistiche in bioinfo e tutti i corsi associati non coprono per forza di cose tutti gli aspetti che dovrebbero seguire, e molti laboratori sono disorganizzati, con i responsabili che non si tengono aggiornati e spesso provengono da campi che sono solo collaterali alla bioinformatica.

22 luglio 2007 - 13:08

In arrivo la beta di MyExperiment!

myExperiment é un progetto di cui si parla da un po’ di tempo, che si propone di mettere a disposizione della comunità scientifica uno strumento simile a quello che é mySpace.

Ovvero, un luogo in cui un ricercatore possa iscriversi e creare un proprio profilo, descrivere i propri interessi e il proprio curriculum, poter interagire con altri ricercatori impegnati nello stesso campo, e poter scambiare commenti e opinioni sui propri esperimenti.

L’idea é interessante e tra l’altro arriva dagli stessi creatori di taverna, un software di cui ho parlato qualche volta e che serve per descrivere una analisi bioinformatica tramite un workflow.

Finalmente dopo alcuni anni di preparazione, é stata annunciata una versione beta funzionante a partire dal prossimo 1 agosto, aperta a tutti coloro che vogliano fare da tester.
Ecco l’annuncio ufficiale:

Devo ammettere che nemmeno a me é molto chiaro  il modo in cui questo esperimento funzionerà. Per adesso, mi sono iscritto alla beta e aspetterò il 1 agosto per vedere come funzionerà.

Un in bocca al lupo agli sviluppatori di MyExperiment!! :)

16 giugno 2007 - 14:41

The Synaptic Leap e il progetto di Tropicaldisease.org

Conoscete questo simbolo:

?

beh é piuttosto bruttino, però é il logo di the synaptic leap, una comunità di ricercatori che impegnano il loro tempo libero per sviluppare dati e possibili farmaci contro la malaria e altre malattie poco considerate dalle case farmaceutiche perché diffuse in aree del terzo mondo.

Per saperne di più potreste visitare il sito ufficiale di tropicaldisease.org dal quale é partita l’idea di questo tipo di ricerca, e poi studiarvi synapticleap che in pratica é il wiki in cui avvengono le discussioni e vengono coordinati i progetti.

Il modo migliore per contribuire a synaptic leap é partire da questa pagina di introduzione e dopodiché consultare le pagine iniziale per ognuna della comunità attive (malaria, schistostomiasi, tubercolosi, toxoplasmosi): notate che il materiale che c’è, tra feeds e spiegazioni, é di ottima qualità.

Qui un post interessante da leggere per capire cosa si può fare.

Se non sapete come partecipare o non avete tempo/conoscenze per contribuire, ci sono molti modi in cui potete dare una mano senza faticare troppo:

  • potreste suggerire un logo migliore (..);
  • dire la vostra sull’usabilità del loro sito (io non ho capito subito di cosa si trattasse, quando l’ho visto per la prima volta);
  • parlarne in giro, con amici e parenti nella vita reale;
  • spargere la voce via Internet, su blog e forum;
  • oppure se avete delle conoscenze su come organizzare un progetto opensource o un wiki per lo sviluppo collaborativo, potreste dare una mano a rendere il loro sito più usabile.
5 giugno 2007 - 21:43

Benvenuti in Inside Bioinfo!

Benvenuti in Inside Bioinfo!

Un saluto a tutti i navigatori che per un motivo o l’altro passano su queste pagine,
vi trovate davanti ad uno dei primi blog bioinformatici in italiano!! :)

Innanzitutto ci presentiamo: siamo Giovanni, Fuliggians e Riccardo, e apparteniamo a quella classe di biologi un po’ matti e pazzoidi che passano tempo a studiare materie complicate come programmazione e statistica, e informatica, per cercare di capire in che modo si può usare il computer per fare ricerca: insomma, siamo dei bioinformatici.

Qua fuori nella Internet del 2007, é possibile trovare una quantità immensa di dati di interesse scientifico: sequenze, strutture di proteine, annotazioni, articoli, mappe di interazione, protocolli, discussioni, dati di bassa qualità da controllare, osservazioni che attendono solo di essere scoperte.

Io adoro la bioinfo perché credo che solo imparando a muoversi in questo enorme mare di informazioni, di database, annotazioni e motori di ricerca, sia possibile arrivare ad intravedere o perlomeno a farsi una idea di tutto ciò che l’uomo ha scoperto sulla biologia e su come funziona il mondo che lo circonda fino ad oggi.

E’ per questo che stiamo aprendo questo blog: per avere un punto dove discutere, commentare, proporre, tutte le idee che vengono in mente a noi e al resto della comunità scientifica per affrontare una tale impresa.

Rimanete in ascolto quindi se questo vi interessa!

Un saluto dai vostri spacciatori di bioinformatica preferiti.