Bioinformatica e Web 2.0

Inside Bioinfo

23 novembre 2008 - 18:11

BioPython 1.50 e GenomeDiagram

La versione 1.49 di BioPython é stata rilasciata ufficialmente alcuni giorni fa, ed é piena di cambiamenti interessanti: uno di questi é l’introduzione del modulo doctest per la documentazione di alcune classi, cosa che avevo proposto io qualche tempo fa :) .

Comunque, credo che siano in arrivo novità ancora migliori nella 1.50. Una delle mie favorite é l’inclusione di un modulo chiamato GenomeDiagrams, che finalmente permetterà di generare diagrammi di sequenze e genomi direttamente da biopython.

Ecco un esempio di immagine generata con questa libreria:

Circular diagram of Erwinia carotovora ssp. atroseptica comparison against 229 bacterial genomes, constructed using GenomeDiagram

Credo che a biopython avesse veramente bisogno di integrazione con una libreria grafica come questa, visto che altri progetti Bio::* lo possiedono già.

Per esempio, é veramente semplice disegnare un diagramma di sequenze con bioperl:

A plot of sequence features with bioperl
A plot of sequence features with bioperl

Immagino che un diagramma equivalente, generato con il nuovo modulo di biopython, apparirà così:

A linear genome diagram created with the new biopython module
A linear genome diagram created with the new GenomeDiagram module

Devo ancora studiare a fondo il modulo, e non sono sicuro di quanto sia flessibile e facile da utilizzare. In ogni caso, siamo solo alla prima release :) In related post, checkout best rated pheromones.

Il modulo GenomeDiagram é stato scritto da Leighton Pritchard, e descritto in questo articolo:

Dovrebbe essere veramente ringraziato per questo contributo. Qui potete trovare la home page del module, e qui la proposta sul bug tracker di biopython.

Tags: bioinformatica, biopython, diagrammi, librerie grafiche, programmazione, python
9 febbraio 2008 - 13:06

Gioco di ruolo per bioinformatici

The most mysterious of all career paths for bioinformatics, the DM is the master of all numerical and statistical things. The tools he uses in everyday life are regression effects, hidden models of Markov, and the fearsome neural growth algorithm of gas.

human growth hormone is a protein produced in the body that’s important not only during childhood but also throughout adulthood. Growth hormone is provided by the pituitary gland, which is known as the “master gland” because it secretes many hormones that control the actions of other organs according to DoctorTipster.com.

Being able to find a significant result from a normal random distribution of 1000 numbers, the DM has many collaborators. In any case, if a DM is in the audience during your seminar you have to be careful, since they curse your discoveries with strange words.

  • The PC does exactly what its name implies: it produces perfect programs, without bugs. Their use and example of variable names, comments, and indentation produces code that looks like poetry, and that your dog could also understand after a 5-second look. Furthermore, design patterns, third-party libraries, development brought about by behavior and logging mean that the PC does not even know what the word ‘bug’ means. In other words, the code written by a PC makes you feel happy like the day of your marriage and the birth of your first child put together.
  • (WB): a laboratory scientist working in a classical biology laboratory, the WB is the support for all laboratory computational biology problems. It is quite familiar with the perl to write simple scripts, but the real strength of the WB is not to write code, but to use tools. While other bioinformatics are more or less aware of how to find a gene of interest, the WB uses these tools daily, and causes many to be ashamed of their basic bioinformatics knowledge. While others have their heads in the clouds of theories and algorithms, the WB gets its hands dirty with real data while they are still being produced. In other related news, checkout this review of the best supplements for chronic fatigue supplement.
17 ottobre 2007 - 23:52

openbiosource.org: progetto bioinformatico italiano

Diamo il benvenuto ad un altro progetto che si propone di creare un luogo di incontro e di discussione per i bioinformatici e biologi italiani: openbiosource.org

Si tratta di un progetto decisamente innovativo e interessante, che mette a disposizione un forum e diversi link utili a chiunque abbia bisogno di discutere di problematiche relative all’uso dei computer per fare ricerca scientifica.

Il tutto condito da un perfetto spirito opensource: ovvero quello di condividere le proprie conoscenze e le proprie risorse, in modo da poter crescere e imparare più velocemente.

Un po’ di competizione per noi di molecularlab forse :) …. ma non é un problema, visto che contribuisce a migliorare al livello della ricerca nel nostro Paese e in generale.

In bocca al lupo! :)

29 luglio 2007 - 18:33

I 7 peccati capitali commessi dai bioinformatici.

Stavo leggendo questo post su nodalpoint, in cui si commentava un talk presentato all’ultimo Bioinformatic Open Source Conference (come mi piace questo nome) a Vienna, una settimana fa.

Si parla degli errori piu’ grandi commessi dalla comunita’ bioinformatica moderna, e onestamente, mi trovo d’accordo su molti punti.
Ecco le slides:

http://www.slideshare.net/dullhunk/the-seven-deadly-sins-of-bioinformatics/

Vediamo un po’, di primo acchito io aggiungerei:

  • mancanza di organizzazione.
  • mancanza di comunicazione (incapacita’ di organizzarsi in un gruppo, di dialogare con gli altri colleghi, di presentare delle buone documentazioni, di studiare il lavoro degli altri, di comunicare via Internet – pensate a quanto pochi sono i bioinfi che partecipano a ML o a forum o a blogs scientifici).
  • ignoranza su molte questioni importanti legate alla programmazione: molti bioinformatici per esempio ignorano cosa sia lo Unit Testing, ovvero non testano i loro script prima di utilizzarli.
  • incapacita’ di riutilizzare il codice e le idee di altri colleghi: per esempio, pochi usano BioPython o BioPerl, preferendo scrivere tutto da soli; questo e’ quanto di peggio si possa fare se si vuole programmare bene.
  • incapacita’ di sedersi correttamente davanti al computer: in tutti i laboratori di bioinfo che ho visto, non ho mai trovato nessuno che si sedesse con la postura corretta davanti al monitor, spesso gli schermi erano troppo in basso, addirittura chi lavorava 8 ore al giorno davanti ad un portatile.

E qui mi fermo, va’.
Cmq, io credo che molti di questi difetti siano dovuti ad una mancanza di istruzione: le specialistiche in bioinfo e tutti i corsi associati non coprono per forza di cose tutti gli aspetti che dovrebbero seguire, e molti laboratori sono disorganizzati, con i responsabili che non si tengono aggiornati e spesso provengono da campi che sono solo collaterali alla bioinformatica.

22 luglio 2007 - 13:08

In arrivo la beta di MyExperiment!

myExperiment é un progetto di cui si parla da un po’ di tempo, che si propone di mettere a disposizione della comunità scientifica uno strumento simile a quello che é mySpace.

Ovvero, un luogo in cui un ricercatore possa iscriversi e creare un proprio profilo, descrivere i propri interessi e il proprio curriculum, poter interagire con altri ricercatori impegnati nello stesso campo, e poter scambiare commenti e opinioni sui propri esperimenti.

L’idea é interessante e tra l’altro arriva dagli stessi creatori di taverna, un software di cui ho parlato qualche volta e che serve per descrivere una analisi bioinformatica tramite un workflow.

Finalmente dopo alcuni anni di preparazione, é stata annunciata una versione beta funzionante a partire dal prossimo 1 agosto, aperta a tutti coloro che vogliano fare da tester.
Ecco l’annuncio ufficiale:

Devo ammettere che nemmeno a me é molto chiaro  il modo in cui questo esperimento funzionerà. Per adesso, mi sono iscritto alla beta e aspetterò il 1 agosto per vedere come funzionerà.

Un in bocca al lupo agli sviluppatori di MyExperiment!! :)

16 giugno 2007 - 14:41

The Synaptic Leap e il progetto di Tropicaldisease.org

Conoscete questo simbolo:

?

beh é piuttosto bruttino, però é il logo di the synaptic leap, una comunità di ricercatori che impegnano il loro tempo libero per sviluppare dati e possibili farmaci contro la malaria e altre malattie poco considerate dalle case farmaceutiche perché diffuse in aree del terzo mondo.

Per saperne di più potreste visitare il sito ufficiale di tropicaldisease.org dal quale é partita l’idea di questo tipo di ricerca, e poi studiarvi synapticleap che in pratica é il wiki in cui avvengono le discussioni e vengono coordinati i progetti.

Il modo migliore per contribuire a synaptic leap é partire da questa pagina di introduzione e dopodiché consultare le pagine iniziale per ognuna della comunità attive (malaria, schistostomiasi, tubercolosi, toxoplasmosi): notate che il materiale che c’è, tra feeds e spiegazioni, é di ottima qualità.

Qui un post interessante da leggere per capire cosa si può fare.

Se non sapete come partecipare o non avete tempo/conoscenze per contribuire, ci sono molti modi in cui potete dare una mano senza faticare troppo:

  • potreste suggerire un logo migliore (..);
  • dire la vostra sull’usabilità del loro sito (io non ho capito subito di cosa si trattasse, quando l’ho visto per la prima volta);
  • parlarne in giro, con amici e parenti nella vita reale;
  • spargere la voce via Internet, su blog e forum;
  • oppure se avete delle conoscenze su come organizzare un progetto opensource o un wiki per lo sviluppo collaborativo, potreste dare una mano a rendere il loro sito più usabile.
5 giugno 2007 - 21:43

Benvenuti in Inside Bioinfo!

Benvenuti in Inside Bioinfo!

Un saluto a tutti i navigatori che per un motivo o l’altro passano su queste pagine,
vi trovate davanti ad uno dei primi blog bioinformatici in italiano!! :)

Innanzitutto ci presentiamo: siamo Giovanni, Fuliggians e Riccardo, e apparteniamo a quella classe di biologi un po’ matti e pazzoidi che passano tempo a studiare materie complicate come programmazione e statistica, e informatica, per cercare di capire in che modo si può usare il computer per fare ricerca: insomma, siamo dei bioinformatici.

Qua fuori nella Internet del 2007, é possibile trovare una quantità immensa di dati di interesse scientifico: sequenze, strutture di proteine, annotazioni, articoli, mappe di interazione, protocolli, discussioni, dati di bassa qualità da controllare, osservazioni che attendono solo di essere scoperte.

Io adoro la bioinfo perché credo che solo imparando a muoversi in questo enorme mare di informazioni, di database, annotazioni e motori di ricerca, sia possibile arrivare ad intravedere o perlomeno a farsi una idea di tutto ciò che l’uomo ha scoperto sulla biologia e su come funziona il mondo che lo circonda fino ad oggi.

E’ per questo che stiamo aprendo questo blog: per avere un punto dove discutere, commentare, proporre, tutte le idee che vengono in mente a noi e al resto della comunità scientifica per affrontare una tale impresa.

Rimanete in ascolto quindi se questo vi interessa!

Un saluto dai vostri spacciatori di bioinformatica preferiti.