valori di bootstrap!

Forum

Registrati Discussioni Recenti Preferiti Utenti Cerca Regolamento RSS Statistiche

Utilità

I libri
consigliati:

Ingegneria dei tessuti biologici
Autori Vari

L'ambientalista scettico. Non è vero che la terra è in pericolo
Bjorn Lomborg

Il gene VI
Benjamin Lewin

Altri Libri

Nome Utente:	Password:
Riconoscimi automaticamente

Tutti i Forum

MolecularLab

Bioinformatica

valori di bootstrap!

Nuova Discussione

Nuovo Sondaggio

Rispondi

Aggiungi ai Preferiti

Cerca nelle discussioni

Risorse di Bioinformatica:

Guide tools online

Blog InsideBioinfo

Siti di Bioinformatica

Protocolli

Ultime notizie

Aggiungi i tag

Quanto è utile/interessante questa discussione:

Autore

Discussione

Stefy84
Nuovo Arrivato

64 Messaggi

Inserito il - 30 marzo 2009 : 18:22:48

Vorrei sapere cosa sono i valori di supporto bootstrap nell'analisi filogenetica. Io ho capito che sono valori che si usano per determinare la correttezza di un albero filogenetico. E' giusto?
inoltre vorrei sapere quale valore devono assumere perchè si possa considerare esatto un albero.
grazie..
Stefania

dallolio_gm
Moderatore

Prov.: Bo!
Città: Barcelona/Bologna

2445 Messaggi

Inserito il - 31 marzo 2009 : 10:52:17

Sí, serve per calcolare la correttezza di un albero filogenetico, e per la precisione della correttezza di una particolare ramificazione tra due taxa (o rami di un albero filogenetico).

L'idea di base é di simulare l'effetto che possono avere dei piccoli errori nei dati di input. Per esempio, per vedere se l'albero filogenetico creato sarebbe lo stesso nel caso che ci fosse un errore di sequenziamento nel 5% delle basi delle sequenze analizzate.

La procedura di base é di 'ricampionare' i dati di input, mischiando l'ordine di alcune colonne e introducendo duplicazioni/delezioni.
E' spiegato bene nei disegni che trovi qui:
- http://akira.ruc.dk/~olesk/Sekvens/bootstr.htm

Alla fine della procedura di bootstrapping otterrai dei valori relativi ad ogni ramo che ti indicano quanto quella determinata ramificazione é probabile.

Non ti so dire quali siano i valori di riferimento, ma credo che si possa prendere il 95%, a seconda dei dati a tua disposizione e da quello che vuoi dimostrare.

Esistono altre procedure per calcolare alberi filogenetici, come i metodi bayesiani, che non necessitano di bootstrapping.

Il mio blog di bioinformatics (inglese): BioinfoBlog
Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-)

Stefy84
Nuovo Arrivato

64 Messaggi

Inserito il - 31 marzo 2009 : 11:19:13

Grazie.. utilissimo..
avrei anche un'altra domanda..
in un articolo che sto leggendo in una didascalia di una figura parla di valori K riferiti alle popolazioni nell'analisi baeysiana. Riporto la didascalia così si capisce meglio..
"Title: Bayesian population structure analysis
Description: Bayesian assignment of the 48 field-collected individuals to populations
assuming a population number of K=2 to K=6. Individuals are arrayed along the xaxis.
The y-axis denotes the cumulative posterior probability of an individual’s
placement in particular population(s). Numbers in parentheses for each K indicate the
number of identical solutions at a 95% threshold. Individuals are divided into
populations by thin black lines. Populations are labeled at the bottom with numbers in
parentheses corresponding to the sampling locality as marked in Fig. 1. (A) Results
based on nuclear loci. (B) Results based on all loci. The solutions for each K, from
K=2 to K=6, are consistent in that at each K + 1 the assignment of individuals to the
clusters remains stable with just one cluster being split into two. There is only one exception to this pattern. The individual from Bekaraoka switches clusters from K=2
to K=3."
Non riesco a capire cosa siano questi valori K.
Grazie

dallolio_gm
Moderatore

Prov.: Bo!
Città: Barcelona/Bologna

2445 Messaggi

Inserito il - 31 marzo 2009 : 14:41:43

Probabilmente si riferisce al software Structure o ad uno simile.

Tu hai un insieme di individui, e vuoi sapere se é plausibile dividerli in un certo numero di popolazioni, secondo caratteristiche particolari.

Per esempio, é stato dimostrato che se due popolazioni di una stessa specie vengono separate da barriere fisiche, a lungo andare la frequenza degli heterozigoti nelle due linee tende a diminuire, e la maggior parte degli individui diviene omozigote (effetto Wahlund).

Programmi come Structure utilizzano questa osservazione se un insieme di individui puo' essere suddiviso in un certo numero di popolazioni. Mettiamo che tu abbia un set di 10 individui, e che tu voglia sapere se si possono distinguere in 2 popolazioni: il programma calcola tutte le possibili combinazioni di due gruppi (5 e 5 alla volta, ma anche 4 e 6, 3 e 7, etc) e per ogni combinazione esegue delle statistiche che indicano la probabilitá di trovarsi di fronte a due popolazioni separate.

Nell'esperimento che hai postato, gli autori hanno provato a far girare il programma per vedere se i 48 individui potevano essere raggruppati come 2 popolazioni, o 3-4-5-6.
In genere questa é la maniera standard di utilizzare "Structure", se provi a utilizzare il programma vedrai che é praticamente l'unico parametro che richiede.

Il mio blog di bioinformatics (inglese): BioinfoBlog
Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-)

Stefy84
Nuovo Arrivato

64 Messaggi

Inserito il - 31 marzo 2009 : 17:32:40

ok.. grazie.. questo adesso l'ho capito.. l'articolo in effetti si riferiva a Structure.. non ho capito una cosa però.. cosa intende quando parla di "number of identical solutions at a 95% threshold". Anche più avanti nell'articoo mi parla di "identical solutions" ma non riesco a capire cosa siano..

TMax
Utente Junior

Prov.: BG
Città: Capriate

270 Messaggi

Inserito il - 01 aprile 2009 : 12:13:00

per generalizzare il discorso le tecniche di bootstrap sono tecniche di ricampionamento che hanno l'obiettivo di stimare gli errori standard di qualsiasi stima statistica (medie, dev.stand. coefficienti di regress) quando non è disponibile una soluzione analitica.
Hanno preso un certo 'piede' in inferenza statistica con l'avvento di processori più potenti perchè si tratta di procedure che richiedono un uso intenso del pc!

Ciao ciao
TMax

Bio-du
Nuovo Arrivato

11 Messaggi

Inserito il - 07 settembre 2012 : 14:01:19

Vorrei una delucidazione riguardo questa discussione.
In pratica il valore di bootstrap indica la percentuale di probabilità di trovare le stesse due sequenze che formano il nodo dell’albero?
grazie mille :)

Discussione

Quanto è utile/interessante questa discussione:

Nuova Discussione

Nuovo Sondaggio

Rispondi

Aggiungi ai Preferiti

Cerca nelle discussioni

Vai a:

MolecularLab.it

Android e Mobile



Scarica le app! Ora anche sul tuo smartphone!

Ciao Login - Iscriviti



Visitatori: 282

Novità
Protocolli di laboratorio: reagenti e tecniche usate in laboratorio biomedico e molecolare.