Forum

Nome Utente:
Password:
Riconoscimi automaticamente
 Tutti i Forum
 Laboratorio
 Bioinformatica e Biostatistica
 valori di bootstrap!
 Nuova Discussione  Nuovo Sondaggio Nuovo Sondaggio
 Rispondi Aggiungi ai Preferiti Aggiungi ai Preferiti
Cerca nelle discussioni
I seguenti utenti stanno leggendo questo Forum Qui c'è:

Aggiungi Tag Aggiungi i tag

Quanto è utile/interessante questa discussione:

Autore Discussione  

Stefy84
Nuovo Arrivato

dna


64 Messaggi

Inserito il - 30 marzo 2009 : 18:22:48  Mostra Profilo  Visita l'Homepage di Stefy84 Invia a Stefy84 un Messaggio Privato  Rispondi Quotando
Vorrei sapere cosa sono i valori di supporto bootstrap nell'analisi filogenetica. Io ho capito che sono valori che si usano per determinare la correttezza di un albero filogenetico. E' giusto?
inoltre vorrei sapere quale valore devono assumere perchè si possa considerare esatto un albero.
grazie..
Stefania

dallolio_gm
Moderatore


Prov.: Bo!
Città: Barcelona/Bologna


2445 Messaggi

Inserito il - 31 marzo 2009 : 10:52:17  Mostra Profilo  Visita l'Homepage di dallolio_gm  Clicca per vedere l'indirizzo MSN di dallolio_gm Invia a dallolio_gm un Messaggio Privato  Rispondi Quotando
Sí, serve per calcolare la correttezza di un albero filogenetico, e per la precisione della correttezza di una particolare ramificazione tra due taxa (o rami di un albero filogenetico).

L'idea di base é di simulare l'effetto che possono avere dei piccoli errori nei dati di input. Per esempio, per vedere se l'albero filogenetico creato sarebbe lo stesso nel caso che ci fosse un errore di sequenziamento nel 5% delle basi delle sequenze analizzate.

La procedura di base é di 'ricampionare' i dati di input, mischiando l'ordine di alcune colonne e introducendo duplicazioni/delezioni.
E' spiegato bene nei disegni che trovi qui:
- http://akira.ruc.dk/~olesk/Sekvens/bootstr.htm

Alla fine della procedura di bootstrapping otterrai dei valori relativi ad ogni ramo che ti indicano quanto quella determinata ramificazione é probabile.

Non ti so dire quali siano i valori di riferimento, ma credo che si possa prendere il 95%, a seconda dei dati a tua disposizione e da quello che vuoi dimostrare.

Esistono altre procedure per calcolare alberi filogenetici, come i metodi bayesiani, che non necessitano di bootstrapping.

Il mio blog di bioinformatics (inglese): BioinfoBlog
Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-)
Torna all'inizio della Pagina

Stefy84
Nuovo Arrivato

dna



64 Messaggi

Inserito il - 31 marzo 2009 : 11:19:13  Mostra Profilo  Visita l'Homepage di Stefy84 Invia a Stefy84 un Messaggio Privato  Rispondi Quotando
Grazie.. utilissimo..
avrei anche un'altra domanda..
in un articolo che sto leggendo in una didascalia di una figura parla di valori K riferiti alle popolazioni nell'analisi baeysiana. Riporto la didascalia così si capisce meglio..
"Title: Bayesian population structure analysis
Description: Bayesian assignment of the 48 field-collected individuals to populations
assuming a population number of K=2 to K=6. Individuals are arrayed along the xaxis.
The y-axis denotes the cumulative posterior probability of an individual’s
placement in particular population(s). Numbers in parentheses for each K indicate the
number of identical solutions at a 95% threshold. Individuals are divided into
populations by thin black lines. Populations are labeled at the bottom with numbers in
parentheses corresponding to the sampling locality as marked in Fig. 1. (A) Results
based on nuclear loci. (B) Results based on all loci. The solutions for each K, from
K=2 to K=6, are consistent in that at each K + 1 the assignment of individuals to the
clusters remains stable with just one cluster being split into two. There is only one exception to this pattern. The individual from Bekaraoka switches clusters from K=2
to K=3."
Non riesco a capire cosa siano questi valori K.
Grazie
Torna all'inizio della Pagina

dallolio_gm
Moderatore


Prov.: Bo!
Città: Barcelona/Bologna


2445 Messaggi

Inserito il - 31 marzo 2009 : 14:41:43  Mostra Profilo  Visita l'Homepage di dallolio_gm  Clicca per vedere l'indirizzo MSN di dallolio_gm Invia a dallolio_gm un Messaggio Privato  Rispondi Quotando
Probabilmente si riferisce al software Structure o ad uno simile.

Tu hai un insieme di individui, e vuoi sapere se é plausibile dividerli in un certo numero di popolazioni, secondo caratteristiche particolari.

Per esempio, é stato dimostrato che se due popolazioni di una stessa specie vengono separate da barriere fisiche, a lungo andare la frequenza degli heterozigoti nelle due linee tende a diminuire, e la maggior parte degli individui diviene omozigote (effetto Wahlund).

Programmi come Structure utilizzano questa osservazione se un insieme di individui puo' essere suddiviso in un certo numero di popolazioni. Mettiamo che tu abbia un set di 10 individui, e che tu voglia sapere se si possono distinguere in 2 popolazioni: il programma calcola tutte le possibili combinazioni di due gruppi (5 e 5 alla volta, ma anche 4 e 6, 3 e 7, etc) e per ogni combinazione esegue delle statistiche che indicano la probabilitá di trovarsi di fronte a due popolazioni separate.

Nell'esperimento che hai postato, gli autori hanno provato a far girare il programma per vedere se i 48 individui potevano essere raggruppati come 2 popolazioni, o 3-4-5-6.
In genere questa é la maniera standard di utilizzare "Structure", se provi a utilizzare il programma vedrai che é praticamente l'unico parametro che richiede.

Il mio blog di bioinformatics (inglese): BioinfoBlog
Sono un po' lento a rispondere, posso tardare anche qualche giorno... ma abbiate fede! :-)
Torna all'inizio della Pagina

Stefy84
Nuovo Arrivato

dna



64 Messaggi

Inserito il - 31 marzo 2009 : 17:32:40  Mostra Profilo  Visita l'Homepage di Stefy84 Invia a Stefy84 un Messaggio Privato  Rispondi Quotando
ok.. grazie.. questo adesso l'ho capito.. l'articolo in effetti si riferiva a Structure.. non ho capito una cosa però.. cosa intende quando parla di "number of identical solutions at a 95% threshold". Anche più avanti nell'articoo mi parla di "identical solutions" ma non riesco a capire cosa siano..
Torna all'inizio della Pagina

TMax
Utente Junior

TMax

Prov.: BG
Città: Capriate


270 Messaggi

Inserito il - 01 aprile 2009 : 12:13:00  Mostra Profilo  Visita l'Homepage di TMax Invia a TMax un Messaggio Privato  Rispondi Quotando
per generalizzare il discorso le tecniche di bootstrap sono tecniche di ricampionamento che hanno l'obiettivo di stimare gli errori standard di qualsiasi stima statistica (medie, dev.stand. coefficienti di regress) quando non è disponibile una soluzione analitica.
Hanno preso un certo 'piede' in inferenza statistica con l'avvento di processori più potenti perchè si tratta di procedure che richiedono un uso intenso del pc!



Ciao ciao
TMax
Torna all'inizio della Pagina

Bio-du
Nuovo Arrivato



11 Messaggi

Inserito il - 07 settembre 2012 : 14:01:19  Mostra Profilo  Visita l'Homepage di Bio-du Invia a Bio-du un Messaggio Privato  Rispondi Quotando
Vorrei una delucidazione riguardo questa discussione.
In pratica il valore di bootstrap indica la percentuale di probabilità di trovare le stesse due sequenze che formano il nodo dell’albero?
grazie mille :)
Torna all'inizio della Pagina
  Discussione  

Quanto è utile/interessante questa discussione:

 Nuova Discussione  Nuovo Sondaggio Nuovo Sondaggio
 Rispondi Aggiungi ai Preferiti Aggiungi ai Preferiti
Cerca nelle discussioni
Vai a:
MolecularLab.it © 2003-18 MolecularLab.it Torna all'inizio della Pagina