Confronto trend di variabili continue

Forum

Registrati Discussioni Recenti Preferiti Utenti Cerca Regolamento RSS Statistiche

Utilità

I libri
consigliati:

Ingegneria genetica. Le biotecnologie tra scienza e business
Mae W. Ho

Biochimica (3 vol.)
Thomas M. Devlin

Dal big bang all'uomo. La prima enciclopedia dell'evoluzione. Con CD-ROM
Autori Vari

Altri Libri

Nome Utente:	Password:
Riconoscimi automaticamente

Tutti i Forum

MolecularLab

Bioinformatica

Confronto trend di variabili continue

Nuova Discussione

Nuovo Sondaggio

Rispondi

Aggiungi ai Preferiti

Cerca nelle discussioni

Risorse di Bioinformatica:

Guide tools online

Blog InsideBioinfo

Siti di Bioinformatica

Protocolli

Ultime notizie

Aggiungi i tag

Quanto � utile/interessante questa discussione:

Autore

Discussione

AlessandroPP
Nuovo Arrivato

4 Messaggi

Inserito il - 19 maggio 2013 : 14:08:09

Salve a tutti, sono nuovo e vorrei porvi un quesito.
Sono interno in chirurgia, ho raccolto dati relativi alla quantit� di liquido prodotta giornalmente, e per 11 giorni, dal drenaggio addominale peripancreatico di 19 pazienti sottoposti ad intervento di duodenocefalopancreasectomia. I pazienti sono suddivisi in due gruppi sulla base di una diversa tecnica chirurgica: 9 in un gruppo e 10 nell'altro. Per ogni paziente ho i valori del liquido drenato in 11 giornate, dalla prima alla undicesima post-operatoria. Ho quindi 19 serie complessive da 11 valori quotidiani di liquido drenato. In entrambi i gruppi � evidente la riduzione della quantit� di liquido col passare dei giorni. Applicando 11 test t-student ho dimostrato che per tutte le 11 giornate la media dei liquidi drenati in un gruppo � significativamente diversa da quella dell'altro gruppo. Esiste un test per dimostrare che il trend dei valori in ciascun gruppo differisce? Cio� se un gruppo "drena" meno dell'altro o smette di produrre grandi quantit� di liquido pi� precocemente? Mi piacerebbe analizzare non solo la quantit� di liquido ma in pratica anche la velocit� della produzione del liquido.
Grazie a tutti!

chick80
Moderatore

Citt�: Edinburgh

11491 Messaggi

Inserito il - 19 maggio 2013 : 20:54:41

Citazione:
Applicando 11 test t-student ho dimostrato che per tutte le 11 giornate la media dei liquidi drenati in un gruppo � significativamente diversa da quella dell'altro gruppo

Questo � scorretto, in quanto ricadi nel problema dei confronti multipli (vedi as es.: https://en.wikipedia.org/wiki/Multiple_comparisons ).
Facendo 11 t-test indipendenti potresti trovare delle differenze che sono solo dovute al caso.

La cosa si complica ulteriormente in quanto le misure sono prese dagli stessi pazienti, quindi devi anche considerare il fattore "paziente" (ad es. un paziente potrebbe avere valori sempre pi� alti di un altro, ma la velocit� di diminuzione della quantit� di liquido drenato potrebbe essere la stessa.

Per risolvere il primo problema (confronti multipli) hai 2 opzioni:
1) applichi una correzione come ad es. la correzione di Bonferroni per cui dividi il tuo livello di significativit� per il numero di test. Ad es. se hai α=0.05 e fai 11 test dovrai settare il tuo α a 0.05/11 ~= 0.004
2) (meglio) usi un'analisi della varianza (ANOVA) che quindi tiene in considerazione tutti i punti allo stesso tempo.
In particolare (e questo ti serve per risolvere il secondo problema) dovrai applicare un'ANOVA a misure ripetute.

La terza soluzione, che � la migliore, � in realt� quella di applicare un modello lineare ad effetti misti (vedi ad es.: http://en.wikipedia.org/wiki/Mixed_model )

Se vuoi posso farti un esempio di come creare un modello di questo tipo usando R.

Sei un nuovo arrivato?
Leggi il regolamento del forum e presentati qui

My photo portfolio (now on G+!)

Glubus
Utente Junior

156 Messaggi

Inserito il - 20 maggio 2013 : 08:11:14

Giustissimo chick80!
Due ulteriori osservazioni:
1) il modello di regressione lineare ad effetti misti � la procedura da preferire perch� permette di stimare l'effetto del tempo, del trattamento e della loro interazione.
Una certa attenzione dovr� essere per� posta alla linearit� della risposta nel tempo ed alla omogeneit� delle varianze (� possibile che la variabilit� sia maggiore alle prime osservazioni e pi� piccola verso l'undicesima giornata, quando il volume di drenato sar� probabilmente pi� piccolo).
2) i risultati saranno validi solo se l'allocazione dei pazienti al trattamento � stata casuale. Se invece il trattamente � stato scelto sulla base delle indicazioni cliniche allora le conclusioni dovranno essere prese con un certa cautela.

Per quel che riguarda il punto 1 il consiglio � sempre quello di consultare uno statistico perch� il problema � un po' pi� complesso che eseguire una batteria di t-test.
Del resto non credo che ti faresti fare una appendicectomia da un biostatistico ;-) !

Citazione:
Messaggio inserito da chick80

Citazione:
Applicando 11 test t-student ho dimostrato che per tutte le 11 giornate la media dei liquidi drenati in un gruppo � significativamente diversa da quella dell'altro gruppo

Questo � scorretto, in quanto ricadi nel problema dei confronti multipli (vedi as es.: https://en.wikipedia.org/wiki/Multiple_comparisons ).
Facendo 11 t-test indipendenti potresti trovare delle differenze che sono solo dovute al caso.

La cosa si complica ulteriormente in quanto le misure sono prese dagli stessi pazienti, quindi devi anche considerare il fattore "paziente" (ad es. un paziente potrebbe avere valori sempre pi� alti di un altro, ma la velocit� di diminuzione della quantit� di liquido drenato potrebbe essere la stessa.

Per risolvere il primo problema (confronti multipli) hai 2 opzioni:
1) applichi una correzione come ad es. la correzione di Bonferroni per cui dividi il tuo livello di significativit� per il numero di test. Ad es. se hai #945;=0.05 e fai 11 test dovrai settare il tuo #945; a 0.05/11 ~= 0.004
2) (meglio) usi un'analisi della varianza (ANOVA) che quindi tiene in considerazione tutti i punti allo stesso tempo.
In particolare (e questo ti serve per risolvere il secondo problema) dovrai applicare un'ANOVA a misure ripetute.

La terza soluzione, che � la migliore, � in realt� quella di applicare un modello lineare ad effetti misti (vedi ad es.: http://en.wikipedia.org/wiki/Mixed_model )

Se vuoi posso farti un esempio di come creare un modello di questo tipo usando R.

chick80
Moderatore

Citt�: Edinburgh

11491 Messaggi

Inserito il - 20 maggio 2013 : 09:02:52

Faccio solo una piccola correzione a quanto ho scritto sopra:

Citazione:
Facendo 11 t-test indipendenti potresti trovare delle differenze che sono solo dovute al caso.

In realt� questo � vero anche se ne fai uno solo. Tuttavia, facendone 11 hai molta pi� probabilit� di vedere delle differenze che sono in realt� solo dovute al caso.

Ne approfitto anche per linkare questo simpatico esempio del problema: http://xkcd.com/882/

Sei un nuovo arrivato?
Leggi il regolamento del forum e presentati qui

My photo portfolio (now on G+!)

AlessandroPP
Nuovo Arrivato

4 Messaggi

Inserito il - 20 maggio 2013 : 18:57:16

Grazie per i preziosi consigli!
Prima di tutto preciso che la scelta dell'intervento chirurgico non � casuale, dato che le due tecniche si sono succedute cronologicamente: 10 pazienti sono stati operati con la tecnica pi� antica, 9 con una nuova tecnica introdotta da qualche anno.
Ho applicato sia una ANOVA a misure ripetute che una regressione lineare ad effetti multipli con STATA 12. Purtroppo non conosco R anche se sto cercando di ambientarmici. In allegato trovate i risultati che ho ottenuto, da cui, ammesso che non abbia sbagliato impostazioni (dubbio che ho soprattutto per la regressione lineare ad effetti multipli per la quale consulter� uno statistico

) e tenuto presente che il trattamento non � casuale, mi sembra di concludere che le variabili Giorno e Trattamento (Impact1trad0) abbiano un peso maggiore della variabile Paziente nel determinare il volume drenato.

Grazie ancora!

Allegato:

drenaggi pancreatici risultati.doc
93,94 KB

Glubus
Utente Junior

156 Messaggi

Inserito il - 21 maggio 2013 : 08:39:35

Mah? Non sono pratico di STATA ma comprendro il significato del termine "paziente" nella tavola degli effetti fissi della seconda analisi e sospetto possa esserci un problema concettuale.
Le due analisi sono comunque concettualmente diverse: nel modello di regressione ad effetti MISTI ad esempio la variabile giorno � modellata continua e non come discreta e questo sottointende una assunzione di linearit� fra giorno e volume drenato.
Come lo hai verificato? Un grafico direbbe molto su questi dati.
In ogni caso credo dovresti testare anche l'interazione giorno*tipo di intervento.
I modelli ad effetti misti sono un ambito abbastanza avanzato, quele � il tuo background in statistica? Ad esempio, sempre all'intero del ME model dovresti pensare a come modellare la autocorrelazione seriale (la correlazione fra le misure ripetute nel tempo sugli stessi sogegetti) ed avere a disposizione un software ed un manuale potrebbe non essere sufficiente, ...

Ti propongo un semplice escamotage per risparmiare sullo statistico: fai semplicemente la somma del volume denato giornaliero per ogni paziente fino alla rimozione del drenaggio ed esegui un semplice t-test ( o l'analogo test non-parametrico se necessario) su queste osservazioni. In questo modo eviti tutte queste complicazioni legate alle misure ripetute.

GB

Citazione:
Messaggio inserito da AlessandroPP

Grazie per i preziosi consigli!
Prima di tutto preciso che la scelta dell'intervento chirurgico non � casuale, dato che le due tecniche si sono succedute cronologicamente: 10 pazienti sono stati operati con la tecnica pi� antica, 9 con una nuova tecnica introdotta da qualche anno.
Ho applicato sia una ANOVA a misure ripetute che una regressione lineare ad effetti multipli con STATA 12. Purtroppo non conosco R anche se sto cercando di ambientarmici. In allegato trovate i risultati che ho ottenuto, da cui, ammesso che non abbia sbagliato impostazioni (dubbio che ho soprattutto per la regressione lineare ad effetti multipli per la quale consulter� uno statistico ) e tenuto presente che il trattamento non � casuale, mi sembra di concludere che le variabili Giorno e Trattamento (Impact1trad0) abbiano un peso maggiore della variabile Paziente nel determinare il volume drenato.

Grazie ancora!

Allegato: drenaggi pancreatici risultati.doc
93,94�KB

chick80
Moderatore

Citt�: Edinburgh

11491 Messaggi

Inserito il - 21 maggio 2013 : 09:56:50

Concordo con Glubus.
In realt� la cosa migliore sarebbe ovviamente avere accesso ai dati grezzi per darti una risposta pi� chiara.

Un ultimo commento:

Citazione:
Prima di tutto preciso che la scelta dell'intervento chirurgico non � casuale, dato che le due tecniche si sono succedute cronologicamente: 10 pazienti sono stati operati con la tecnica pi� antica, 9 con una nuova tecnica introdotta da qualche anno.

In realt� questo � un problema relativamente facile da risolvere. Il grosso problema sarebbe stato, ad es., se i 10 pazienti operati col metodo 1 fossero stati tutti uomini e gli altri 9 tutte donne, oppure se quelli di un gruppo fossero stati sistematicamente pi� giovani di quelli dell'altro gruppo etc.

In questo caso anche se in effetti i due trattamenti non sono stati eseguiti allo stesso tempo, correggimi se sbaglio, le caratteristiche dei pazienti (et�, sesso, gravit� della malattia etc.) sono equiparabili nei due gruppi quindi anche se il design non � ottimale direi che -a patto di riportare che i due trattamenti non sono stati fatti nello stesso periodo- questo non dovrebbe porre un grosso problema.

Faccio una piccola parentesi teorica per chiarire un po' meglio di cosa stiamo parlando:

Quando generi un modello lineare dai tuoi dati quello che fai matematicamente � questo:

Cosa vuol dire:
y � la tua variabile osservata, nel tuo caso la quantit� di drenato

β sono i fattori fissi, ossia tutte le variabili che contribuiscono direttamente e non "casualmente" alla generazione di y. Nel tuo caso saranno il tipo di trattamento e il giorno del prelevamento (essendo y pi� grande il giorno 1 rispetto al giorno 2 o 3 etc.). In realt� io qui ci aggiungerei anche dei fattori come il sesso e l'et� (e magari qualche livello ormonale?) che penso potrebbero essere biologicamente interessanti da considerare, ma su questo lascio a te la parola.

u sono gli effetti casuali (random o nuisance factors). Queste sono le variabili che contribuiscono pi� "casualmente" alla generazione di y. Nota che casualmente non vuol dire che la cosa non sia deterministica, ma pi� che altro che tu non hai direttamente controllo su queste variabili e che quindi non fanno direttamente parte del tuo disegno sperimentale.
Nel nostro esempio il paziente sar� considerato come random factor.

X e Z sono dei fattori che definiscono l'importanza dei vari effetti. In pratica se il tuo modello fosse:

quantit� di drenato = X * giorno + Z * paziente + ε

Se il fattore giorno � molto pi� importante del fattore paziente allora X sar� (in valore assoluto) molto pi� importante di Z.

Infine ε � il termine di errore, che se vuoi rappresenta tutto quello che non hai misurato. Ad es. la temperatura dell'aria, la pressione, etc. etc. etc.
Insomma, l'idea � che se io calcolo:

drenato = X * giorno + Z * paziente

Otterr� dei valori di drenato che sono in generale diversi da quelli misurati realmente (ricorda, stiamo generando un modello).

ε sar� quindi uguale a:

ε = drenato(reale) - drenato(calcolato)

ossia la differenza fra il modello e la realt�.

Quando tu chiedi al tuo programma di statistica di generare il modello, quello che lui fa � di trovare dei valori di X e Z tali da minimizzare questo errore.

Sei un nuovo arrivato?
Leggi il regolamento del forum e presentati qui

My photo portfolio (now on G+!)

AlessandroPP
Nuovo Arrivato

4 Messaggi

Inserito il - 21 maggio 2013 : 12:32:01

Che posso dire...

Grazie davvero per la completezza delle risposte! Grazie per aver sottolineato gli errori della mia analisi e per avermi rassicurato sulla non casualit� dell'assegnazione del trattamento (in effetti sesso ed et� sono confrontabili, altre variabili come l'albuminemia pre e post intervento sono in corso di raccolta). Allego i dati grezzi. Comunque senza abusare della vostra pazienza credo che per il momento mi limiter� al t-student sui totali drenati o al massimo all'ANOVA per misure ripetute. Grazie per il presupposto teorico del modello di regressione lineare ad effetti misti, mi � abbastanza chiaro, ma devo studiare come tradurre per bene il tutto in STATA.
La mia formazione statistica � assolutamente di base (esame di statistica al terzo anno del mio corso di laurea in Medicina e Chirurgia), ma sono un "appassionato" che fino ad ora si era cimentato solo con confronti di medie e proporzioni in ricerche che spero vedano la luce al pi� presto, appena ho un attimo scrivo il curriculum.

Allegato:

drenaggi pancreatici dati.xlsx
13,35 KB

Glubus
Utente Junior

156 Messaggi

Inserito il - 21 maggio 2013 : 12:58:06

guarda intanto questo grafico ("spaghetti plot"). Il pannello a sinistra rappresenta il trattamento convenzionale e le traiettorie colorate sono i dati individuali. Come vedi gi� la linearit� sarebbe questionabile, poi nota come la varianza diminuisca con il livello.
GB

Citazione:
Messaggio inserito da AlessandroPP

Che posso dire... Grazie davvero per la completezza delle risposte! Grazie per aver sottolineato gli errori della mia analisi e per avermi rassicurato sulla non casualit� dell'assegnazione del trattamento (in effetti sesso ed et� sono confrontabili, altre variabili come l'albuminemia pre e post intervento sono in corso di raccolta). Allego i dati grezzi. Comunque senza abusare della vostra pazienza credo che per il momento mi limiter� al t-student sui totali drenati o al massimo all'ANOVA per misure ripetute. Grazie per il presupposto teorico del modello di regressione lineare ad effetti misti, mi � abbastanza chiaro, ma devo studiare come tradurre per bene il tutto in STATA.
La mia formazione statistica � assolutamente di base (esame di statistica al terzo anno del mio corso di laurea in Medicina e Chirurgia), ma sono un "appassionato" che fino ad ora si era cimentato solo con confronti di medie e proporzioni in ricerche che spero vedano la luce al pi� presto, appena ho un attimo scrivo il curriculum.

Allegato: drenaggi pancreatici dati.xlsx
13,35�KB

Immagine:

10,42�KB

TMax
Utente Junior

Prov.: BG
Citt�: Capriate

270 Messaggi

Inserito il - 22 maggio 2013 : 11:11:46

u sono gli effetti casuali (random o nuisance factors). Queste sono le variabili che contribuiscono pi� "casualmente" alla generazione di y. Nota che casualmente non vuol dire che la cosa non sia deterministica, ma pi� che altro che tu non hai direttamente controllo su queste variabili e che quindi non fanno direttamente parte del tuo disegno sperimentale.
Nel nostro esempio il paziente sar� considerato come random factor.

Ciao Chick,
una precisazione....circa i fattori ad effetti random; non credo sia corretto affermare che sono quelli che contribuiscono pi� casualmente al variabilit� di y.
Il termine random si riferisce ai livelli del fattore.
Mentre nei fattori ad effetti fissi i livelli sono in genere pochi e invarianti e sono quelli che interessano al ricercatore (o per lo meno la differenza tra i diversi livelli del fattore � una differenza che interessa!).

Ad esempio: fattore trattamento con due livelli di interesse A e B
in questo caso non ci sono dubbi: esistono solo quei due livelli e la loro differenza � il focus dello studio.

Nei fattori ad effetti random i livelli sono un 'campione rappresentativo' dell'universo dei possibili livelli che pu� assumere la variabile. Non � d'interesse studiare le differenze tra questi livelli.

Ad esempio: fattore paziente � un fattore con un numero di livelli che � determinato dal disegno dello studio, quei livelli cio� pazienti sono solo un campione casuale dell'universo possibile dei pazienti.
In questo caso la componente di variabilit� di Y dovuta a questo fattore � una componente da controllare per ottenere una migliore spiegazione della variabilit� di Y....

Ciao

chick80
Moderatore

Citt�: Edinburgh

11491 Messaggi

Inserito il - 22 maggio 2013 : 14:02:26

Grazie della precisazione TMax. Ho messo quel casualmente tra virgolette proprio per quello.

La tua spiegazione � pi� chiara in effetti!
Era un po' quello che volevo dire dicendo che questi fattori "non fanno parte del tuo disegno sperimentale".

Sei un nuovo arrivato?
Leggi il regolamento del forum e presentati qui

My photo portfolio (now on G+!)

Discussione

Quanto � utile/interessante questa discussione:

Nuova Discussione

Nuovo Sondaggio

Rispondi

Aggiungi ai Preferiti

Cerca nelle discussioni

Vai a:

MolecularLab.it

Android e Mobile



Scarica le app! Ora anche sul tuo smartphone!

Ciao Login - Iscriviti



Visitatori: 93

Novità
Protocolli di laboratorio: reagenti e tecniche usate in laboratorio biomedico e molecolare.