Com sobreviure a una estadística científica

Preview:

DESCRIPTION

Com sobreviure a una estadística científica. Xavier Basagaña Setmana de la Ciència 2013. Estadística. Ciència o un conjunt d’eines per resumir informació. Estadística. Hipòtesi. Experiment. Eina fonamental en la ciència. Refutació. Suport. Quantificació del resultats: estadística. - PowerPoint PPT Presentation

Citation preview

Com sobreviure a una estadística científica

Xavier BasagañaSetmana de la Ciència 2013

Estadística• Ciència o un conjunt d’eines per resumir informació.

• Ens ofereix la possibilitat de testar si determinats fenòmens segueixen algun patró que puguem identificar, o es poden atribuir a l’atzar.

Estadística

Hipòtesi

Experiment

Suport Refutació

Eina fonamental en la ciència

Quantificació del resultats: estadística

Estadística

• Exemples:– Tinc una molècula que crec que pot funcionar com a

tractament d’una malaltia.– He dissenyat una bateria que crec que dura més que

les existents.– He descobert un material més resistent que els que

es feien servir en un determinat producte.– Crec que he descobert la zona del cervell que

controla una certa funció– ...

Per què la teoria no és suficient?

• Si les propietats químiques d’un compost ens diuen que cura una malaltia, per què cal recórrer a l’estadística?– Sistemes biològics molt complexos (mai es podrà

controlar tot).• En determinades persones pot funcionar i en altres no.• Diferents graus de curació.• Interacció amb altres substàncies• ...

Calen experiments

MESURES ESTADÍSTIQUES UTILITZADES HABITUALMENT

MESURES DESCRIPTIVES

Mesures descriptives

• Resumeixen una informació. Fàcils d’entendre.

• Proporcions:

– Proporció de fumadors: 25%

– Proporció que presenten efectes secundaris: 0.1%

– Percentatge de peces defectuoses en un procés de producció: 0.001%.

Mesures descriptives

• Mitjanes:

– Salari brut anual, mitjana: 22.899 €.

– Nivells de contaminació atmosfèrica (PM10) a Barcelona: 40 µg/m3.

– Nivells mitjans de colesterol: 210 mg/dL

– Mitjana de cotxes per habitant: 0.47.

Mesures descriptives

Mesures descriptives

• Tot i ser fàcils d’entendre, sempre hi ha perill a l’hora d’interpretar les dades.– Exemples (no científics): eleccions, EGM.

• Determinats gràfics poden induir conclusions errònies.

Mesures descriptives

MESURES D’ASSOCIACIÓ

Mesures d’associació

• Associació entre 2 variables (causa-efecte):

Variable explicativa

Variable resposta

Variables confusores

Alcohol Malaltia

Tabac

Mesures d’associació

• Associació entre 2 variables (causa-efecte):

Variable explicativa

Variable resposta

Variables confusores

Emissió de gasos

Augment de temperatures

Cicles Naturals

Mesures d’associació

• Associació entre 2 variables (causa-efecte):

Variable explicativa

Variable resposta

Variables confusores

Prendre un medicament Curació

Característiques del pacient

Mesures d’associació

• Associació entre 2 variables (causa-efecte):

Variable explicativa

Variable resposta

Variables confusores

Nivell d’estudis Estar a l’atur

Edat

VARIABLES CONTÍNUES

Com es quantifiquen les associacions

• 2 variables contínues (associació lineal)

Com es quantifiquen les associacions

• 2 variables contínues (associació lineal):

Reduir el consum de sodi als 25 anys de 150 mmol/dia a 50 mmol/dia, implica una reducció de

9 mm Hg en la pressió sistòlica als 55 anys.

Com es quantifiquen les associacions

• 2 variable contínues (corbes)

Esperança de vida = 10.754 + 6.6354*log(PIB per capita)

Com es quantifiquen les associacions

• 2 variable contínues (corbes)

• Les associacions multiplicatives es poden resumir de forma entenedora amb un sol número:– Ex: Al doblar el PIB, l’esperança de vida augmenta

4.6 anys (6.6354*log(2)).• Amb corbes més complicades, una bona idea podria ser

agafar 2 punts interessants de l’eix X i donar l’increment en Y.

Esperança de vida = 10.754 + 6.6354*log(PIB per capita)

VARIABLES CATEGÒRIQUES

Com es quantifiquen les associacions

• Quan la resposta (l’efecte) és sí/no.• Models per la probabilitat (risc).• Exemples:

– Probabilitat de curar-se.– Probabilitat (risc) de morir.– Probabilitat d’acabar els estudis.– Probabilitat d’error en un procés industrial.– Probabilitat que un client compri un producte.

Com es quantifiquen les associacions

• En ciències de la salut és molt comú fer servir el risc relatiu (RR).

2 grup malaltia la deat probabilit1 grup malaltia la deat probabilit

RR

• Exemple: risc en fumadors 10%, risc en no fumadors 4%.– RR = 0.1/0.04 = 2.5– RR> 1 Fumar és un factor de risc.

• Exemple: risc en els que fan activitat física 2%, risc en els que no, 8%.

– RR = 0.02/0.08 = 0.25.– RR<1 Activitat física és un factor protector.

• Exemple: risc en homes 5%, risc en dones 5%.– RR = 0.05/0.05 = 1 No hi ha associació entre la malaltia i el sexe.

Com es quantifiquen les associacions

• En ciències de la salut es fan servir altres mesures de risc relatiu:– Risc relatiu (RR)– Odds ratio (OR) *– Hazard ratio (HR)

• Totes es poden interpretar com:– Aquest grup té x% més risc que l’altre– A mesura que augmenta la variable explicativa, el risc augmenta

x%

* interpretable com a RR només si d’una malaltia que afecta <10% de la població, si no molt difícil d’interpretar.

Ratio vs. percent change

• Exemples: – OR = 1.06 increment del 6% en el risc.– RR = 1.20 increment del 20% en el risc.– HR=2 increment del 100% en el risc, o el risc es dobla.– RR= 5 es té 5 vegades més risc.

Ratio Canvi percentual (percent change)

RR (RR-1)*100 %OR (OR-1)*100 %HR (HR-1)*100 %

Com es quantifiquen les associacions

• Exemple:

Càncer de pulmó, mortalitat cardiovascular i exposició a llarg termini a contaminació atmosfèrica per partícules fines

Com es quantifiquen les associacions

• Per cada 10 g/m3 que augmenta la contaminació, la mortalitat augmenta un 6%.

• La taula reporta RR, el resultats ho interpreten com a canvi percentual.

INCERTESA, ATZAR

Incertesa, atzar

• L’atzar apareix perquè quasi sempre treballem amb mostres, no amb tota la població.– Enquesta de vot.– Estudi en un grup de pacients: si el repetim en un nou

grup de pacients el resultat no serà exactament el mateix.

– Fins i tot en condicions experimentals hi hauran petites variacions si es repeteix un altre dia → només veiem una mostra del experiments, no tots els possibles (que s’han fet i es faran)

Incertesa, atzar

• Exemple (quincunx)

http://www.mathsisfun.com/data/images/quincunx.swf

Incertesa

• L’estadística incorpora el fet que hi ha una certa variació en els resultats → incorpora la incertesa.

• Forma usual: totes les mesures estadístiques van acompanyades d’un interval de confiança.

• Indica els valors més probables on estarà el valor real.

Incertesa

• El 95% de les vegades la bola caurà entre -2 i 2.

-5 -4 -3 -2 -1 0 1 2 3 4 5

Interval de confiança al 95%: [-2, 2]

Incertesa• Exemple anterior:

• L’efecte més probable de la contaminació en la mortalitat és un augment del 6%, però podria ser entre un 2% i un 11%.

Incertesa• Exemple anterior:

• Per les altres causes de mort, l’efecte va de una reducció d’un 5% de la mortalitat a un increment d’un 6% no podem concloure res.

SIGNIFICACIÓ

Significació

• Resultats estadísticament significatius.

“…Chlamydia pneumoniae antibody titers are significantly associated with acute stroke …”

“…weekly use of hypochlorite bleach was non-significantly associated with new-onset asthma…”

“… The mode of transport was a statistically significant determinant of personal exposure to PM 2.5…”

“… this difference being clinically important although not statistically significant…”

“… Escitalopram treatment also was statistically significantly superior to citalopram…”

Significació

• p-valor: Probabilitat de que, si realment no existeix una associació, per atzar trobis una associació com la que has trobat o més forta.

• Exemple: els diabetics tenen el doble de risc de patir un atac de cor. El p-valor és de 0.02 = 2%.La probabilitat que per atzar el meu estudi trobi un

efecte del doble o més (quan en realitat no hi ha associació) és del 2%.

• Si aquesta probabilitat és molt baixa els resultats no són deguts a l’atzar.

p-valor

• Interpretació una mica complicada.• Moltes vegades s’acaba interpretant com la

probabilitat que els resultats siguin deguts a l’atzar.

• No és exacte des del punt de vista teòric, però la majoria de vegades es pot interpretar així.– Des del punt de vista comunicatiu no hi veig un gran

problema (opinió personal)

p-valor

p-valor

• Normalment p-valor<0.05 es considera estadísticament significatiu.

– Totalment arbitrari (5 dits de la mà)

• Implícitament estem acceptant que en un 5% d’estudis (1 de cada 20) ens equivoquem.

– Considerem una associació com a causal quan és deguda a l’atzar.

Replicació de resultats

(MALS) GRÀFICS

Exemples de mals gràfics

• Tallar l’eix de les Y

Exemples de mals gràfics

http://en.wikipedia.org/wiki/Misleading_graph

Exemples de mals gràfics

Font: Good Medicine Magazine

Exemples de mals gràfics

http://en.wikipedia.org/wiki/Misleading_graph

Exemples de mals gràfics

Activitat a Internet en 60 segons.

Exemples de mals gràfics

Font: New Scientist

Gràcies per la vostra atenció

Recommended