52
Com sobreviure a una estadística científica Xavier Basagaña Setmana de la Ciència 2013

Com sobreviure a una estadística científica

  • Upload
    kiona

  • View
    64

  • Download
    2

Embed Size (px)

DESCRIPTION

Com sobreviure a una estadística científica. Xavier Basagaña Setmana de la Ciència 2013. Estadística. Ciència o un conjunt d’eines per resumir informació. Estadística. Hipòtesi. Experiment. Eina fonamental en la ciència. Refutació. Suport. Quantificació del resultats: estadística. - PowerPoint PPT Presentation

Citation preview

Page 1: Com sobreviure a una estadística científica

Com sobreviure a una estadística científica

Xavier BasagañaSetmana de la Ciència 2013

Page 2: Com sobreviure a una estadística científica

Estadística• Ciència o un conjunt d’eines per resumir informació.

Page 3: Com sobreviure a una estadística científica

• Ens ofereix la possibilitat de testar si determinats fenòmens segueixen algun patró que puguem identificar, o es poden atribuir a l’atzar.

Estadística

Hipòtesi

Experiment

Suport Refutació

Eina fonamental en la ciència

Quantificació del resultats: estadística

Page 4: Com sobreviure a una estadística científica

Estadística

• Exemples:– Tinc una molècula que crec que pot funcionar com a

tractament d’una malaltia.– He dissenyat una bateria que crec que dura més que

les existents.– He descobert un material més resistent que els que

es feien servir en un determinat producte.– Crec que he descobert la zona del cervell que

controla una certa funció– ...

Page 5: Com sobreviure a una estadística científica

Per què la teoria no és suficient?

• Si les propietats químiques d’un compost ens diuen que cura una malaltia, per què cal recórrer a l’estadística?– Sistemes biològics molt complexos (mai es podrà

controlar tot).• En determinades persones pot funcionar i en altres no.• Diferents graus de curació.• Interacció amb altres substàncies• ...

Calen experiments

Page 6: Com sobreviure a una estadística científica

MESURES ESTADÍSTIQUES UTILITZADES HABITUALMENT

Page 7: Com sobreviure a una estadística científica

MESURES DESCRIPTIVES

Page 8: Com sobreviure a una estadística científica

Mesures descriptives

• Resumeixen una informació. Fàcils d’entendre.

• Proporcions:

– Proporció de fumadors: 25%

– Proporció que presenten efectes secundaris: 0.1%

– Percentatge de peces defectuoses en un procés de producció: 0.001%.

Page 9: Com sobreviure a una estadística científica

Mesures descriptives

• Mitjanes:

– Salari brut anual, mitjana: 22.899 €.

– Nivells de contaminació atmosfèrica (PM10) a Barcelona: 40 µg/m3.

– Nivells mitjans de colesterol: 210 mg/dL

– Mitjana de cotxes per habitant: 0.47.

Page 10: Com sobreviure a una estadística científica

Mesures descriptives

Page 11: Com sobreviure a una estadística científica

Mesures descriptives

• Tot i ser fàcils d’entendre, sempre hi ha perill a l’hora d’interpretar les dades.– Exemples (no científics): eleccions, EGM.

• Determinats gràfics poden induir conclusions errònies.

Page 12: Com sobreviure a una estadística científica

Mesures descriptives

Page 13: Com sobreviure a una estadística científica

MESURES D’ASSOCIACIÓ

Page 14: Com sobreviure a una estadística científica

Mesures d’associació

• Associació entre 2 variables (causa-efecte):

Variable explicativa

Variable resposta

Variables confusores

Alcohol Malaltia

Tabac

Page 15: Com sobreviure a una estadística científica

Mesures d’associació

• Associació entre 2 variables (causa-efecte):

Variable explicativa

Variable resposta

Variables confusores

Emissió de gasos

Augment de temperatures

Cicles Naturals

Page 16: Com sobreviure a una estadística científica

Mesures d’associació

• Associació entre 2 variables (causa-efecte):

Variable explicativa

Variable resposta

Variables confusores

Prendre un medicament Curació

Característiques del pacient

Page 17: Com sobreviure a una estadística científica

Mesures d’associació

• Associació entre 2 variables (causa-efecte):

Variable explicativa

Variable resposta

Variables confusores

Nivell d’estudis Estar a l’atur

Edat

Page 18: Com sobreviure a una estadística científica

VARIABLES CONTÍNUES

Page 19: Com sobreviure a una estadística científica

Com es quantifiquen les associacions

• 2 variables contínues (associació lineal)

Page 20: Com sobreviure a una estadística científica

Com es quantifiquen les associacions

• 2 variables contínues (associació lineal):

Reduir el consum de sodi als 25 anys de 150 mmol/dia a 50 mmol/dia, implica una reducció de

9 mm Hg en la pressió sistòlica als 55 anys.

Page 21: Com sobreviure a una estadística científica

Com es quantifiquen les associacions

• 2 variable contínues (corbes)

Esperança de vida = 10.754 + 6.6354*log(PIB per capita)

Page 22: Com sobreviure a una estadística científica

Com es quantifiquen les associacions

• 2 variable contínues (corbes)

• Les associacions multiplicatives es poden resumir de forma entenedora amb un sol número:– Ex: Al doblar el PIB, l’esperança de vida augmenta

4.6 anys (6.6354*log(2)).• Amb corbes més complicades, una bona idea podria ser

agafar 2 punts interessants de l’eix X i donar l’increment en Y.

Esperança de vida = 10.754 + 6.6354*log(PIB per capita)

Page 23: Com sobreviure a una estadística científica

VARIABLES CATEGÒRIQUES

Page 24: Com sobreviure a una estadística científica

Com es quantifiquen les associacions

• Quan la resposta (l’efecte) és sí/no.• Models per la probabilitat (risc).• Exemples:

– Probabilitat de curar-se.– Probabilitat (risc) de morir.– Probabilitat d’acabar els estudis.– Probabilitat d’error en un procés industrial.– Probabilitat que un client compri un producte.

Page 25: Com sobreviure a una estadística científica

Com es quantifiquen les associacions

• En ciències de la salut és molt comú fer servir el risc relatiu (RR).

2 grup malaltia la deat probabilit1 grup malaltia la deat probabilit

RR

• Exemple: risc en fumadors 10%, risc en no fumadors 4%.– RR = 0.1/0.04 = 2.5– RR> 1 Fumar és un factor de risc.

• Exemple: risc en els que fan activitat física 2%, risc en els que no, 8%.

– RR = 0.02/0.08 = 0.25.– RR<1 Activitat física és un factor protector.

• Exemple: risc en homes 5%, risc en dones 5%.– RR = 0.05/0.05 = 1 No hi ha associació entre la malaltia i el sexe.

Page 26: Com sobreviure a una estadística científica

Com es quantifiquen les associacions

• En ciències de la salut es fan servir altres mesures de risc relatiu:– Risc relatiu (RR)– Odds ratio (OR) *– Hazard ratio (HR)

• Totes es poden interpretar com:– Aquest grup té x% més risc que l’altre– A mesura que augmenta la variable explicativa, el risc augmenta

x%

* interpretable com a RR només si d’una malaltia que afecta <10% de la població, si no molt difícil d’interpretar.

Page 27: Com sobreviure a una estadística científica

Ratio vs. percent change

• Exemples: – OR = 1.06 increment del 6% en el risc.– RR = 1.20 increment del 20% en el risc.– HR=2 increment del 100% en el risc, o el risc es dobla.– RR= 5 es té 5 vegades més risc.

Ratio Canvi percentual (percent change)

RR (RR-1)*100 %OR (OR-1)*100 %HR (HR-1)*100 %

Page 28: Com sobreviure a una estadística científica

Com es quantifiquen les associacions

• Exemple:

Càncer de pulmó, mortalitat cardiovascular i exposició a llarg termini a contaminació atmosfèrica per partícules fines

Page 29: Com sobreviure a una estadística científica

Com es quantifiquen les associacions

• Per cada 10 g/m3 que augmenta la contaminació, la mortalitat augmenta un 6%.

• La taula reporta RR, el resultats ho interpreten com a canvi percentual.

Page 30: Com sobreviure a una estadística científica

INCERTESA, ATZAR

Page 31: Com sobreviure a una estadística científica

Incertesa, atzar

• L’atzar apareix perquè quasi sempre treballem amb mostres, no amb tota la població.– Enquesta de vot.– Estudi en un grup de pacients: si el repetim en un nou

grup de pacients el resultat no serà exactament el mateix.

– Fins i tot en condicions experimentals hi hauran petites variacions si es repeteix un altre dia → només veiem una mostra del experiments, no tots els possibles (que s’han fet i es faran)

Page 32: Com sobreviure a una estadística científica

Incertesa, atzar

• Exemple (quincunx)

http://www.mathsisfun.com/data/images/quincunx.swf

Page 33: Com sobreviure a una estadística científica

Incertesa

• L’estadística incorpora el fet que hi ha una certa variació en els resultats → incorpora la incertesa.

• Forma usual: totes les mesures estadístiques van acompanyades d’un interval de confiança.

• Indica els valors més probables on estarà el valor real.

Page 34: Com sobreviure a una estadística científica

Incertesa

• El 95% de les vegades la bola caurà entre -2 i 2.

-5 -4 -3 -2 -1 0 1 2 3 4 5

Interval de confiança al 95%: [-2, 2]

Page 35: Com sobreviure a una estadística científica

Incertesa• Exemple anterior:

• L’efecte més probable de la contaminació en la mortalitat és un augment del 6%, però podria ser entre un 2% i un 11%.

Page 36: Com sobreviure a una estadística científica

Incertesa• Exemple anterior:

• Per les altres causes de mort, l’efecte va de una reducció d’un 5% de la mortalitat a un increment d’un 6% no podem concloure res.

Page 37: Com sobreviure a una estadística científica

SIGNIFICACIÓ

Page 38: Com sobreviure a una estadística científica

Significació

• Resultats estadísticament significatius.

“…Chlamydia pneumoniae antibody titers are significantly associated with acute stroke …”

“…weekly use of hypochlorite bleach was non-significantly associated with new-onset asthma…”

“… The mode of transport was a statistically significant determinant of personal exposure to PM 2.5…”

“… this difference being clinically important although not statistically significant…”

“… Escitalopram treatment also was statistically significantly superior to citalopram…”

Page 39: Com sobreviure a una estadística científica

Significació

• p-valor: Probabilitat de que, si realment no existeix una associació, per atzar trobis una associació com la que has trobat o més forta.

• Exemple: els diabetics tenen el doble de risc de patir un atac de cor. El p-valor és de 0.02 = 2%.La probabilitat que per atzar el meu estudi trobi un

efecte del doble o més (quan en realitat no hi ha associació) és del 2%.

• Si aquesta probabilitat és molt baixa els resultats no són deguts a l’atzar.

Page 40: Com sobreviure a una estadística científica

p-valor

• Interpretació una mica complicada.• Moltes vegades s’acaba interpretant com la

probabilitat que els resultats siguin deguts a l’atzar.

• No és exacte des del punt de vista teòric, però la majoria de vegades es pot interpretar així.– Des del punt de vista comunicatiu no hi veig un gran

problema (opinió personal)

Page 41: Com sobreviure a una estadística científica

p-valor

Page 42: Com sobreviure a una estadística científica

p-valor

• Normalment p-valor<0.05 es considera estadísticament significatiu.

– Totalment arbitrari (5 dits de la mà)

• Implícitament estem acceptant que en un 5% d’estudis (1 de cada 20) ens equivoquem.

– Considerem una associació com a causal quan és deguda a l’atzar.

Page 43: Com sobreviure a una estadística científica

Replicació de resultats

Page 44: Com sobreviure a una estadística científica

(MALS) GRÀFICS

Page 45: Com sobreviure a una estadística científica

Exemples de mals gràfics

• Tallar l’eix de les Y

Page 46: Com sobreviure a una estadística científica

Exemples de mals gràfics

http://en.wikipedia.org/wiki/Misleading_graph

Page 47: Com sobreviure a una estadística científica

Exemples de mals gràfics

Font: Good Medicine Magazine

Page 48: Com sobreviure a una estadística científica

Exemples de mals gràfics

http://en.wikipedia.org/wiki/Misleading_graph

Page 49: Com sobreviure a una estadística científica

Exemples de mals gràfics

Activitat a Internet en 60 segons.

Page 50: Com sobreviure a una estadística científica

Exemples de mals gràfics

Font: New Scientist

Page 51: Com sobreviure a una estadística científica

Gràcies per la vostra atenció

Page 52: Com sobreviure a una estadística científica