49
Temas de discusión Estadística descriptiva Probabilidad Estimación Prueba de hipótesis Diseño de Experimentos Estadística en la computadora

PresentacióN EstadíStica Inicio

Embed Size (px)

Citation preview

Page 1: PresentacióN EstadíStica Inicio

Temas de discusión

Estadística descriptiva

Probabilidad

Estimación

Prueba de hipótesis

Diseño de Experimentos

Estadística en la computadora

Page 2: PresentacióN EstadíStica Inicio

Estadística

Proporciona un conjunto de principios y

metodologías para:

• colecta de datos

• su presentación y resumen,

• su interpretación

• Extraer conclusiones y generalidades

Page 3: PresentacióN EstadíStica Inicio

Su aplicación en medicina

• Estadística vitales

Para facilitar su uso se requiere una comprensiónbásica de la forma en que se determinan, quesignifican y como se emplean

• Epidemiología

Los datos epidemiológicos muestran la prevalenciade una enfermedad, la forma en que varía deacuerdo a la estación de año, la ubicacióngeográfica y como le afectan ciertos factores deriesgo

Page 4: PresentacióN EstadíStica Inicio

¿Qué tan sensible es una prueba dediagnóstico para la identificación dela presencia de la enfermedad y concuanta frecuencia arroja resultados

erróneos?

Procedimientos de diagnóstico

Page 5: PresentacióN EstadíStica Inicio

Valoración de protocolos de investigación

Ningún estudio proporcionainformación válida a menos que sediseñe y analice en forma científica.

Page 6: PresentacióN EstadíStica Inicio

Participación o dirección en proyectos de investigación

Es indispensable el conocimiento de la estadística y sus métodos de estudio, con él, podremos ser participantes activos en todos los aspectos de la investigación.

Page 7: PresentacióN EstadíStica Inicio

Algunas ramas de la estadística

• El diseño de experimentos guía al investigadora planear la manera y cuantos datos colectar.

• La estadística descriptiva resume y describelas características importantes de los datos.

• La inferencia estadística evalúa la informaciónpresente en los datos e indica el nuevoconocimiento ganado con esta información.

Page 8: PresentacióN EstadíStica Inicio

Objetivos principales de la estadística

• Hacer inferencias sobre una población a partirdel análisis de la información de una muestra.

• Esto incluye medir el porcentaje deincertidumbre involucrado en estasinferencias.

• Diseñar el proceso de muestreo y el tamañode la muestra de manera que las inferenciassean válidas.

Page 9: PresentacióN EstadíStica Inicio

• Los datos de un experimento proporcionan unnuevo conocimiento, y este en ocasionessugiere una revisión de la teoría existente elcual requerirá mas investigación a través demas experimento y análisis de datos.

Page 10: PresentacióN EstadíStica Inicio

Teoría de probabilidades

Estudia los métodos de análisis que soncomunes en el tratamiento defenómenos aleatorios, cualquiera quesea el área donde se presenten

Page 11: PresentacióN EstadíStica Inicio

Dos conceptos básicos: Población y muestra

Una población (estadística) es el conjunto de

medidas (o registros) correspondientes a la

colección completa de unidades de la cual se

quiere inferir.

Una muestra de una población estadística es

el conjunto de medidas que se colectan en el

curso de una investigación

Page 12: PresentacióN EstadíStica Inicio

Estadística Descriptiva

Proporciona un conjunto de herramientas tales como tablas, gráficas, promedios, y otras para organizar y resumir la información de la muestra.

• Métodos Gráficos y Tabulares

• Métodos Numéricos

Page 13: PresentacióN EstadíStica Inicio

Conceptos básicos

• Datos.

Los datos estadísticos son valores de unacaracterística de interés medida en unconjunto de objetos o individuos.

Son la materia prima de las investigaciones.

Page 14: PresentacióN EstadíStica Inicio

Tipos de datos

• Cualitativos (categóricos)

Nominales

Ordinales

• Cuantitativos (numéricos)

Continuos

Discretos

Page 15: PresentacióN EstadíStica Inicio

Datos categóricos

• A) Nominales

En esta escala los datos son sólo categorías de

clasificación.

Ejemplos.

a) Variable: : Fumador/no fumador

b) Variable: Diabético/no-diabético

c). Variable: Casado/soltero/divorciado/viudo

d). Variable: Tipo de sangres: A/B/AB/O

Page 16: PresentacióN EstadíStica Inicio

• B)Categóricos ordinales

En esta escala, los datos también son categorías

de clasificación, pero existe un orden intrínseco

entre las categorías acorde con la variable que

se está midiendo.

Los datos pueden ser ordenados.

Page 17: PresentacióN EstadíStica Inicio

Datos Numéricos

• A) Discretos

Se encuentran cuando las observaciones en cuestión toman sólo un cierto número de valores.

Ejemplos.

Conteos de eventos: número de hijos, número de visitas al doctor.

Page 18: PresentacióN EstadíStica Inicio

• B) Numéricos continuos

Ser obtienen por medio de mediciones

Ejemplos:

Peso, altura, temperatura, edad, presión sanguínea, nivel de colesterol, % de grasa, etc.

Page 19: PresentacióN EstadíStica Inicio

• Estadísticamente, la escala de medición juega un papel muy importante. Las metodologías que se pueden aplicar en el análisis de datos están restringidas por la escala en la cual la variable fue medida.

Page 20: PresentacióN EstadíStica Inicio

Población estadística

• Conjunto de todos los valores posibles de una variable.

Ejemplos

• 1). Todos los pesos obtenidos para un objeto

dado.

• 2). Todos los valores de color para un conjunto

de objetos dados.

• 3). Todas las calificaciones obtenidas en una

materia por los grupos de una universidadada.

Page 21: PresentacióN EstadíStica Inicio

Frecuencias

Clases Absolutas

10-20 2

20-30 8

30-40 12

40-50 7

50-60 1

30

0 10 20 30 40 50 60

Clases

0

2

4

6

8

10

12

fi

Distribución

Una distribución estadística es una función queindica la frecuencia de cada dato es unapoblación dada

Page 22: PresentacióN EstadíStica Inicio

Distribuciones mediante ecuaciones

0 1 2 3 4

X

0

0.1

0.2

0.3

0.4

0.5

p(x)

0 2 4 6 8

X

0

0.1

0.2

0.3

0.4

0.5

f(x)

xx

xCxp3

13 21

2x

exxf

Page 23: PresentacióN EstadíStica Inicio

-4 -2 0 2 4

X

0

0.1

0.2

0.3

0.4

f(x) Normal E standar

0 0.2 0 .4 0 .6 0 .8 1

X

0

0.4

0.8

1 .2

1 .6

2

2.4

f(x ) B eta

2

2

2

1)(

x

exf 111 xxxf

Page 24: PresentacióN EstadíStica Inicio

Un parámetro es una constanteasociada a la distribución de una poblaciónestadística.

Ejemplos

Normal

Exponencial

Poisson

, 2

Parámetro

2

2

1

2

1)(

x

exf

xexf

!x

exf

x

Page 25: PresentacióN EstadíStica Inicio

MuestraPorción o parte seleccionada de una

población estadística de interés.

Ejemplos

Población:

Muestra:

Edad de los estudiantes en una universidad.

Estudiantes mayores de 20 años.

Page 26: PresentacióN EstadíStica Inicio

Estadísticos

Las características numéricas calculadas a partir de una muestra sedenominarán estadísticos.

Ejemplos

s2

proporción

varianza

media

x

Page 27: PresentacióN EstadíStica Inicio

Estadística descriptiva

Procedimiento matemáticos paratransformar un conjunto de datos en índicesque resuman las características de unapoblación o una muestra

Los procedimientos pueden sertabulares, gráficos o numéricos.

Page 28: PresentacióN EstadíStica Inicio

Métodos gráficos1). Tablas de Frecuencias.2). Histogramas.3). Polígonos.4). Ojivas (Distribuciones de frecuencias acumuladas).

Los métodos gráficos permiten estudiar,a partir de la distribución de un conjunto dedatos, aspectos tales como: Forma,Localización (centro), Dispersión.

Page 29: PresentacióN EstadíStica Inicio

Ofrece un resumen mas compacto de los datos

1.- Elegir un intervalo que contenga todos lospuntos.

2.- Dividirlo en subintervalos (intervalos declase) de la misma longitud. Sus puntosmedios se llaman marca de clase.

3.- Frecuencia de clase es el número devalores en una clase. Los dividimos entre eltamaño de la muestra (frec. relativa declase).

Tabla de Frecuencias Cuantitativas

Page 30: PresentacióN EstadíStica Inicio

4.- Frecuencia acumulada de clase es el número

de valores que pertenecen a esta y a las

anteriores clases. Divididas entre el tamaño de

la muestra se llama frecuencia relativa

acumulada de clase.

Page 31: PresentacióN EstadíStica Inicio

5.- Determine el número de clases (k)

Para determinar el valor de k se puedeusar cualquiera de los tres criterios siguientes:

b)k = 1 + 3.3log10(n)

c) Use la tabla siguiente

a) k = n

Page 32: PresentacióN EstadíStica Inicio

Métodos Numéricos

Medidas de tendencia central.

Sea x1,x2,..,xn, una muestra aleatoria(m.a.) de tamaño n de una población.

El primer paso para describir un conjuntode datos es definir un representante o centro,existen varios:

a). Media:n

xxx

n

x

x n

n

i

i

211

Page 33: PresentacióN EstadíStica Inicio

Ejemplo 1Valores de colesterol total/LAD en 9

pacientes sin crecimiento de lesiónaterosclerótica.

23.69

)6.48.32.70.6( x

Calcule la media:

“Los pacientes muestran en promedio6.23 mMol/L de colesterol”

6.0 7.2 6.4 6.0 5.5 5.8 8.8 4.5 5.9

Page 34: PresentacióN EstadíStica Inicio

La media se emplea cuando los datospueden sumarse; es decir, se miden en unaescala numérica.

La media es muy sensible a datos extremos oatípicos.

Notas:

Si colocáramos los datos en una balanza,la media sería el centro.

Page 35: PresentacióN EstadíStica Inicio

Ejemplo

Calcule la mediana para los datos delejemplo 1

La muestra ordenada queda:

x(1)=4.5 x(2)= 5.5 x(3)= 5.8 x(4)= 5.9 x(5)=6.0 x(6)=6.0 x(7)=6.4 x(8)=7.2 x(9)=8.8

6.0 7.2 6.4 6.0 5.5 5.8 8.8 4.5 5.9

Como n=9 es impar por tanto, la mediana es

0.6~5

xx

Page 36: PresentacióN EstadíStica Inicio

“El 50% de los pacientes tiene niveles decolesterol mayores (menores) a 6.0 mMol/L”

Para observar como la mediana esmenos sensible a datos extremos, eliminemosel dato 8.8. Y la mediana resulta en 5.91

La mediana resultó menos afectada que la media.

Nota:

La mediana puede utilizarse tanto paradatos numéricos como ordinales.

Page 37: PresentacióN EstadíStica Inicio

C). Moda:

EjemploCalcule la moda del ejemplo 1

Es la observación que se presenta conmayor frecuencia en la muestra.

El dato mas frecuente es 6.0 mMol/L., portanto la moda es 6.

Solución:

Page 38: PresentacióN EstadíStica Inicio

Relación entre: Media, mediana (m) y moda(M)

m

M

x

M mx

Figura 1 Figura 2

Page 39: PresentacióN EstadíStica Inicio

¿Cuál medida utilizar?

Si la distribución de los datos es simétrica, y lavariable es cuantitativa, de acuerdo a la figura 1,las tres medidas de tendencia central coinciden.

Si la variable es cualitativa se prefiere lamediana. Así mismo, si considera la posibilidadde que la muestra contenga datos atípicos.

Page 40: PresentacióN EstadíStica Inicio

Las propiedades matemáticas y estadísticas de lamedia hacen de esta la mas importante. Otraspropiedades la hacen elección universal.

Notas:

1). La media es afectada por datos extremos.

2). La mediana no es fácil de manipular

algebraicamente.

3). La moda puede no existir o haber varias

modas.

Page 41: PresentacióN EstadíStica Inicio

Medidas de Variabilidad

Una medida de variabilidad (o dispersión) esun valor numérico que indica la magnitud dela separación entre los elementos de unamuestra o población.

Page 42: PresentacióN EstadíStica Inicio

A: 10 20 60 B: 28 29 33

Compare los datos de tiempo de vida enratones sometidos al tratamiento A ytratamiento B.

Ejemplo

nA=3, nB=3Media= 30, Media =30

Solución

En ambos casos “el tiempo de vida promedio es de 30 semanas”. Sin embargo, existe mayor variabilidad en los datos de tratamiento A.

Veremos algunas formas de medir variabilidad.

Page 43: PresentacióN EstadíStica Inicio

Hay al menos dos razones para medirvariabilidad.

1)Para tener una idea de la precisión con laque un valor central muestral representa a lapoblación.2)Para conocer la magnitud de la variabilidad yasí poder tomar medidas para su control.

Page 44: PresentacióN EstadíStica Inicio

Las medidas de dispersión más utilizadas son:

a) El rangob) La varianzac) La desviación estándard) Coeficiente de variación

Comúnmente, la variabilidad se expresacomo una desviación promedio de los datoscon respecto al centro.

También puede expresarse como laposición de un dato con respecto a los demás.

Page 45: PresentacióN EstadíStica Inicio

a)El rango es mínimomáximoR

Ejemplo

La muestra A tiene mayor variabilidad que laB.

Calcule el rango para el ejemplo anterior.

Solución:

RA= 50 - 60 = 50 RB = 33- 28 = 5

Nota: Aun cuando el rango es una medidasencilla de variabilidad, solo toma en cuentados datos para su cálculo.

Page 46: PresentacióN EstadíStica Inicio

b). La varianza es

n

i

i xxn

s

1

22

1

1

Calcule la varianza de los datos anteriores

70030603020301013

1 2222

As

730333029302813

1 2222

Bs

Preferimos tratamiento B porque tienemenor variabilidad

Page 47: PresentacióN EstadíStica Inicio

La varianza se expresa un unidadescuadradas, en el ejemplo anterior sonsemanas al cuadrado, si calculamos raízcuadrada se obtiene una medida devariabilidad en las mismas unidades que losdatos originales; asi se define la desviaciónestándar o típica.

Page 48: PresentacióN EstadíStica Inicio

c). La desviación estándar es

n

i

i xxn

ss

1

22

1

1

7002

AS 7

2

BS

45.26A

S 645.2B

Ssem sem

sem2sem2

Page 49: PresentacióN EstadíStica Inicio

Gracias …

Lupita Valdez Zazueta