PresentacióN EstadíStica Inicio

Preview:

Citation preview

Temas de discusión

Estadística descriptiva

Probabilidad

Estimación

Prueba de hipótesis

Diseño de Experimentos

Estadística en la computadora

Estadística

Proporciona un conjunto de principios y

metodologías para:

• colecta de datos

• su presentación y resumen,

• su interpretación

• Extraer conclusiones y generalidades

Su aplicación en medicina

• Estadística vitales

Para facilitar su uso se requiere una comprensiónbásica de la forma en que se determinan, quesignifican y como se emplean

• Epidemiología

Los datos epidemiológicos muestran la prevalenciade una enfermedad, la forma en que varía deacuerdo a la estación de año, la ubicacióngeográfica y como le afectan ciertos factores deriesgo

¿Qué tan sensible es una prueba dediagnóstico para la identificación dela presencia de la enfermedad y concuanta frecuencia arroja resultados

erróneos?

Procedimientos de diagnóstico

Valoración de protocolos de investigación

Ningún estudio proporcionainformación válida a menos que sediseñe y analice en forma científica.

Participación o dirección en proyectos de investigación

Es indispensable el conocimiento de la estadística y sus métodos de estudio, con él, podremos ser participantes activos en todos los aspectos de la investigación.

Algunas ramas de la estadística

• El diseño de experimentos guía al investigadora planear la manera y cuantos datos colectar.

• La estadística descriptiva resume y describelas características importantes de los datos.

• La inferencia estadística evalúa la informaciónpresente en los datos e indica el nuevoconocimiento ganado con esta información.

Objetivos principales de la estadística

• Hacer inferencias sobre una población a partirdel análisis de la información de una muestra.

• Esto incluye medir el porcentaje deincertidumbre involucrado en estasinferencias.

• Diseñar el proceso de muestreo y el tamañode la muestra de manera que las inferenciassean válidas.

• Los datos de un experimento proporcionan unnuevo conocimiento, y este en ocasionessugiere una revisión de la teoría existente elcual requerirá mas investigación a través demas experimento y análisis de datos.

Teoría de probabilidades

Estudia los métodos de análisis que soncomunes en el tratamiento defenómenos aleatorios, cualquiera quesea el área donde se presenten

Dos conceptos básicos: Población y muestra

Una población (estadística) es el conjunto de

medidas (o registros) correspondientes a la

colección completa de unidades de la cual se

quiere inferir.

Una muestra de una población estadística es

el conjunto de medidas que se colectan en el

curso de una investigación

Estadística Descriptiva

Proporciona un conjunto de herramientas tales como tablas, gráficas, promedios, y otras para organizar y resumir la información de la muestra.

• Métodos Gráficos y Tabulares

• Métodos Numéricos

Conceptos básicos

• Datos.

Los datos estadísticos son valores de unacaracterística de interés medida en unconjunto de objetos o individuos.

Son la materia prima de las investigaciones.

Tipos de datos

• Cualitativos (categóricos)

Nominales

Ordinales

• Cuantitativos (numéricos)

Continuos

Discretos

Datos categóricos

• A) Nominales

En esta escala los datos son sólo categorías de

clasificación.

Ejemplos.

a) Variable: : Fumador/no fumador

b) Variable: Diabético/no-diabético

c). Variable: Casado/soltero/divorciado/viudo

d). Variable: Tipo de sangres: A/B/AB/O

• B)Categóricos ordinales

En esta escala, los datos también son categorías

de clasificación, pero existe un orden intrínseco

entre las categorías acorde con la variable que

se está midiendo.

Los datos pueden ser ordenados.

Datos Numéricos

• A) Discretos

Se encuentran cuando las observaciones en cuestión toman sólo un cierto número de valores.

Ejemplos.

Conteos de eventos: número de hijos, número de visitas al doctor.

• B) Numéricos continuos

Ser obtienen por medio de mediciones

Ejemplos:

Peso, altura, temperatura, edad, presión sanguínea, nivel de colesterol, % de grasa, etc.

• Estadísticamente, la escala de medición juega un papel muy importante. Las metodologías que se pueden aplicar en el análisis de datos están restringidas por la escala en la cual la variable fue medida.

Población estadística

• Conjunto de todos los valores posibles de una variable.

Ejemplos

• 1). Todos los pesos obtenidos para un objeto

dado.

• 2). Todos los valores de color para un conjunto

de objetos dados.

• 3). Todas las calificaciones obtenidas en una

materia por los grupos de una universidadada.

Frecuencias

Clases Absolutas

10-20 2

20-30 8

30-40 12

40-50 7

50-60 1

30

0 10 20 30 40 50 60

Clases

0

2

4

6

8

10

12

fi

Distribución

Una distribución estadística es una función queindica la frecuencia de cada dato es unapoblación dada

Distribuciones mediante ecuaciones

0 1 2 3 4

X

0

0.1

0.2

0.3

0.4

0.5

p(x)

0 2 4 6 8

X

0

0.1

0.2

0.3

0.4

0.5

f(x)

xx

xCxp3

13 21

2x

exxf

-4 -2 0 2 4

X

0

0.1

0.2

0.3

0.4

f(x) Normal E standar

0 0.2 0 .4 0 .6 0 .8 1

X

0

0.4

0.8

1 .2

1 .6

2

2.4

f(x ) B eta

2

2

2

1)(

x

exf 111 xxxf

Un parámetro es una constanteasociada a la distribución de una poblaciónestadística.

Ejemplos

Normal

Exponencial

Poisson

, 2

Parámetro

2

2

1

2

1)(

x

exf

xexf

!x

exf

x

MuestraPorción o parte seleccionada de una

población estadística de interés.

Ejemplos

Población:

Muestra:

Edad de los estudiantes en una universidad.

Estudiantes mayores de 20 años.

Estadísticos

Las características numéricas calculadas a partir de una muestra sedenominarán estadísticos.

Ejemplos

s2

proporción

varianza

media

x

Estadística descriptiva

Procedimiento matemáticos paratransformar un conjunto de datos en índicesque resuman las características de unapoblación o una muestra

Los procedimientos pueden sertabulares, gráficos o numéricos.

Métodos gráficos1). Tablas de Frecuencias.2). Histogramas.3). Polígonos.4). Ojivas (Distribuciones de frecuencias acumuladas).

Los métodos gráficos permiten estudiar,a partir de la distribución de un conjunto dedatos, aspectos tales como: Forma,Localización (centro), Dispersión.

Ofrece un resumen mas compacto de los datos

1.- Elegir un intervalo que contenga todos lospuntos.

2.- Dividirlo en subintervalos (intervalos declase) de la misma longitud. Sus puntosmedios se llaman marca de clase.

3.- Frecuencia de clase es el número devalores en una clase. Los dividimos entre eltamaño de la muestra (frec. relativa declase).

Tabla de Frecuencias Cuantitativas

4.- Frecuencia acumulada de clase es el número

de valores que pertenecen a esta y a las

anteriores clases. Divididas entre el tamaño de

la muestra se llama frecuencia relativa

acumulada de clase.

5.- Determine el número de clases (k)

Para determinar el valor de k se puedeusar cualquiera de los tres criterios siguientes:

b)k = 1 + 3.3log10(n)

c) Use la tabla siguiente

a) k = n

Métodos Numéricos

Medidas de tendencia central.

Sea x1,x2,..,xn, una muestra aleatoria(m.a.) de tamaño n de una población.

El primer paso para describir un conjuntode datos es definir un representante o centro,existen varios:

a). Media:n

xxx

n

x

x n

n

i

i

211

Ejemplo 1Valores de colesterol total/LAD en 9

pacientes sin crecimiento de lesiónaterosclerótica.

23.69

)6.48.32.70.6( x

Calcule la media:

“Los pacientes muestran en promedio6.23 mMol/L de colesterol”

6.0 7.2 6.4 6.0 5.5 5.8 8.8 4.5 5.9

La media se emplea cuando los datospueden sumarse; es decir, se miden en unaescala numérica.

La media es muy sensible a datos extremos oatípicos.

Notas:

Si colocáramos los datos en una balanza,la media sería el centro.

Ejemplo

Calcule la mediana para los datos delejemplo 1

La muestra ordenada queda:

x(1)=4.5 x(2)= 5.5 x(3)= 5.8 x(4)= 5.9 x(5)=6.0 x(6)=6.0 x(7)=6.4 x(8)=7.2 x(9)=8.8

6.0 7.2 6.4 6.0 5.5 5.8 8.8 4.5 5.9

Como n=9 es impar por tanto, la mediana es

0.6~5

xx

“El 50% de los pacientes tiene niveles decolesterol mayores (menores) a 6.0 mMol/L”

Para observar como la mediana esmenos sensible a datos extremos, eliminemosel dato 8.8. Y la mediana resulta en 5.91

La mediana resultó menos afectada que la media.

Nota:

La mediana puede utilizarse tanto paradatos numéricos como ordinales.

C). Moda:

EjemploCalcule la moda del ejemplo 1

Es la observación que se presenta conmayor frecuencia en la muestra.

El dato mas frecuente es 6.0 mMol/L., portanto la moda es 6.

Solución:

Relación entre: Media, mediana (m) y moda(M)

m

M

x

M mx

Figura 1 Figura 2

¿Cuál medida utilizar?

Si la distribución de los datos es simétrica, y lavariable es cuantitativa, de acuerdo a la figura 1,las tres medidas de tendencia central coinciden.

Si la variable es cualitativa se prefiere lamediana. Así mismo, si considera la posibilidadde que la muestra contenga datos atípicos.

Las propiedades matemáticas y estadísticas de lamedia hacen de esta la mas importante. Otraspropiedades la hacen elección universal.

Notas:

1). La media es afectada por datos extremos.

2). La mediana no es fácil de manipular

algebraicamente.

3). La moda puede no existir o haber varias

modas.

Medidas de Variabilidad

Una medida de variabilidad (o dispersión) esun valor numérico que indica la magnitud dela separación entre los elementos de unamuestra o población.

A: 10 20 60 B: 28 29 33

Compare los datos de tiempo de vida enratones sometidos al tratamiento A ytratamiento B.

Ejemplo

nA=3, nB=3Media= 30, Media =30

Solución

En ambos casos “el tiempo de vida promedio es de 30 semanas”. Sin embargo, existe mayor variabilidad en los datos de tratamiento A.

Veremos algunas formas de medir variabilidad.

Hay al menos dos razones para medirvariabilidad.

1)Para tener una idea de la precisión con laque un valor central muestral representa a lapoblación.2)Para conocer la magnitud de la variabilidad yasí poder tomar medidas para su control.

Las medidas de dispersión más utilizadas son:

a) El rangob) La varianzac) La desviación estándard) Coeficiente de variación

Comúnmente, la variabilidad se expresacomo una desviación promedio de los datoscon respecto al centro.

También puede expresarse como laposición de un dato con respecto a los demás.

a)El rango es mínimomáximoR

Ejemplo

La muestra A tiene mayor variabilidad que laB.

Calcule el rango para el ejemplo anterior.

Solución:

RA= 50 - 60 = 50 RB = 33- 28 = 5

Nota: Aun cuando el rango es una medidasencilla de variabilidad, solo toma en cuentados datos para su cálculo.

b). La varianza es

n

i

i xxn

s

1

22

1

1

Calcule la varianza de los datos anteriores

70030603020301013

1 2222

As

730333029302813

1 2222

Bs

Preferimos tratamiento B porque tienemenor variabilidad

La varianza se expresa un unidadescuadradas, en el ejemplo anterior sonsemanas al cuadrado, si calculamos raízcuadrada se obtiene una medida devariabilidad en las mismas unidades que losdatos originales; asi se define la desviaciónestándar o típica.

c). La desviación estándar es

n

i

i xxn

ss

1

22

1

1

7002

AS 7

2

BS

45.26A

S 645.2B

Ssem sem

sem2sem2

Gracias …

Lupita Valdez Zazueta

Recommended