Upload
gudalupe-valdez
View
8.357
Download
0
Embed Size (px)
Citation preview
Temas de discusión
Estadística descriptiva
Probabilidad
Estimación
Prueba de hipótesis
Diseño de Experimentos
Estadística en la computadora
Estadística
Proporciona un conjunto de principios y
metodologías para:
• colecta de datos
• su presentación y resumen,
• su interpretación
• Extraer conclusiones y generalidades
Su aplicación en medicina
• Estadística vitales
Para facilitar su uso se requiere una comprensiónbásica de la forma en que se determinan, quesignifican y como se emplean
• Epidemiología
Los datos epidemiológicos muestran la prevalenciade una enfermedad, la forma en que varía deacuerdo a la estación de año, la ubicacióngeográfica y como le afectan ciertos factores deriesgo
¿Qué tan sensible es una prueba dediagnóstico para la identificación dela presencia de la enfermedad y concuanta frecuencia arroja resultados
erróneos?
Procedimientos de diagnóstico
Valoración de protocolos de investigación
Ningún estudio proporcionainformación válida a menos que sediseñe y analice en forma científica.
Participación o dirección en proyectos de investigación
Es indispensable el conocimiento de la estadística y sus métodos de estudio, con él, podremos ser participantes activos en todos los aspectos de la investigación.
Algunas ramas de la estadística
• El diseño de experimentos guía al investigadora planear la manera y cuantos datos colectar.
• La estadística descriptiva resume y describelas características importantes de los datos.
• La inferencia estadística evalúa la informaciónpresente en los datos e indica el nuevoconocimiento ganado con esta información.
Objetivos principales de la estadística
• Hacer inferencias sobre una población a partirdel análisis de la información de una muestra.
• Esto incluye medir el porcentaje deincertidumbre involucrado en estasinferencias.
• Diseñar el proceso de muestreo y el tamañode la muestra de manera que las inferenciassean válidas.
• Los datos de un experimento proporcionan unnuevo conocimiento, y este en ocasionessugiere una revisión de la teoría existente elcual requerirá mas investigación a través demas experimento y análisis de datos.
Teoría de probabilidades
Estudia los métodos de análisis que soncomunes en el tratamiento defenómenos aleatorios, cualquiera quesea el área donde se presenten
Dos conceptos básicos: Población y muestra
Una población (estadística) es el conjunto de
medidas (o registros) correspondientes a la
colección completa de unidades de la cual se
quiere inferir.
Una muestra de una población estadística es
el conjunto de medidas que se colectan en el
curso de una investigación
Estadística Descriptiva
Proporciona un conjunto de herramientas tales como tablas, gráficas, promedios, y otras para organizar y resumir la información de la muestra.
• Métodos Gráficos y Tabulares
• Métodos Numéricos
Conceptos básicos
• Datos.
Los datos estadísticos son valores de unacaracterística de interés medida en unconjunto de objetos o individuos.
Son la materia prima de las investigaciones.
Tipos de datos
• Cualitativos (categóricos)
Nominales
Ordinales
• Cuantitativos (numéricos)
Continuos
Discretos
Datos categóricos
• A) Nominales
En esta escala los datos son sólo categorías de
clasificación.
Ejemplos.
a) Variable: : Fumador/no fumador
b) Variable: Diabético/no-diabético
c). Variable: Casado/soltero/divorciado/viudo
d). Variable: Tipo de sangres: A/B/AB/O
• B)Categóricos ordinales
En esta escala, los datos también son categorías
de clasificación, pero existe un orden intrínseco
entre las categorías acorde con la variable que
se está midiendo.
Los datos pueden ser ordenados.
Datos Numéricos
• A) Discretos
Se encuentran cuando las observaciones en cuestión toman sólo un cierto número de valores.
Ejemplos.
Conteos de eventos: número de hijos, número de visitas al doctor.
• B) Numéricos continuos
Ser obtienen por medio de mediciones
Ejemplos:
Peso, altura, temperatura, edad, presión sanguínea, nivel de colesterol, % de grasa, etc.
• Estadísticamente, la escala de medición juega un papel muy importante. Las metodologías que se pueden aplicar en el análisis de datos están restringidas por la escala en la cual la variable fue medida.
Población estadística
• Conjunto de todos los valores posibles de una variable.
Ejemplos
• 1). Todos los pesos obtenidos para un objeto
dado.
• 2). Todos los valores de color para un conjunto
de objetos dados.
• 3). Todas las calificaciones obtenidas en una
materia por los grupos de una universidadada.
Frecuencias
Clases Absolutas
10-20 2
20-30 8
30-40 12
40-50 7
50-60 1
30
0 10 20 30 40 50 60
Clases
0
2
4
6
8
10
12
fi
Distribución
Una distribución estadística es una función queindica la frecuencia de cada dato es unapoblación dada
Distribuciones mediante ecuaciones
0 1 2 3 4
X
0
0.1
0.2
0.3
0.4
0.5
p(x)
0 2 4 6 8
X
0
0.1
0.2
0.3
0.4
0.5
f(x)
xx
xCxp3
13 21
2x
exxf
-4 -2 0 2 4
X
0
0.1
0.2
0.3
0.4
f(x) Normal E standar
0 0.2 0 .4 0 .6 0 .8 1
X
0
0.4
0.8
1 .2
1 .6
2
2.4
f(x ) B eta
2
2
2
1)(
x
exf 111 xxxf
Un parámetro es una constanteasociada a la distribución de una poblaciónestadística.
Ejemplos
Normal
Exponencial
Poisson
, 2
Parámetro
2
2
1
2
1)(
x
exf
xexf
!x
exf
x
MuestraPorción o parte seleccionada de una
población estadística de interés.
Ejemplos
Población:
Muestra:
Edad de los estudiantes en una universidad.
Estudiantes mayores de 20 años.
Estadísticos
Las características numéricas calculadas a partir de una muestra sedenominarán estadísticos.
Ejemplos
s2
proporción
varianza
media
p̂
x
Estadística descriptiva
Procedimiento matemáticos paratransformar un conjunto de datos en índicesque resuman las características de unapoblación o una muestra
Los procedimientos pueden sertabulares, gráficos o numéricos.
Métodos gráficos1). Tablas de Frecuencias.2). Histogramas.3). Polígonos.4). Ojivas (Distribuciones de frecuencias acumuladas).
Los métodos gráficos permiten estudiar,a partir de la distribución de un conjunto dedatos, aspectos tales como: Forma,Localización (centro), Dispersión.
Ofrece un resumen mas compacto de los datos
1.- Elegir un intervalo que contenga todos lospuntos.
2.- Dividirlo en subintervalos (intervalos declase) de la misma longitud. Sus puntosmedios se llaman marca de clase.
3.- Frecuencia de clase es el número devalores en una clase. Los dividimos entre eltamaño de la muestra (frec. relativa declase).
Tabla de Frecuencias Cuantitativas
4.- Frecuencia acumulada de clase es el número
de valores que pertenecen a esta y a las
anteriores clases. Divididas entre el tamaño de
la muestra se llama frecuencia relativa
acumulada de clase.
5.- Determine el número de clases (k)
Para determinar el valor de k se puedeusar cualquiera de los tres criterios siguientes:
b)k = 1 + 3.3log10(n)
c) Use la tabla siguiente
a) k = n
Métodos Numéricos
Medidas de tendencia central.
Sea x1,x2,..,xn, una muestra aleatoria(m.a.) de tamaño n de una población.
El primer paso para describir un conjuntode datos es definir un representante o centro,existen varios:
a). Media:n
xxx
n
x
x n
n
i
i
211
Ejemplo 1Valores de colesterol total/LAD en 9
pacientes sin crecimiento de lesiónaterosclerótica.
23.69
)6.48.32.70.6( x
Calcule la media:
“Los pacientes muestran en promedio6.23 mMol/L de colesterol”
6.0 7.2 6.4 6.0 5.5 5.8 8.8 4.5 5.9
La media se emplea cuando los datospueden sumarse; es decir, se miden en unaescala numérica.
La media es muy sensible a datos extremos oatípicos.
Notas:
Si colocáramos los datos en una balanza,la media sería el centro.
Ejemplo
Calcule la mediana para los datos delejemplo 1
La muestra ordenada queda:
x(1)=4.5 x(2)= 5.5 x(3)= 5.8 x(4)= 5.9 x(5)=6.0 x(6)=6.0 x(7)=6.4 x(8)=7.2 x(9)=8.8
6.0 7.2 6.4 6.0 5.5 5.8 8.8 4.5 5.9
Como n=9 es impar por tanto, la mediana es
0.6~5
xx
“El 50% de los pacientes tiene niveles decolesterol mayores (menores) a 6.0 mMol/L”
Para observar como la mediana esmenos sensible a datos extremos, eliminemosel dato 8.8. Y la mediana resulta en 5.91
La mediana resultó menos afectada que la media.
Nota:
La mediana puede utilizarse tanto paradatos numéricos como ordinales.
C). Moda:
EjemploCalcule la moda del ejemplo 1
Es la observación que se presenta conmayor frecuencia en la muestra.
El dato mas frecuente es 6.0 mMol/L., portanto la moda es 6.
Solución:
Relación entre: Media, mediana (m) y moda(M)
m
M
x
M mx
Figura 1 Figura 2
¿Cuál medida utilizar?
Si la distribución de los datos es simétrica, y lavariable es cuantitativa, de acuerdo a la figura 1,las tres medidas de tendencia central coinciden.
Si la variable es cualitativa se prefiere lamediana. Así mismo, si considera la posibilidadde que la muestra contenga datos atípicos.
Las propiedades matemáticas y estadísticas de lamedia hacen de esta la mas importante. Otraspropiedades la hacen elección universal.
Notas:
1). La media es afectada por datos extremos.
2). La mediana no es fácil de manipular
algebraicamente.
3). La moda puede no existir o haber varias
modas.
Medidas de Variabilidad
Una medida de variabilidad (o dispersión) esun valor numérico que indica la magnitud dela separación entre los elementos de unamuestra o población.
A: 10 20 60 B: 28 29 33
Compare los datos de tiempo de vida enratones sometidos al tratamiento A ytratamiento B.
Ejemplo
nA=3, nB=3Media= 30, Media =30
Solución
En ambos casos “el tiempo de vida promedio es de 30 semanas”. Sin embargo, existe mayor variabilidad en los datos de tratamiento A.
Veremos algunas formas de medir variabilidad.
Hay al menos dos razones para medirvariabilidad.
1)Para tener una idea de la precisión con laque un valor central muestral representa a lapoblación.2)Para conocer la magnitud de la variabilidad yasí poder tomar medidas para su control.
Las medidas de dispersión más utilizadas son:
a) El rangob) La varianzac) La desviación estándard) Coeficiente de variación
Comúnmente, la variabilidad se expresacomo una desviación promedio de los datoscon respecto al centro.
También puede expresarse como laposición de un dato con respecto a los demás.
a)El rango es mínimomáximoR
Ejemplo
La muestra A tiene mayor variabilidad que laB.
Calcule el rango para el ejemplo anterior.
Solución:
RA= 50 - 60 = 50 RB = 33- 28 = 5
Nota: Aun cuando el rango es una medidasencilla de variabilidad, solo toma en cuentados datos para su cálculo.
b). La varianza es
n
i
i xxn
s
1
22
1
1
Calcule la varianza de los datos anteriores
70030603020301013
1 2222
As
730333029302813
1 2222
Bs
Preferimos tratamiento B porque tienemenor variabilidad
La varianza se expresa un unidadescuadradas, en el ejemplo anterior sonsemanas al cuadrado, si calculamos raízcuadrada se obtiene una medida devariabilidad en las mismas unidades que losdatos originales; asi se define la desviaciónestándar o típica.
c). La desviación estándar es
n
i
i xxn
ss
1
22
1
1
7002
AS 7
2
BS
45.26A
S 645.2B
Ssem sem
sem2sem2
Gracias …
Lupita Valdez Zazueta