ESCUELA:
PONENTE:
ESTADISTICA I
CICLO:
INFORMATICA
Ing. Carlina Rueda
OCTUBRE 2008 – FEBRERO 2009
BIMESTRE: I BIMESTRE
• Métodos de adquisición del conocimiento• Terminología básica• Estadística descriptiva e inferencial• Escalas de medición• Variables continuas y discretas• Distribuciones de frecuencias • Medidas de tendencia central y
variabilidad
CONTENIDOS:
1.1 MÉTODOS DE ADQUISICIÓN DEL CONOCIMIENTO
Cuatro métodos para adquirir conocimiento:Autoridad: la verdad es una tradición o alguna persona importante dice que lo es.
Racionalismo: mediante el razonamiento correcto de acuerdo con las reglas de la lógica las conclusiones llegarán a la verdad.
Intuición: con frecuencia la idea parece surgir después de que ha fallado el razonamiento.
Método científico: se fundamenta en la evaluación objetiva que es lo que lo distingue de los otros métodos.
1.3 CONCEPTOS BASICOS
Estadística Descriptiva: Estudia las técnicas que se utilizan para describir o caracterizar los datos obtenidos.
Estadística Inferencial: Parte de la deducción de leyes que rigen los diferentes fenómenos, para la toma de decisiones.
Población: es el conjunto de elementos de referencia sobre el que se realizan las observaciones.
Muestra: un subconjunto de casos o individuos de una población estadística.
Variable: es una característica que puede ser medida, adoptando diferentes valores en cada uno de los casos de un estudio.
Cualitativas Nacionalidad, profesor
Cuantitativas Temperatura, edad
Discretas sexo
Continuas Estatura, peso
Constantes El valor de ∏
Datos: medidas que se realizan sobre los sujetos de un experimento.
Estadística: número calculado a partir de los datos de una población.
Parámetro: valor calculado sobre los datos de una población, que cuantifica una característica de la población.
2.1 NOTACIÓN MATEMÁTICA
X o Y Variable medida
N número total de sujetos o datos
Xi es el i-ésimo dato
EJERCICIOS
Para los siguientes datos, determine:
a. b.
c. d.
13,11,12,10,8,6 654321 ====== XXXXXX
∑=
4
1i
Xi ∑=
−5
2
)2(i
Xi
∑=
3
!
2
i
X
23
1
⎟⎠
⎞⎜⎝
⎛∑=i
X
2.2 MEDICION
“La medición es la descripción de datos en términos de números” (Guilford)
Escalas de Medición: Nominales Ordinales De Intervalos De Razón
a. Escalas Nominales:Equivale a clasificar los objetos en categorías mutuamente excluyentes y darles un nombre.
b. Escalas Ordinales: Se ordenan los objetos medidos según si poseen
más, menos o la misma cantidad de la variable medida.
c. Escalas de Intervalos:Tiene intervalos iguales entre las unidades adyacentes. Las diferencias equivalentes entre los números son de la misma magnitud en la variable
d. Escalas de Razones:Posee las propiedades de magnitud, intervalos iguales entre las unidades adyacentes y un cero absoluto.
2.3 VARIABLES
Variables Continuas:Teóricamente puede asumir un número infinito de valores entre las unidades adyacentes de una escala.
Variables Discretas: Para la cual no existen valores posibles entre las
unidades adyacentes en una escala.
2.4 CIFRAS SIGNIFICATIVAS
Redondeo:
NúmeroRespuesta; Residuo
Residuo decimal
Respuesta final
Razón
34.01350
34.01;350 .350 34.01 El residuo decimal es menor que ½ se deja el ultimo digito.
34.01761
34.01;761 .761 34.02 El residuo decimal es mayor que ½, le sumo uno al ultimo digito.
45.04500
45.04;500 .500 45.04 El residuo decimal es igual a ½ y el ultimo dígito es par
45.05500
45.05;500 .500 45.06 El residuo decimal es igual a ½ y el ultimo dígito es impar
EJERCICIOS
Redondee cada uno de los siguientes números a una cifra decimal, dos cifras decimales y tres decimales.
39.8899 45.2534 55.5650 75.5350
3.1 DISTRIBUCION DE FRECUENCIAS
• Presenta los valores de los datos y su frecuencia de aparición, enumerados en orden donde por lo general el valor del dato menor aparece en la parte inferior.
• Muestra los datos de una manera que facilite su comprensión e interpretación.
Dist. de Frecuencia Relativa: Proporción del número total de datos que aparecen en cada intervalo.
Dist. de Frecuencia Acumulada: Número de datos que esta por debajo del limite real superior de cada intervalo.
Dist. de Porcentaje Acumulados: Porcentaje de datos que esta por debajo del limite real superior de cada intervalo.
N
fflativa =Re
100*%N
fAcumuladaacumulado =
Distribución de Frecuencia de datos no Agrupados: Corresponde a la variables discretas, se ordena los
valores de menor a mayor y cuantas se observa este valor.
Edad N° niños
xi ni fi Ni Fi
5 27 0,11 27 0,116 21 0,08 48 0,197 34 0,14 82 0,33
8 30 0,12 112 0,459 38 0,15 150 0,60
10 33 0,13 183 0,7311 32 0,13 215 0,8612 35 0,14 250 1,00
250 1,00
Distribución de Frecuencia de datos Agrupados: Asocia a las variable continuas, a través de intervalos en
los que agrupar los valores de la variables así como la amplitud de los mismos.
Edad N° niños
xi ni fi Ni Fi
11-12 67 0,27 67 0,27
9-10 71 0,28 138 0,55
7-8 64 0,26 202 0,81
5-6 48 0,19 250 1,00
250 1,00
ELABORACION DE UNA DISTRIBUCION DE FRECUENCIAS AGRUPADAS
1. Determinar el rango
2. Determinar la amplitud de cada intervalo de clase (i)
lasetervalodecNúmerodeIn
Rangoi =
min.max. DatDatRango −=
3. Listar los intervalos: El limite inferior debe contener al dato
mínimo El limite inferior del intervalo sea divisible
para i.
4. Conteo de datos
3. Suma de Frecuencias
3.2 PERCENTILES
“Son medidas de posición relativa”
PUNTO PERCENTIL: valor sobre la escala de medición, debajo del cual se encuentra un porcentaje dado de los datos incluidos en la distribución.
( )AcumuladafAcumuladaff
iXP Lp
iL −⎟⎟
⎠
⎞⎜⎜⎝
⎛+=
RANGO DE PERCENTIL: Es el porcentaje de datos que tienen valores más bajos que el dato en cuestión.
( )100*
N
xxif
AcumuladafntilRangoPerce
Li
L −⎟⎠⎞
⎜⎝⎛+
=
3.3 GRAFICAS DE LAS DISTRIBUCIONES DE FRECUENCIAS
Representa datos de intervalos o de razones.1. Histogramas: barras2. Polígono de Frecuencias: puntos2. Diagrama de Tallos y de Hojas: resumir y
describir los datos de una muestra.82 8 tallo
2 hoja
EJERCICIOS
1. En una empresa se trabajo un año en un proyecto, por lo que se quiere obtener las horas trabajadas por empleados; para lo que se tomo una muestra de 50 empleados.
a. Realice una distribución de frecuencia de datos agrupados con 11 intervalos aproximadamente.
b. Elabore un histograma de la distribución.c. La distribución es simétrica o asimétrica.d. Construya un diagrama de tallo y hojas en
el que el último digito sea una hoja y los dos primeros dígitos un tallo. No repita los valores de los tallos.
320 282 341 324 340 302 336 265 313 317
310 335 353 318 296 309 308 310 277 288
314 298 315 360 275 315 297 330 296 274
250 274 318 287 284 267 292 348 302 297
270 263 269 292 298 343 284 352 345 325
2. De los datos de la tabla anterior determine:
La frecuencia relativa La frecuencia acumulada Percentil 50 Percentil 75 Rango Percentil del dato 275 Rango Percentil del dato 218
MEDIA ARITMETICA
“Suma de los datos dividida entre el número de los mismos”
Es el fundamento de muchas otras técnicas estadísticas
Se representa por M o__
X
N
XM ∑=
Propiedades:
La media es sensible al valor exacto de todos los datos de la distribución.
La suma de las desviaciones con respecto a la media es igual a cero.
La media es el centro de equilibrio de la distribución.
( )∑ =− 0XXi
Propiedades:
La suma de los cuadrados de las desviaciones de todos los datos en torno a su medida es la más pequeña posible.
( )∑ −2
XXi
MEDIANA
“El valor de la escala debajo del cual se encuentra 50% de los datos”
Se representa por Md La mediana es el dato que esta ubicado:
Si es impar en el centro Si es par es el promedio de los dos datos
ubicados al centro.
Propiedades:
La mediana es menos sensible que la media a la presencia de datos extremos.
La mediana no se ve afectada si todas las frecuencias se multiplican o dividen por una misma constante.
Para el cálculo no hace uso de toda la información que suministra la variable.
MODA
“Dato más frecuente en la distribución”
Se representa por Mo Puede existir mas de una moda:
Unimodal Bimodal Multimodal (pierde sentido)
No le afectan los valores extremadamente pequeños ni grandes.
Características:
No se usa mucho en las ciencias del comportamiento porque no es muy estable.
Propiedades similares a las de la mediana.
4.1 MEDIDAS DE VARIABILIDAD O DE DISPERSION
La variabilidad se refiere a cuan alejados de la media están los datos.
RangoDesviación EstándarVarianza
DESVIACION ESTÁNDAR
”Raíz cuadrada de la media de los cuadrados de las desviaciones con
respecto a la media de la distribución”
Distribución Poblacional Distribución Muestral
Datos en bruto
( )n
xxs
n
ii∑ −
=
2 ( )1
2
−
−=∑=
n
xxS
n
iii
( )
1
2
2
−=
−= ∑∑
N
SCS
N
xxSC
VARIANZA
”Es la diferencia entre el valor de cada observación y la media”
Varianza Poblacional Varianza Muestral
Es el promedio de las desviaciones respecto de la media aritmética
( )N
X∑ −=
2
2 μσ
( )1
2
2
−
−=∑
n
XXS
EJERCICIOS Dado los siguientes datos calcular.
1, 8,12,3,8,14,4,5,8,16 Media Mediana Moda Rango Desviación Estándar Varianza
Gracias
• E-mail: [email protected]• Telf. 2570-2750 ext. 2931• Tutoría: Martes y Miércoles de
16H00 – 18H00 pm
Recommended