36
Página 1 de 36 REPÚBLICA BOLIVARIANA DE VENEZUELA MINISTERIO DEL PODER POPULAR PARA LA EDUCACIÓN UNIVERSITARIA UNIVERSIDAD NACIONAL EXPERIMENTAL “SIMÓN RODRIGUEZ” NÚCLEO: PALO VERDE CÁTEDRA: Estadística I Curso elemental de Estadística Descriptiva. Blog: stredelcursos.blogspot.com Email: [email protected] Facilitador: Prof. Lisber Strédel Palo Verde, sábado, 03 de agosto de 2013

Curso de Estadistica Descriptiva

Embed Size (px)

Citation preview

Page 1: Curso de Estadistica Descriptiva

Página 1 de 36

REPÚBLICA BOLIVARIANA DE VENEZUELA

MINISTERIO DEL PODER POPULAR PARA

LA EDUCACIÓN UNIVERSITARIA

UNIVERSIDAD NACIONAL EXPERIMENTAL

“SIMÓN RODRIGUEZ”

NÚCLEO: PALO VERDE

CÁTEDRA: Estadística I

Curso elemental de

Estadística Descriptiva.

Blog: stredelcursos.blogspot.com

Email: [email protected]

Facilitador:

Prof. Lisber Strédel

Palo Verde, sábado, 03 de agosto de 2013

Page 2: Curso de Estadistica Descriptiva

Página 2 de 36

Contenido del Curso.

Estadística Descriptiva. ................................................................................................................... 4

Desarrollo del curso de Estadística Descriptiva.......................................................................... 6

Datos Vehículos: Documentación .................................................................................................. 6

Datos Participantes: Documentación ............................................................................................. 7

Análisis superficial de los datos. .................................................................................................... 8

1. Distribución de Frecuencias y gráfica de variables cualitativas ........................................ 9

Construcción de la Distribución de Frecuencias: En tres pasos. ............................................... 9

1.1. Distribución de Frecuencias y gráfica de la variable cualitativa: MARCA ..................... 10

1.2. Distribución de Frecuencias y gráfica de la variable cualitativa: MENCION ................ 11

2. Distribución de Frecuencias y gráfica de variables cuantitativas.................................... 13

Construcción de la Distribución de Frecuencias: En tres pasos. ............................................. 13

2.1. Distribución de Frecuencias y gráfica de la variable cuantitativa: RPM ........................ 15

2.2. Distribución de Frecuencias y gráfica de la variable cuantitativa: Nota Estad ............. 17

Gráfica de las variables cualitativas y cuantitativas. ................................................................. 18

3. Análisis Numérico para datos brutos, primarios o no agrupados. ..................................... 19

3.1. Medidas de Tendencia Central o de Promedio o de Posición. ....................................... 20

Media aritmética (Xa) = ∑ (Xi) / n donde ∑ significa sumatoria .................................................... 21

Media geométrica (Xg) = [ ∏ (Xi )]1/n donde ∏ significa productorio ...................................... 22

Media armónica (Xh) = n / ∑ (1/Xi) donde 1/Xi significa reciproco ...................................... 22

Media cuadrática(Xc) = √(∑ (Xi2) / n) donde √ significa Raiz Cuadrada ................................. 23

Media ponderada (Xw) = ∑ (WiXi) / ∑ Wi ........................................................................................... 23

Moda (Mo) No Existe fórmula sino un procedimiento y concepto ................................................... 24

Mediana (Me) No Existe fórmula sino un procedimiento y concepto .............................................. 24

Page 3: Curso de Estadistica Descriptiva

Página 3 de 36

Quartiles (Q1 ; Q2 ; Q3) No Existe fórmula sino un procedimiento y concepto ................................... 24

Percentiles (P%) No Existe fórmula sino un procedimiento y concepto ............................................ 25

Rango Percentil (Rp) No Existe fórmula sino un procedimiento y concepto .................................... 25

3.2. Medidas de Dispersión o de Variación o de Sesgo ....................................................... 26

Rango (R) también llamado Amplitud o Recorrido = Máximo - Mínimo .......................................... 26

Rango intercuartílico (RI) = Q3 – Q1 ................................................................................................... 27

Desviación cuartil (DQ) = (Q3 – Q1) / 2 .............................................................................................. 27

Desviación media (DM) = ∑ lXi - Xal/ n; ............................................................................................ 27

Desviación Estándar (σ)= √ (∑ (Xi - Xa )2 / (n-1)) ; ............................................................................ 28

Varianza (V) = σ2 = ∑ (Xi - Xa )2 /( n-1) .............................................................................................. 28

Coeficiente de variación (CV) = σ * 100 / Xa .................................................................................... 28

Coeficiente de desviación media (CDM) = DM *100 / Xa ................................................................. 29

Coeficiente de desviación cuartil (CDQ) = (Q3 – Q1) * 100 / (Q3 + Q1).............................................. 29

4. Análisis Numérico para datos procesados, secundarios o agrupados. .............................. 29

4.1. Medidas de Tendencia Central o de Promedio o de Posición. ....................................... 30

Media aritmética (Xa) = = ∑ (Xifi) / ∑fi ......................................................................................... 31

Moda (Mo) = L + (Δ1* ic/ ( Δ1 + Δ2 )) ........................................................................................... 31

Percentiles (P%) = L + ((% *n - ∑fi-1 ) / f% i ) * ic.............................................................................. 32

4.2. Medidas de Dispersión o de Variación o de Sesgo ....................................................... 33

Rango (R) también llamado Amplitud o Recorrido = Máximo - Mínimo ............................. 33

Desviación Estándar (σ)= √ (∑ (Xi - Xa )2 * fi / (n-1)) ; .............................................................. 33

Coeficiente de variación (CV) = σ * 100 / Xa .............................................................................. 34

5. Resumen de los cálculos para Datos Primarios y Datos Secundarios. ............................. 34

Conclusion. ........................................................................................................................................ 36

Page 4: Curso de Estadistica Descriptiva

Página 4 de 36

Estadística Descriptiva.

Debido a lo extenso y variado del campo cubierto por la Estadística es difícil proponer una

definición precisa del concepto. No obstante, tácitamente todos los estadísticos están de acuerdo en

clasificar la materia en dos tipos, cuales son, la Estadística Descriptiva y la Estadística Inductiva o

Inferencial.

La Estadística Descriptiva trata del resumen y descripción de los datos. Dicho resumen puede ser

Tabular, Grafico o Numérico. El análisis se limita en sí mismo a los datos coleccionados y no se

realiza inferencia alguna o generalización acerca de la totalidad de donde provienen esas

observaciones (Población).

Si bien la descripción de los hechos recolectados es a veces en sí misma el fin que se propone, en la

mayoría de los análisis estadísticos estamos realmente más al comienzo de la tarea que al término

de la misma. La estadística descriptiva no es más que el trabajo preliminar para la inferencia.

Por ejemplo, si un jefe de personal somete a un test de aptitud a un grupo de graduados

universitarios recientemente contratados; entre lo que puede hacer con los datos que resultan del

test valiéndose de la estadística descriptiva, están los aspectos siguientes: Tabular los datos o

clasificarlos de manera que con solo dar un vistazo se pueda tener una imagen general de los

mismos; calcular algunos promedios y reconocer algo sobre la aptitud típica de los empleados;

construir tablas, graficas y cuadros para visualizar el comportamiento de los datos o bien convertir

los datos brutos en rangos o en percentiles para hacer comparaciones; utilizar el promedio como

punto de localización y describir la variabilidad o dispersión de los datos. Además, si después se

obtienen ciertas medidas sobre el rendimiento en el trabajo de estos empleados, se puede tratar de

describir la relación entre los valores obtenidos en el test y dichas mediciones. Y en cuanto se

establezca una relación semejante, se puede predecir el rendimiento de un empleado en su trabajo

con base a los resultados obtenidos en el test de aptitud.

La Estadística Inferencial o Inductiva es el proceso de hacer predicciones acerca de un todo o

tomar decisiones al basarnos en la información recogida en la muestra, por lo tanto la estadística

inferencial se refiere a la rama de la estadística que trata de los procesos inferenciales, la que a su

vez comprende la teoría de estimación y prueba de hipótesis.

Al reseñar las dos facetas de la estadística, se puede resumir como sigue el significado de

estadística: “La Estadística es la ciencia, pura y aplicada, que crea, desarrolla y aplica técnicas, de

modo que pueda evaluarse la incertidumbre derivada de inferencias inductivas”.

Las decisiones estadísticas se basan en DATOS que pueden ser numéricos o categóricos, los

primeros corresponden a variables cuantitativas, mientras que los segundos a variables

Page 5: Curso de Estadistica Descriptiva

Página 5 de 36

cualitativas; no obstante también podemos estudiar situaciones donde estén presentes variables

que impliquen aptitudes, actitudes y otras características, para ello debemos aplicarles una escala

de modo que podamos medirlos, evaluarlos, estudiarlos y obtener conclusiones.

Los datos pueden contener magnitudes de una variable en fechas sucesivas, tales datos se llaman

Series Temporales o Series Cronológicas. Los datos pueden combinarse simultáneamente de

manera que el elemento tiempo no interviene, además este tipo de datos puede contener solo una

variable o dos o varias, llamadas respectivamente univariante, bivariante y multivariante.

En este momento, es importante distinguir entre una categórica (cualitativa) y una variable

numérica (cuantitativa).

Variables cualitativas son aquellas que se cuentan, no se miden en la mayoría de los casos, forman

grupos y representan características, ejemplos de ellos son:

Sexo: dicotómica Municipios del estado Profesión: Mención

Estado civil Uso de la Tierra Artículos defectuosos

Tipo de vivienda Sector productive Tamaño Grupo familiar

Desempleo o paro Aprobado o aplazados Tipo de personal

Variables cuantitativas son aquellas que se pueden medir, son numéricas y no forman grupos en la

mayoría de los casos, ejemplos de ellos son:

Ingreso en Bs.F Edades en años Gastos en pasajes

Consumo Los salarios de los obreros Evaluaciones de las

pruebas

Estatura en metros Diámetro en mm Ventas en Bs.F

Peso en Kgs Precio Años de estudio

La descripción de una sola variable, para la cual el tiempo no es un factor, supone tres mediciones

principales: la distribución, el promedio y la variación de la variable.

Page 6: Curso de Estadistica Descriptiva

Página 6 de 36

Los cálculos del promedio y de la variación suelen requerir en muchos casos de la distribución

como base, por consiguiente comenzaremos nuestro análisis formal de los datos de masas con la

distribución de una variable.

Desarrollaremos el cuadro de distribución de frecuencias y los gráficos asociados al mismo:

Histograma, polígono de frecuencias y la ojiva ascendente; luego calcularemos las medidas de

tendencia central y de dispersión y todas las otras.

Desarrollo del curso de Estadística Descriptiva

Con el objeto de facilitar la comprensión del tema, hemos decidido desarrollarlo como Estudio de

Casos, para ello nos hemos planteado dos casos a saber:

Primer Caso: Adquisición de una flota de vehículos por Marcas para una empresa privada u

organismo gubernamental o empresa del estado.

Segundo Caso: Contratación de participantes de la UNESR por Mención de parte de una

empresa privada u organismo gubernamental o empresa del estado.

En ambos casos se ha hecho uso de DATOS, en el primer caso la información fue suministrada por

los fabricantes de vehículos en sus páginas Web, mientras que en el segundo caso, la información

fue recabada por encuestas realizadas a los participantes de la UNESR del Núcleo Palo Verde.

La información y los cálculos se presentan en un archivo denominado Anexos del Curso de

Estadística Descriptiva que pueden descargar del Blog: www.stredelcursos.blogspot.com donde

aparece con el mismo nombre.

El estudio y análisis lo iremos haciendo para ambos casos en forma simultánea, de manera que se

puedan observar las similitudes y las diferencias. Los participantes podrán darse cuenta que desde

el punto de vista estadístico, el análisis es idéntico y solo difiere en la aplicación de los casos.

Datos Vehículos: Documentación

Variables Tipo Descripción

Planilla No es variable, solo identifica la

planilla donde están los datos

Modelo No es variable, solo identifica el

modelo del vehículo, unidad de

Page 7: Curso de Estadistica Descriptiva

Página 7 de 36

Datos Participantes: Documentación

Variables Tipo Descripción

Planilla No es variable, solo identifica la

planilla donde están los datos

Cédula No es variable, solo identifica al

observación o análisis.

Marca Cualitativa Identifica la Marca

Precio Cuantitativa Precio del vehículo en Bs.F

Cilindros Cualitativa Numero de cilindros del vehículo

Cilindrada Cuantitativa Capacidad en centímetros cúbicos

Potencia Cuantitativa Potencia en HP

RPM Cuantitativa Revoluciones por minutos

Peso Cuantitativa Peso del vehículos en Kgs

Puestos Cualitativa Numero de puesto incluido el chofer

Cons90 Cuantitativa Consumo de gasolina en litros/100 Km

a 90 Km/h

Cons120 Cuantitativa Consumo de gasolina en litros/100 Km

a 120 Km/h

Consurb Cuantitativa Consumo de gasolina en litros/100 Km

en la ciudad

Velocidad Cuantitativa Velocidad en Km/h

Aceleración Cuantitativa Tiempo en segundos en alcanzar 100

Km/h

Page 8: Curso de Estadistica Descriptiva

Página 8 de 36

encuestado, unidad de muestreo o

respondiente.

Mención Cualitativa Identifica la Mención que estudia

Ingreso Fam Cuantitativa Ingreso mensual de la familia en Bs.F

Núcleo Fam Cualitativa Número de miembros en la familia

Edad Cuantitativa Edad en años

Aprec Num Cualitativa Aprecio por los números: 1 = Poco; 2 =

Medio y 3 = Mucho

Prim Eval Cuantitativa

o cualitativa

Nota de la primera evaluación en la

escala del 1 al 20

Seg Eval Cuantitativa

o cualitativa

Nota de la segunda evaluación en la

escala del 1 al 20

Género Cualitativa Género del participante

Municipio Cualitativa Municipio donde vive

Nota Estad Cuantitativa

o cualitativa

Nota de Estadística en la escala del 1 al

20

Nota Matem Cuantitativa

o cualitativa

Nota de Matemática en la escala del 1

al 20

Empleado Cualitativa Si o no está empleado actualmente

Estatura Cuantitativa Estatura en metros

Análisis superficial de los datos.

En una primera revisión al archivo: Anexos al Curso de Estadística Descriptiva, encontramos en

ambas hojas de datos, variables cualitativas y variables cuantitativas, pero es importante resaltar

que hay dos columnas o variables (En lo sucesivo nos referiremos a variables y omitiremos la

palabra columna) de datos que no representan ninguna variable. La variable Planilla en ambos

archivos solo sirve para chequear la información en caso de discrepancias o errores en la

transcripción de los datos, mientras que la variable Modelo en el archivo Vehículos o Cédula en el

Page 9: Curso de Estadistica Descriptiva

Página 9 de 36

archivo Participantes tampoco representan variables sino la unidad de muestreo o de observación

del estudio en cuestión y se utiliza con fines de supervisión de la información.

Quien tenga práctica en el examen de un conjunto de datos podrá descubrir, tras un par de

minutos y con esfuerzo considerable, la distribución de los vehículos por Marcas o de los

participantes por Menciones, mientras que para una mente no acostumbrada el cuadro anterior

carece de significado.

1. Distribución de Frecuencias y gráfica de variables cualitativas

Comenzaremos nuestro estudio, analizando las variables cualitativas, solo que en este caso lo

haremos con una de ellas en cada hoja. Utilizaremos la variable MARCA del archivo vehículo y la

variable MENCION del archivo Participantes. El curso lo hará con las demás.

Una distribución de frecuencias es un cuadro de doble entrada y debe tener la siguiente

información:

Titulo: Es el encabezado del cuadro

Columnas: Tres columnas, la primera es denominada clase, la segunda es reservada para la

frecuencia absoluta y la tercera y última se destina para la frecuencia relativa.

Total: Se ubica en la parte inferior del cuadro totalizando las frecuencias

Fuente y fecha de emisión: Se ubica en el pie de página

El grafico tiene la misma información que la distribución, solo que presentada en forma grafica.

Construcción de la Distribución de Frecuencias: En tres pasos.

Una distribución de frecuencias de variables categóricas o cualitativas muestra el número de

observaciones, absolutas o relativas, que corresponden a cada una de las clases, por otra parte, es

relativamente sencillo construirlo porque no necesitamos preocuparnos por detalles matemáticos

como los limites de clases, los intervalos de clases, los puntos medios o marcas de clases o el

número de clases o categorías que han de usarse como sucede cuando la variable es cuantitativa.

Las clases deben ser mutuamente excluyentes y exhaustivas o suficientes para contener todos los

datos. Sin embargo es muy fácil errar escogiendo clases traslapantes en vez de datos cualitativos.

1er. Paso: Formar las clases

Las clases son las diferentes Marcas o Menciones. Estas clases se obtienen de una revisión simple

de los datos.

2do. Paso: Hallar las frecuencias absolutas.

Page 10: Curso de Estadistica Descriptiva

Página 10 de 36

Las frecuencias absolutas (Cantidad de vehículos o de participantes), se obtiene contando el

número de veces que aparece cada Marca o Mención.

Los datos son la unidad de muestreo y también la unidad informante en algunos casos. Cada dato

sobre la marca corresponde a un vehículo y cada dato sobre la mención corresponde a un

participante.

3er) Paso: Calcular las frecuencias relativas porcentuales.

La frecuencia relativa porcentual se obtiene dividiendo cada valor de la frecuencia absoluta entre

el total y el resultado multiplicarlo por 100 para expresarlo en porcentaje.

1.1. Distribución de Frecuencias y gráfica de la variable cualitativa: MARCA

Distribución Muestral de los Vehículos por Marcas

MARCAS Número de Vehículos en

unidades

%

ASIA MOTORS 3 2,40

CHEVROLET 1 0,80

DAIHATSU 1 0,80

FORD 7 5,60

JEEP 10 8,00

KIA 2 1,60

LADA 2 1,60

LAND ROVER 15 12,00

MERCEDES 6 4,80

MITSUBISHI 15 12,00

NISSAN 19 15,20

OPEL 9 7,20

SSANGYONG 4 3,20

SUZUKI 19 15,20

TATA 2 1,60

Page 11: Curso de Estadistica Descriptiva

Página 11 de 36

TOYOTA 6 4,80

UAZ 4 3,20

TOTAL 125 100

Fuente: Feria del Automóvil de Francia, Noviembre 2012

Fuente: Feria del Automóvil de Francia, Noviembre 2012

Resumen: Puede observarse que la mayoría de los vehículos de la muestra son de la marca Nissan

o Suzuki con 19 vehículos cada marca lo que representan entre las dos 30.40 % ; es decir 1 de cada

3 vehículos son de las marcas Nissan o Suzuki.

1.2. Distribución de Frecuencias y gráfica de la variable cualitativa: MENCION

Distribución Muestral de los Participantes por Menciones

MENCIONES Número de Participantes

en unidades

%

Educ. Ingles 5 4,00

Educ. Inicial 19 15,20

Page 12: Curso de Estadistica Descriptiva

Página 12 de 36

Fuente: Unesr, Diciembre de 2012

Fuente: Unesr, Diciembre de 2012

Resumen: Puede observarse que la mayoría de los participantes de la muestra estudian Mercadeo

o Recursos Materiales y Financieros con 44 participantes que representan el 35,20 % del total. Es

preocupante lo que ocurre con las menciones Educación Ingles y Educación Matemática, apenas

un 5,60 %

Educ. Integral 16 12,80

Educ. Matemática 2 1,60

Informática 14 11,20

Mercadeo 24 19,20

Org y Sistema 10 8,00

Rec. Humanos 15 12,00

Rec. Mat y Financ 20 16,00

TOTAL 125 100

Page 13: Curso de Estadistica Descriptiva

Página 13 de 36

Debe resaltarse que podemos utilizar cualquier gráfico para informar sobre el comportamiento de

la variable en estudio, igualmente puede utilizarse la frecuencia absoluta o la frecuencia relativa en

cada gráfico pero no ambas porque la escala de medición de la frecuencia es diferente, es decir la

frecuencia absoluta se mide en unidades mientras que la frecuencia relativa se mide en porcentajes.

Cuando se presenta un estudio con un número de datos relativamente pequeño es decir menos de

300 observaciones, estas distribuciones se hacen manualmente pero es latoso y se genera mucho

error y cansancio visual, por ello, recomendamos que se utilice la función “Contar si” de EXCEL o

su equivalente en LINUX para realizar el trabajo.

Si el número de datos de una variable alcanza una cifra de 1200 observaciones o más, entonces es

preferible manejar esa información con software estadístico como el SPSS de una versión

actualizada, por ejemplo la versión 19 o más recientes.

2. Distribución de Frecuencias y gráfica de variables cuantitativas

Continuamos nuestro estudio, analizando las variables cuantitativas, solo que en este caso lo

haremos con una de ellas en cada hoja. Utilizaremos la variable RPM del archivo Vehículo y la

variable NOTA ESTAD del archivo Participantes. El curso lo hará con las demás.

Una distribución de frecuencias es un cuadro de doble entrada y debe tener la siguiente

información:

Titulo: Es el encabezado del cuadro

Columnas: Cinco columnas, la primera es denominada clase, la segunda es reservada para

la frecuencia absoluta, la tercera se destina para la frecuencia relativa, la cuarta es usada

para reflejar la frecuencia absoluta acumulada y la quinta y última para la frecuencia

relativa acumulada.

Total: Se ubica en la parte inferior del cuadro totalizando las frecuencias absolutas y

relativas pero no las acumuladas.

Fuente y fecha de emisión: Se ubica en el pie de página

El grafico tiene la misma información que la distribución, solo que presentada en forma grafica.

Construcción de la Distribución de Frecuencias: En tres pasos.

Una distribución de frecuencias de variables cuantitativas muestra el número de observaciones,

absolutas o relativas, simple o acumuladas, que corresponden a cada una de las clases, por otra

parte, necesitamos preocuparnos por detalles matemáticos como los limites de clases, los intervalos

de clases, los puntos medios o marcas de clases o el número de clases o categorías que han de

Page 14: Curso de Estadistica Descriptiva

Página 14 de 36

usarse. Las clases deben ser mutuamente excluyentes y exhaustivas o suficientes para contener

todos los datos. Sin embargo es muy fácil errar escogiendo clases traslapantes.

1er. Paso: Formar las clases: Cuantas y Cuales y las marcas de clases o punto medio.

a.- Encontrar los valores máximo y mínimo de los datos: Max y Min y

Calcular el rango R = Rango = Max – Min

N = 1 + 3.3 Log (n) = 1 + 1.43 Ln (n) , donde N es el numero de clases y n el numero de datos.

El valor de N se escoge generalmente entre 5 y 12

Calcular el IC = Intervalo de clase = R / N

b.- Calcular los límites superiores y límites inferiores de cada clase.

* Límite superior de cada clase: Al valor Mínimo se le suma el IC y formamos el primer

límite superior de la primera clase, luego a ese resultado le sumamos el IC y obtenemos el

segundo límite superior de la segunda clase y así se hace en forma sucesiva hasta completar

el límite superior de todos los intervalos incluyendo el último que deberá ser igual o mayor

al Máximo.

* Límite inferior de cada clase: El primer límite inferior es el Mínimo. Los límites inferiores

sucesivos de cada clase se forma sumándole una decima o centésima al límite superior del

intervalo inmediato anterior para evitar el solapamiento.

c.- Calcular las marcas de clases.

Las Marcas de clases o punto medio de las clases se halla sumando los dos valores: límite

inferior + límite superior de la clase y el total se divide entre 2; Xi = (Lim Inferior + Lim

Superior) / 2

2do. Paso: Hallar las frecuencias absolutas y relativas %.

Las frecuencias absolutas (Cantidad de vehículos o de participantes), se obtiene contando

el número de valores de la variable en estudio que contiene cada intervalo o clase

correspondiente. Previamente se va asignando cada valor a la clase a la cual pertenece o es

elemento de la misma, es decir pertenece a la clase si se encuentra dentro de los límites de la

clase.

La frecuencia relativa porcentual se obtiene dividiendo cada valor de la frecuencia absoluta

entre el total y el resultado multiplicarlo por 100 para expresarlo en porcentaje.

3er. Paso: Hallar las frecuencias acumuladas absolutas y acumuladas relativas % .

La frecuencia absoluta acumulada se halla sumando la frecuencia absoluta de arriba hacia

abajo comenzando con la primera. El valor máximo debe ser igual al total

La frecuencia relativa acumulada se halla sumando la frecuencia relativa de arriba hacia

abajo comenzando con la primera. El valor máximo debe ser igual a 100

Page 15: Curso de Estadistica Descriptiva

Página 15 de 36

Los datos son la unidad de muestreo y también la unidad informante en algunos casos. Cada dato

sobre las RPM corresponde a un vehículo y cada dato sobre la Nota Estad corresponde a un

participante.

2.1. Distribución de Frecuencias y gráfica de la variable cuantitativa: RPM

Distribución de los Vehículos en función de las revoluciones por minutos RPM

Revoluciones

Por Minutos

(RPM)

Revolución

media

Número

de

vehículos

%

Número

acumulado

de

vehículos

Porcentaje

acumulado

%

3.237,5 3599,9 3418,75 0 0

3.600,0 3.962,5 3781,25 9 7,20 9 7,20

3.962,6 4.325,0 4143,80 43 34,40 52 41,60

4.325,1 4.687,5 4506,30 17 13,60 69 55,20

4.687,6 5.050,0 4868,80 13 10,40 82 65,60

5.050,1 5.412,5 5231,30 19 15,20 101 80,80

5.412,6 5.775,0 5593,80 16 12,80 117 93,60

5.775,1 6.137,5 5956,30 6 4,80 123 98,40

6.137,6 6.500,0 6318,80 2 1,60 125 100,00

6500,1 6.862,5 6681,30 0

Total 125 100,00

Fuente: Feria del Automóvil de Francia, Noviembre 2012

Page 16: Curso de Estadistica Descriptiva

Página 16 de 36

Fuente: Feria del Automóvil de Francia, Noviembre 2012

Fuente: Feria del Automóvil de Francia, Noviembre 2012

Page 17: Curso de Estadistica Descriptiva

Página 17 de 36

2.2. Distribución de Frecuencias y gráfica de la variable cuantitativa: Nota Estad

Distribución de los Participantes en función de las Notas de Estadísticas

Notas en

Estadísticas

en la Escala

del 1 al 20

Notas

medias

Número de

participantes %

Número

acumulado

de

participantes

Porcentaje

acumulado

%

-2,8 0,9 -0,90 0 0

1,0 4,8 2,90 25 20,00 25 20,00

4,9 8,6 6,75 21 16,80 46 36,80

8,7 12,4 10,55 35 28,00 81 64,80

12,5 16,2 14,35 21 16,80 102 81,60

16,3 20,0 18,15 23 18,40 125 100,00

20,1 23,8 21,95 0

Total 125 100

Fuente: Unesr, Diciembre de 2012

Fuente: Unesr, Diciembre de 2012

Page 18: Curso de Estadistica Descriptiva

Página 18 de 36

Fuente: Unesr, Diciembre de 2012

Resumen: Puede observarse en relación a la variable RPM que la mayoría de los vehículos (34.4%

es decir 43 de 125 chequeados) sus revoluciones oscila entre 3962,6 rpm y 4325 rpm y

adicionalmente podemos decir que el 41.60 % es decir 52 de 125 vehículos tiene una revolución

igual o menor a 4325 rpm.

Por otra parte, si nos referimos a la variable Notas en Estadísticas podemos decir que el 28% de los

participantes (35 de un total de 125) tiene notas entre 8.7 y 12.4 puntos, sin embargo un 35.2% tiene

notas por encima de 12.4 puntos y el 8.4% supera la nota de 16.2 puntos, calificados como

EXCELENTES. Aclaramos que la escala de nota es del 1 al 20, ambos inclusive.

Por otra parte es preocupante que 64.8 % (81 de 125) de los participantes hayan resultados

reprobados dado que obtuvieron notas iguales o inferiores a 12.4 puntos en base a 20 máximo.

Gráfica de las variables cualitativas y cuantitativas.

Como ustedes podrán ver, una imagen expresa más que 1000 palabras. Hemos presentados los

resultados en forma gráfica, utilizando para ello varios gráficos.

En el caso de las variables cualitativas utilizamos el diagrama de barra y el gráfico de sectores,

mientras que para las variables cuantitativas aplicamos el Histograma cuya presentación es en

forma de barra, el polígono de frecuencia cuya forma es por medio de una curva quebrada y por

último aplicamos la ojiva ascendente que es una curva suave. Todos los gráficos fueron

desarrollados en EXCEL y copiado y pegado en WORD.

Page 19: Curso de Estadistica Descriptiva

Página 19 de 36

Cuando se presenta un estudio con un número de datos relativamente pequeño es decir menos de

300 observaciones, estas distribuciones se hacen manualmente pero es latoso y se genera mucho

error y cansancio visual, por ello, recomendamos que se utilice la función “Frecuencia” de EXCEL

o su equivalente en LINUX para realizar el trabajo.

Si el número de datos de una variable alcanza una cifra de 1200 observaciones o más, entonces es

preferible manejar esa información con software estadístico como el SPSS de una versión

actualizada, por ejemplo la versión 19 o más recientes.

3. Análisis Numérico para datos brutos, primarios o no agrupados.

Hemos realizado la recopilación, la tabulación y las gráficas de los datos, ahora nos centraremos en

el análisis numérico de los mismos, sin embargo es importante distinguir entre datos brutos o

primarios o no agrupados y datos procesados o secundarios o agrupados.

Los datos brutos o primarios o no agrupados son aquellos que fueron recogidos, recopilados o

recolectados y se presentan generalmente en columnas o en filas o en tablas, una muestra de ello,

es la información presentada en dos hojas de EXCEL denominadas Datos Vehículos y Datos

Participantes y lo pueden descargar del Blog: www.stredelcursos.blogspot.com donde aparece

con el nombre de Anexos del Curso de Estadística Descriptiva.

Los datos procesados o secundarios o agrupados son aquellos que se presentan en cuadro de

distribución de frecuencias o cuadros resúmenes o tablas de contingencias, donde una distribución

de frecuencias de variables cualitativas o cuantitativas muestra el número de observaciones,

absolutas o relativas, simple o acumuladas, que corresponden a cada una de las clases o variables.

Estos tipos de datos lo hemos presentados en los puntos:

1.1 Distribución Muestral de los Vehículos por Marcas

1.2 Distribución Muestral de los Participantes por Menciones

2.1 Distribución de los Vehículos en función de las revoluciones por minutos RPM

2.2 Distribución de los Participantes en función de las Notas de Estadísticas

La distribución de frecuencias no solo es un método de organizar los datos; es también una medida

descriptiva. En realidad, puede considerarse como una serie de estadísticas descriptivas, puesto

que cada número que indica la densidad de observaciones en una clase es una estadística

descriptiva. Sin embargo, con frecuencia necesitamos una sola estadística descriptiva que pueda

enfocar la atención más nítidamente en la naturaleza de los datos que se están midiendo; el uso de

un solo número es, sin duda, más ventajoso que la distribución de frecuencias.

Page 20: Curso de Estadistica Descriptiva

Página 20 de 36

Un número usado para describir una serie debe ser representativo de los datos medidos por él, por

esta razón, un número representativo se considera como una medida. Más comúnmente, es

conocido como un Promedio.

Los promedios, las desviaciones o las medidas de dispersión basados en sus propiedades

matemáticas, forman partes de las denominadas medidas descriptivas numéricas las cuales se

clasifican en Parámetros cuando se calculan a partir de los datos de la población, siendo N el

tamaño de la población y en Estadísticos cuando se calculan a partir de los datos de una muestra,

siendo n el tamaño de la muestra.

Un promedio, como un valor significativo adoptado para representar la tendencia central de una

serie, es una medida muy poderosa. Sin embargo, el uso de un solo valor para describir una

distribución, oculta muchos hechos importantes. La toma de decisiones con frecuencia exige la

revelación de estas características ocultas de la distribución, por consiguiente, debemos exponer

ahora medidas características para resumir y describir esas características ocultas.

Casi sin excepción, las cantidades incluidas en una distribución siempre difieren del valor central,

aunque el grado de desviación varía de una serie a otra. Además, poco puede revelarse sobre la

dispersión, aunque se computen varios promedios para la serie. Así, se necesita una medida del

grado de dispersión o variación con objeto de dar una descripción más completa de las principales

características de una distribución o hacer posible una comparación efectiva de dos o mas

distribuciones.

La variación es, con mucho, la característica más importante de una distribución; puede ser la base

para la toma de decisiones o una medida para seguir desarrollando la teoría y el método

estadístico.

La variedad no es solo la sal de la vida, sino también la esencia de la Estadística.

3.1. Medidas de Tendencia Central o de Promedio o de Posición.

Desarrollaremos fórmulas, procedimientos y cálculos para este tipo de datos que como ya lo

hemos indicado son aquellos que fueron recogidos, recopilados o recolectados y se presentan

generalmente en columnas o en filas o en tablas, puede utilizarse para el cálculo, calculadoras que

en su funcionamiento incluya el modo “SD”, computadoras o cualesquiera otros medios

dependiendo del número de datos que se esté manipulando.

La información sobre las variables y los cálculos se presentan en un archivo denominado Anexos

del Curso de Estadística Descriptiva que pueden descargar del Blog:

www.stredelcursos.blogspot.com donde aparece con el mismo nombre.

Page 21: Curso de Estadistica Descriptiva

Página 21 de 36

Las variables que analizaremos son las mismas que hemos venido usando hasta ahora: MARCA y

RPM del archivo Vehículo y MENCION y NOTA ESTAD del archivo Participantes.

Debo mencionar que la aplicación EXCEL o su equivalente CALC en UBUNTU tienen funciones

estadísticas que permiten obtener los resultados de forma directa. Se indicará el nombre de la

función utilizada, si existe.

Las medidas que desarrollaremos se presentan a continuación:

Media aritmética (Xa )

Media geométrica (Xg)

Media armónica (Xh)

Media cuadrática (Xc)

Media ponderada (Xw)

Representan centro de gravedad o punto de equilibrio o

regularidad.

Moda (Mo) Es el valor que más se repite o es más frecuente.

Mediana (Me) Valor que divide a la población en dos partes iguales, es decir 50 % por

debajo y 50% por encima del mismo

Cuartiles (Q1 ; Q2 ; Q3) Q 1 Valor que divide a la población en dos partes, 25% por debajo y 75%

por encima del mismo; Q 2 Valor que divide a la población en dos partes,

50 % por debajo y 50% por encima del mismo y Q 3 Valor que divide a la

población en dos partes, 75 % por debajo y 25% por encima del mismo.

Percentiles (P%) Valor que divide a la población en dos partes, es decir p% por debajo y

(100 – p)% por encima del mismo

Rango percentil Rp Porcentaje de la población que está por debajo de valor X definido

previamente, entendiéndose que un porcentaje complementario a 100

estará por encima de ese valor.

Media aritmética (Xa) = ∑ (Xi) / n donde ∑ significa sumatoria

Se suman los valores de la variable y el resultado se divide entre el número de datos. Funcion:

Promedio

Page 22: Curso de Estadistica Descriptiva

Página 22 de 36

Operacion MARCA MENCION RPM NOTA ESTAD

Sumatoria No aplica No aplica 583.860 1285

N (Numero de

datos)

125 125 125 125

Media aritmetica No aplica No aplica 4670,88 10,3

Media geométrica (Xg) = [ ∏ (Xi )]1/n donde ∏ significa productorio

Primeramente se debe obtener el logaritmo neperiano de cada valor y sumarse. Ese total se

divide entre n que es el tamaño de la muestra y finalmente se calcula el exponencial del valor

obtenido Xg = e∑Ln(xi)/n Funcion: Media.Geom

Operacion MARCA MENCION RPM NOTA ESTAD

Sumatoria del Ln No aplica No aplica 1055,00 259,00

N (Numero de

datos)

125 125 125 125

Media geometrica No aplica No aplica 4658,0 8,0

Media armónica (Xh) = n / ∑ (1/Xi) donde 1/Xi significa reciproco

Primeramente se debe obtener el recíproco de cada valor y sumarse. Luego n que es el tamaño

de la muestra se divide entre ese total obtenido. Media.Armo

Operacion MARCA MENCION RPM NOTA ESTAD

Sumatoria del 1/Xi No aplica No aplica 0,02737 25,35767

N (Numero de

datos)

125 125 125 125

Media armonica No aplica No aplica 4567,1 4,9

Page 23: Curso de Estadistica Descriptiva

Página 23 de 36

Media cuadrática(Xc) = √(∑ (Xi2) / n) donde √ significa Raiz Cuadrada

Primeramente se debe obtener el cuadrado de cada valor y sumarse. Ese total se divide entre n

que es el tamaño de la muestra y finalmente se calcula la raíz cuadrada. No Existe

Operacion MARCA MENCION RPM NOTA ESTAD

Sumatoria del Xi2 No aplica No aplica 2790716 17119

N (Numero de

datos)

125 125 125 125

Media cuadratica No aplica No aplica 4725,0 11,7

Media ponderada (Xw) = ∑ (WiXi) / ∑ Wi

Tenemos que definir primeramente cual es la variable o factor de ponderación.

Luego se obtiene el producto del factor de ponderación por el valor de la variable y se suman esos

productos; igualmente debe obtenerse la suma de factor de ponderación. Finalmente el total de los

productos se divide entre el total del factor de ponderación.

Operacion MARCA MENCION RPM NOTA ESTAD

Sumatoria del WiXi No aplica No aplica 5.980.110 5.980.110

Sumatoria del Wi,

donde Wi = RPM

583.860

Sumatoria del Wi,

donde Wi = Nota

Estad

1285

Media ponderada No aplica No aplica 4653,78

10,242

Page 24: Curso de Estadistica Descriptiva

Página 24 de 36

Moda (Mo) No Existe fórmula sino un procedimiento y concepto Se halla inspeccionando los datos y se selecciona de la serie aquel valor o valores que aparezca más

veces que cualquier otro. Puede haber mas de una Moda. Moda

MARCA MENCION RPM NOTA ESTAD

Nissan y Suzuki con

19 veces

Mercadeo con 24

veces 4000 con 34 veces

11 con 11 veces

Mediana (Me) No Existe fórmula sino un procedimiento y concepto

Se halla inspeccionando y ordenando los datos en orden ascendente y se selecciona de la serie aquel

valor que divida a la población en dos partes iguales, es decir 50% y 50%. Un procedimiento es

calcular la ubicación de la mediana, la cual estara en la posición (n + 1) / 2 si n es impar o [ n/2 ] o el

siguiente si n es par. Donde n es el tamaño de la muestra Mediana

MARCA MENCION RPM NOTA ESTAD

No aplica No aplica

4500

10

Quartiles (Q1 ; Q2 ; Q3) No Existe fórmula sino un procedimiento y concepto Se halla inspeccionando y ordenando los datos en orden ascendente y se selecciona de la serie aquel

valor que divida a la población en dos partes de acuerdo a la distribución quie indique el cuartil. Un

procedimiento es calcular la ubicación del cuartil, la cual estara en la posición n/4 o n/2 o 3n/4 ya

sea que se trate de Q1 o Q2 o Q3. Donde n es el tamaño de la muestra. Debe indicarse que Q2 es la

Mediana, Cuartil

Page 25: Curso de Estadistica Descriptiva

Página 25 de 36

Cuartil MARCA MENCION RPM NOTA ESTAD

0 o minimo No aplica No aplica 3600 1

1 o primer No aplica No aplica 4000 7

2 o segundo No aplica No aplica 4500 10

3 o tercer No aplica No aplica 5200 15

4 o máximo No aplica No aplica 6500 20

Percentiles (P%) No Existe fórmula sino un procedimiento y concepto Se halla inspeccionando y ordenando los datos en orden ascendente y se selecciona de la serie aquel

valor que divida a la población en dos partes de acuerdo a la distribución que indique el percentil. Un

procedimiento es calcular la ubicación del percentil la cual estara en la posición [p% * n]. Donde n

es el tamaño de la muestra. Debe indicarse que P50 es la Mediana, Percentil

Percentil MARCA MENCION RPM NOTA ESTAD

42 No aplica No aplica 4400 9

80 No aplica No aplica 5400 16

Rango Percentil (Rp) No Existe fórmula sino un procedimiento y concepto

Se halla inspeccionando y ordenando los datos en orden ascendente y se halla el valor X de la serie

(el primero de ellos) y se determina la posición p que ocupa con respecto a n. Donde n es el tamaño

de la muestra. El Rp se calcula dividiendo la posición p entre n y se multiplica por 100 para

expresarlo en porcentaje. Rango.Percentil

Page 26: Curso de Estadistica Descriptiva

Página 26 de 36

RPM NOTA

ESTAD

MARCA MENCION Rango

Percentil de

RPM

Rango percentil de NOTA

ESTAD

4000 12 No aplica No aplica 7,25 60,48

5000 16 No aplica No aplica 63,7 78,22

3.2. Medidas de Dispersión o de Variación o de Sesgo

Rango o Amplitud (R)

Rango intercuartílico (RI)

Desviación cuartil (DQ)

Desviación media (DM)

Desviación Estándar (σ)

Representan error o riesgo o calidad. En el caso del Rango

representa margen o distancia o error máximo, dado que mide la

distancia entre el máximo y el mínimo.

La desviación estándar representa un promedio de las desviaciones

y es la más utilizada seguida del rango

Varianza (V) Es el cuadrado de la Desviación Estándar y es un operador matemático y

estadístico

Coeficiente de variación

(CV)

Son medidas relativas y se expresan en porcentajes. Significa que

porcentaje de desviación existe con respecto al valor central o regular.

Coeficiente de desviación

media (CDM)

Coeficiente de desviación

cuartil (CDQ)

Rango (R) también llamado Amplitud o Recorrido = Máximo - Mínimo

Representa margen o distancia o error máximo y se calcula realizando la diferencia del máximo

menos el mínimo. No Existe.

Page 27: Curso de Estadistica Descriptiva

Página 27 de 36

MARCA MENCION RPM NOTA ESTAD

No aplica No aplica 2900 19

Rango intercuartílico (RI) = Q3 – Q1 Representa margen o distancia o error máximo entre el 50% centralizado y se calcula realizando la

diferencia de Q3 menos Q1. No Existe.

MARCA MENCION RPM NOTA ESTAD

No aplica No aplica 1200 8

Desviación cuartil (DQ) = (Q3 – Q1) / 2 Representa un promedio del margen o distancia o error máximo entre el 50% centralizado y se calcula

realizando la diferencia de Q3 menos Q1 y el resultado se divide entre 2. No Existe.

MARCA MENCION RPM NOTA ESTAD

No aplica No aplica 600 4

Desviación media (DM) = ∑ lXi - Xal/ n;

Las barras significan valor absoluto y Xa es la media aritmética.

Representa sesgo promedio. Primeramente se debe obtener el valor absoluto de las

diferencias de cada valor con respecto a la media y sumarse. Ese total se divide entre n que

es el tamaño de la muestra. Desvprom

MARCA MENCION RPM NOTA ESTAD

No aplica No aplica 619,69 4,65

Page 28: Curso de Estadistica Descriptiva

Página 28 de 36

Desviación Estándar (σ)= √ (∑ (Xi - Xa )2 / (n-1)) ;

El símbolo √ significa raíz cuadrada y la letra σ se lee sigma, Xa es la media aritmética.

Representa error o variación promedio. Primeramente se debe obtener el cuadrado de las

diferencias de cada valor con respecto a la media y sumarse. Ese total se divide entre n -1

donde n es el tamaño de la muestra y finalmente al resultado de la división se le extrae la raíz

cuadrada. Desvest

MARCA MENCION RPM NOTA ESTAD

No aplica No aplica 716,04 5,61

Varianza (V) = σ2 = ∑ (Xi - Xa )2 /( n-1)

La varianza es el cuadrado de la Desviación Estándar (σ). Se realizan todos los pasos del cálculo

anterior sin extraer la raíz cuadrada. Var

MARCA MENCION RPM NOTA ESTAD

No aplica No aplica 512714,54 31,53

Coeficiente de variación (CV) = σ * 100 / Xa

Representa el porcentaje de desviación que tienen los valores con respecto a la media aritmética. σ

(sigma) es la desviación estándar y Xa es la media aritmética. Se divide la desviación estándar entre

la media aritmética y el resultado se multiplica por 100 para expresarlo en porcentaje. No Existe

MARCA MENCION RPM NOTA ESTAD

No aplica No aplica 15,33 % 54,62 %

Page 29: Curso de Estadistica Descriptiva

Página 29 de 36

Coeficiente de desviación media (CDM) = DM *100 / Xa Representa el porcentaje de desviación que tienen los valores con respecto a la media aritmética.

DM es la desviacion media y Xa es la media aritmética. Se divide la desviación media entre la

media aritmética y el resultado se multiplica por 100 para expresarlo en porcentaje. No Existe

MARCA MENCION RPM NOTA ESTAD

No aplica No aplica 13,27 % 45,28 %

Coeficiente de desviación cuartil (CDQ) = (Q3 – Q1) * 100 / (Q3 + Q1) Representa el porcentaje del rango intercuartilico medio con respecto al punto medio de los Cuartiles

1 y 3. Se divide el rango intercuartilico entre la suma de los Cuartiles Q1 y Q3 y el resultado se

multiplica por 100 para expresarlo en porcentaje. No Existe.

MARCA MENCION RPM NOTA ESTAD

No aplica No aplica 13,04 % 36,36 %

4. Análisis Numérico para datos procesados, secundarios o agrupados.

Los datos procesados o secundarios o agrupados son aquellos que se presentan en cuadro de

distribución de frecuencias o cuadros resúmenes o tablas de contingencias, donde una distribución

de frecuencias de variables cualitativas o cuantitativas muestra el número de observaciones,

absolutas o relativas, simple o acumuladas, que corresponden a cada una de las clases o variables.

Estos tipos de datos lo hemos presentados en los puntos:

1.1 Distribución Muestral de los Vehículos por Marcas

1.2 Distribución Muestral de los Participantes por Menciones

2.1 Distribución de los Vehículos en función de las revoluciones por minutos RPM

2.2 Distribución de los Participantes en función de las Notas de Estadísticas

Page 30: Curso de Estadistica Descriptiva

Página 30 de 36

4.1. Medidas de Tendencia Central o de Promedio o de Posición.

Desarrollaremos fórmulas, procedimientos y cálculos para este tipo de datos, y puede utilizarse

calculadoras que en su funcionamiento incluya el modo “SD”, computadoras o cualesquiera otros

medios.

La información sobre las variables y los cálculos se presentan en un archivo denominado Anexos

del Curso de Estadística Descriptiva que pueden descargar del Blog:

www.stredelcvursos.blogspot.com donde aparece con el mismo nombre.

Las variables que analizaremos son las mismas que hemos venido usando hasta ahora: MARCA y

RPM del archivo Vehículo y MENCION y NOTA ESTAD del archivo Participantes.

Debo mencionar que la aplicación EXCEL o su equivalente CALC en UBUNTU no tienen

funciones estadísticas que permiten obtener los resultados de forma directa para este tipo de

variables presentada como datos procesados.

Todas las medidas que desarrollamos en el punto 3.1. también pueden calcularse para datos

procesados, pero dado el hecho practico nos centraremos solo en las más comunes y utilizadas. Las

medidas que desarrollaremos se presentan a continuación:

Media aritmética (Xa )

Representan centro de gravedad o punto de equilibrio o

regularidad.

Moda (Mo) Es el valor que más se repite o es más frecuente.

Percentiles (P%) Valor que divide a la población en dos partes, es decir

p% por debajo y (100 – p)% por encima del mismo.

El Percentil 0 es el Mínimo, el Percentil 25 es el Primer

Cuartil Q1, el Percentil 50 es el Segundo Cuartil Q2 y es

también la Mediana Me, el Percentil 75 es el Tercer

Cuartil Q3 y finalmente el Percentil 100 es el Máximo.

Page 31: Curso de Estadistica Descriptiva

Página 31 de 36

Media aritmética (Xa) = = ∑ (Xifi) / ∑fi

donde ∑ significa sumatoria, Xi es la marca de clase y fi es la frecuencia absoluta.

Se multiplica los valores de Xi por fi , se suman y el resultado se divide entre el

número de datos.

Operación MARCA MENCION RPM NOTA ESTAD

Sumatoria No aplica No aplica 589387,05 1302,3

N (Número de

datos)

125 125 125 125

Media aritmética No aplica No aplica 4715,10 10,4

Moda (Mo) = L + (Δ1* ic/ ( Δ1 + Δ2 ))

Donde L es el límite inferior de la clase modal; Δ1 es la diferencia entre la frecuencia de la clase

modal y la frecuencia de la clase pre modal (despréciese los signos); Δ2 es la diferencia entre la

frecuencia de la clase modal y la frecuencia de la clase pos modal (despréciese los signos); ic es el

tamaño del intervalo de clase de la clase modal. La clase modal es aquella que tiene mayor

frecuencia, la pre modal es la anterior y la pos modal la siguiente.

En el caso de las variables cualitativas se halla inspeccionando el cuadro de

distribución de frecuencia y se selecciona de la serie aquel valor o valores que

aparezca más veces que cualquier otro. Puede haber mas de una Moda.

Si la variable es cuantitativa se procede como aparece en la fórmula arriba

presentada y se realizan los cálculos como lo indica la notación.

Page 32: Curso de Estadistica Descriptiva

Página 32 de 36

MARCA MENCION RPM NOTA ESTAD

Nissan y Suzuki con

19 veces

Mercadeo con 24

veces 4167,96

10,55

Percentiles (P%) = L + ((% *n - ∑fi-1 ) / f% i ) * ic

Donde L es el límite inferior de la clase percentil; n es el total de observaciones muestrales; ∑fi-1 es

la suma de todas las frecuencias acumuladas hasta la clase inmediata anterior a la clase percentil; f%

i es la frecuencia absoluta de la clase percentil; ic es el tamaño del intervalo de clase de la clase

percentil.

La clase percentil es aquella donde se acumula el porcentaje dado de datos.

El Percentil 0 es el Mínimo, el Percentil 25 es el Primer Cuartil Q1, el Percentil 50

es el Segundo Cuartil Q2 y es también la Mediana Me, el Percentil 75 es el Tercer

Cuartil Q3 y finalmente el Percentil 100 es el Máximo.

Solo es aplicable para variables cuantitativa, se procede como aparece en la

fórmula arriba presentada y se realizan los cálculos como lo indica la notación.

Percentil MARCA MENCION RPM NOTA

ESTAD

42 No aplica No aplica 4335,76 9,39

80 No aplica No aplica 5393,43 15,85

Page 33: Curso de Estadistica Descriptiva

Página 33 de 36

4.2. Medidas de Dispersión o de Variación o de Sesgo

Todas las medidas que desarrollamos en el punto 3.2. también pueden calcularse para datos

procesados, pero dado el hecho práctico nos centraremos solo en las más comunes y utilizadas. Las

medidas que desarrollaremos se presentan a continuación:

Rango o Amplitud (R)

Representan error o riesgo o calidad. En el caso del

Rango representa margen o distancia o error máximo,

dado que mide la distancia entre el máximo y el

mínimo.

Desviación Estándar

(σ)

Representa un promedio de las desviaciones y es la más

utilizada

Coeficiente de

variación (CV)

Son medidas relativas y se expresan en porcentajes.

Significa que porcentaje de desviación existe con

respecto al valor central o regular.

Rango (R) también llamado Amplitud o Recorrido = Máximo - Mínimo

Representa margen o distancia o error máximo. Utilizando el cuadro de la

distribución de frecuencia se calcula realizando la diferencia del límite superior de

la última clase menos el límite inferior de la primera clase.

MARCA MENCION RPM NOTA ESTAD

No aplica No aplica 2900 19

Desviación Estándar (σ)= √ (∑ (Xi - Xa )2 * fi / (n-1)) ;

El símbolo √ significa raíz cuadrada y la letra σ se lee sigma; donde ∑ significa sumatoria, Xi es la

marca de clase, Xa es la media aritmética y fi es la frecuencia absoluta.

Representa error o variación promedio. Primeramente se debe obtener el cuadrado

de las diferencias de cada valor con respecto a la media, luego multiplicarse por la

frecuencia fi y sumarse. Ese total se divide entre n -1 donde n es el tamaño de la

muestra y finalmente al resultado de la división se le extrae la raíz cuadrada.

Page 34: Curso de Estadistica Descriptiva

Página 34 de 36

MARCA MENCION RPM NOTA ESTAD

No aplica No aplica 664,39 5,23

Coeficiente de variación (CV) = σ * 100 / Xa

Representa el porcentaje de desviación que tienen los valores con respecto a la

media aritmética. σ (sigma) es la desviación estándar y Xa es la media

aritmética. Se divide la desviación estándar entre la media aritmética y el

resultado se multiplica por 100 para expresarlo en porcentaje.

MARCA MENCION RPM NOTA ESTAD

No aplica No aplica 14,09 % 50,00 %

5. Resumen de los cálculos para Datos Primarios y Datos Secundarios.

Medidas vs

Variables

Marca Mención RPM Nota Estad

Prima-

rios

Secunda-

rios

Prima-

rios

Secunda-

rios

Media No

aplica

No

aplica

4670,88 4715,10 10,3 10,4

Moda Si

aplica

Si aplica 4000 4167,96 11 10,55

Desviación

Estándar

No

aplica

No

aplica

716,04 664,39 5,61 5,23

Coeficiente

de

variación

No

aplica

No

aplica

15,33 14,09 54,62 50

Page 35: Curso de Estadistica Descriptiva

Página 35 de 36

(%)

Perc42 No

aplica

No

aplica

4400 4335,76 9 9,39

Perc80 No

aplica

No

aplica

5400 5393,43 16 15,85

Page 36: Curso de Estadistica Descriptiva

Página 36 de 36

Conclusión.

Puede concluirse después de analizar por separados los datos primarios y los datos secundarios lo

siguiente:

Las variables cualitativas solo permite el cálculo de la Moda.

Pueden calcularse las medidas estadísticas ya sea que se trate de datos primarios o datos

secundarios.

Hay diferencia en los resultados obtenidos de las medidas para la misma variable. Esa es la

regla.

Los datos primarios tienen errores de muestreo y ajenos al muestreo, mientras que los

secundarios tienen adicional a los anteriores, errores de representatividad como es el caso

de las marcas de clase.

Los datos primarios son costoso y requiere tiempo para su recolección, por otra parte, las

empresas no los publican, mientras que los secundarios son de fácil acceso porque las

instituciones y empresas si lo hacen, generalmente sin costo alguno o a un bajo costo.

Es preferible datos primarios que secundarios pero a falta de pan bueno son tortas, es decir

mejor es algo que nada.

Finalmente es posible relacionar las variables cualitativas con las cuantitativas.

Las cualitativas se utilizan preferiblemente para agrupar características, mientras que las

cuantitativas se usan para determinar Estadísticos o Parámetros, y se relacionan ambos tipos

de variables por medio de tablas dinámicas o cuadros de varias entradas.

La información presentada en este tipo de tabla y los cálculos realizados en EXCEL se

presentan en un archivo denominado Anexos del Curso de Estadística Descriptiva que

pueden descargar del Blog: www.stredelcursos.blogspot.com donde aparece con el mismo

nombre.

Espero que sea de utilidad este Curso Elemental de Estadística Descriptiva.