Upload
william-orlando-gamboa
View
233
Download
0
Embed Size (px)
DESCRIPTION
Material de apoyo trabajo colaborativo
Citation preview
INSTRUCTIVO PARA LA REALIZACIÓN DEL
TRABAJO COLABORATIVO MOMENTO 2
JENNY TATIANA SANCHEZ OCHOA
TUTORA ESTADISTICA DESCRIPTIVA
TRABAJO COLABORATIVO MOMENTO 2
ACLARACIÓN
Estimado estudiante, el foro del trabajo colaborativo momento 2 ya se encuentra habilitado. Para esta actividad NO se trabajara en el espacio de laboratorio práctico (NO hay laboratorio).
Cabe aclarar que para este momento y lo que resta del curso seguiremos trabajando con la misma base de datos proporcionada en el colaborativo anterior " Encuesta Instituciones Educativas, Municipio San Sebastián de Mariquita".
CRONOGRAMA
Es importante que tengan presente que existe un cronograma para la realización de dicha actividad, la cual esta comprendida en las siguientes fechas:
INICIO: 20 de Septiembre de 2015. HORA: 00:00.
CIERRE: 18 de Octubre de 2015. HORA: 23:55.
TEMÁTICAS DE ESTUDIO
En cuanto a lo que se refiere al cuerpo del trabajo, en esta oportunidad, las temáticas revisadas son las “Medidas Estadist ícas univar iantes, comprendidas en:
• Medidas de tendencia central.
• Medidas de dispersión.
PASOS PARA ELABORAR EL TRABAJO COLABORTIVO
Trabajo en Equipo
PASO 1. MEDIDAS DE TENDENCIA
CENTRAL
MEDIDAS UNIVARIANTES DE TENDENCIA CENTRAL Participar En el Foro Trabajo Colaborativo Momento 2 que se encuentra en el Entorno de Aprendizaje Colaborativo.
MEDIDAS UNIVARIANTES DE TENDENCIA CENTRAL
Identificar las variables discretas dentro del problema de estudio) y calcular las medidas univariantes de tendencia central más adecuadas, a aquellas que consideren sean relevantes para el problema de estudio:
Recuerde que en trabajo colaborativo momento 1 ya identificaron las variables, por lo cual solo basta anexar/copiar/recopilar las variables cuantitativas discretas, a las cuales deberán de aplicar las medidas de tendencia central, para lo cual recomiendo trabajar con las medias de tendencia central básicas media aritmética, mediana y moda.
MEDIDAS UNIVARIANTES DE TENDENCIA CENTRAL
Mi consejo es que las medidas univariantes las apliquen a las siguientes variables cuantitativas discretas:
Estrato
Números de textos escolares que posee en la casa.
Materias aprobadas.
Número de materias con desempeño bajo.
Número de materias con desempeño básico.
MEDIDAS UNIVARIANTES DE TENDENCIA CENTRAL Dirigirse al blog del curso http://estadisticadescriptivaunad100105.blogspot.com/ y revisar Información al respecto.
Si no puede ingresar por este link, lo invito a que ingrese por el entorno de Conocimiento, dando clic a último enlace BLOG DEL CURSO ( ovas, videos, tutoriales, enlaces)
MEDIDAS UNIVARIANTES DE TENDENCIA CENTRAL
Elegir una variable discreta que sea representativa y elaborar una tabla de frecuencias para datos NO agrupados, representarla gráficamente, calcular las medidas de tendencia central: media, mediana, moda, los cuartiles, deciles 5 y 7 ; percentiles 30 , 50 e interpretar sus resultados.
Por ejemplo, aquí podría trabajar con la variable Números de textos escolares que posee en la casa ó Materias aprobadas.
En la siguiente diapositiva relaciono los elementos que debe de contener la tabla de frecuencias.
En el Texto guía(Contenidos Temáticos), podrá apoyarse en las páginas 26-27 y 41.
TABLA DE FRECUENCIAS PARA DATOS NO AGRUPADOS La tabla de frecuencias para datos no agrupados, esta compuesta
por los siguientes parámetros:
Xi : Valores o datos de la variables.
f: Frecuencia absoluta. Representa la cantidad de veces que se repite un valor o suceso estadístico.
fr: Frecuencia relativa. Se obtiene de dividir la frecuencia absoluta entre el total de los datos, es decir f / n.
F: Frecuencia absoluta acumulada. Es la suma valor a valor de la f (frecuencia absoluta
Fr: Frecuencia relativa acumulada. Es la suma valor a valor de la fr (frecuencia relativa en forma decreciente. % : Frecuencia porcentual. Se obtiene de multiplicar cada uno de los valores de fr por 100%. EJEMPLO: Tabularemos la variable Estrato de la base de datos " Encuesta Instituciones Educativas, Municipio San Sebastián de Mariquita”. (No puede ser incluida en el informe final).
XI (ESTRATO) f fr F Fr %
1 15 15/110= 0,14 15 0,14 0,14 X 100% = 14%
2 49 49/110= 0,44 64 0,58 0,44 X 100% = 44%
3 46 46/110= 0,42 110 1 0,42 X 100% = 42%
TOTAL 110 1 100%
MEDIDAS UNIVARIANTES DE TENDENCIA CENTRAL EJEMPLO: Calcularemos la medidas de tendencia
central indicadas en la guía (Medidas de tendencia central para la variable “Estrato”: Media, mediana, moda, los cuartiles, deciles 5 y 7 ; percentiles 30 , 50 e interpretar sus resultados) para la variable Estrato d e l a b a s e d e d a t o s" Encuesta Instituciones Educativas, Municipio San Sebastián de Mariquita”. (No puede ser incluida en el informe final).
MEDIDAS UNIVARIANTES DE TENDENCIA CENTRAL Las medidas de tendencia central son las siguientes:
Media aritmética o Media.
Mediana.
Moda.
FORMULAS DE MEDIDAS DE TENDENCIA CENTRAL
• MEDIA ARITMETICA: Es la medida más conocida y la más fácil de calcular. Se define como la suma de los valores de una cantidad dada de números. Donde: n = Cantidad de elementos. Xi = Valor de cada Elemento
= Media aritmética, o simplemente media. Para nuestro ejemplo, usaremos:
EJEMPLO: MEDIA PARA VARIABLE
ESTRATO
MODA: Se trata del valor más frecuente en un conjunto de datos. Se considera como el valor más representativo o típico de una serie de valores. Es simbolizada como Mo. Si dos valores tienen la misma frecuencia se dice que el conjunto es bimodal. Cuando más de dos valores ocurren con la misma frecuencia y ésta es la más alta, todos los valores son modas, por lo que el conjunto de datos recibe el nombre de multimodal o polimodal.
EJEMPLO: MODA PARA VARIABLE ESTRATO. En nuestro caso, encontramos el estrato 2 se repite 49 veces, el cual es el valor más representativo, por lo cual:
Mo = 2
MEDIANA: Se define como el valor que divide una distribución de datos ordenados en dos mitades, es decir, se encuentra en el centro de la distribución. Para su cálculo se requiere que los datos estén ordenados. Cuando la cantidad de datos es impar, fácilmente se calcula la mediana; pero cuan el número de datos es par, la mediana se calcula hallando el valor medio entre dos dos valores centrales y no coincidirá con ninguno de los valores del conjunto de datos. Se simboliza como Me.
1 2 2 2 3 3 1 2 2 2 3 3 1 2 2 2 3 3 1 2 2 2 3 3 1 2 2 2 3 3 1 2 2 3 3 3 1 2 2 3 3 3 1 2 2 3 3 3 1 2 2 3 3 3 1 2 2 3 3 3 1 2 2 3 3 3 1 2 2 3 3 1 2 2 3 3 1 2 2 3 3 1 2 2 3 3 2 2 2 3 3 2 2 2 3 3 2 2 2 3 3 2 2 2 3 3 2 2 2 3 3
EJEMPLO: MEDIANA PARA VARIABLE ESTRATO • Se organizan los datos de la variable en forma creciente. • Se ubican los dos valores centrales de los datos, los cuales son 2 y 2. • Se calcula el valor medio, a través de la suma de los valores medios
divididos entre dos.
Me= (2+2)/2= 4/2 Me= 2
CUARTILES, DECILES Y PERCENTILES: Son medidas que se utilizan para determinar los intervalos dentro de los cuales quedan proporcionalmente repartidos los términos de la distribución. PROPIEDADES Los cuartiles son un caso particular de los percentiles. Hay 3 cuartiles: Primer cuartil: Q1=P25, segundo cuartil: Q2=D5 =P50=Mediana, tercer cuartil: Q3=P75 CUARTILES: Se divide la distribución en cuatro partes iguales, de manera que cada una tendrá el 25% de las observaciones. Los tres puntos de separación de los valores son los cuartiles. El cuartil inferior Q1 es aquel valor de la variable que representa el 25% de las observaciones y a la vez, es superado por el 75% restante. El segundo cuartil Q2 corresponderá a la mediana de la distribución. El tercer cuartil Q3 es aquel valor que representa el 75% y es superado por el 25% restante de las observaciones.
MEDIDAS DE POSICIÓN PARA DATOS NO AGRUPADOS
• Primer cuartil Q1 Cuando n es par: Cuando n es impar: • Para el segundo cuartil Q2
Cuando n es par: Cuando n es impar: • Para el tercer cuartil Q3 Cuando n es par: Cuando n es impar:
FORMULAS PARA CALCULAR LOS CUARTILES PARA DATOS NO AGRUPADOS
EJEMPLO: CÁLCULO DE CUARTILES PARA VARIABLE ESTRATO n=110, lo cual significa que n es par, por lo cual se procede a realizar los siguientes cálculos: • Q1= 1*(110)/ 4 = 27,5
• Q2= 2*(110)/ 4 = 55
• Q3= 3*(110)/ 4 = 82,5 • INTERPRETACIÓN: • Como la posición del cuartil 1 es 27,5, su valor es el promedio de los datos veinticiente y
ventiocho (revisamos la posición Nº 27 y 28 en los datos de la variable), es decir, Q1 (2+2)/2 = 4/2 = 2. Este resultado indica que el 25% de los estudiantes de instituciones educativas públicas y privadas del municipio de San Sebastián de Mariquita ( Tolima) de los grados de básica primaria, en el mes de septiembre de 2014 es inferior al estrato 2.
• La posición 55 dice que el cuartil 2 está ubicado al 50% del trayecto,(revisamos la posición Nº55
en los datos de la variable que están organizados en forma ascendente), es decir, Q2 = 2. Este resultado indica que el 50% de los los estudiantes de instituciones educativas públicas y privadas del municipio de San Sebastián de Mariquita ( Tolima) de los grados de básica primaria, en el mes de septiembre de 2014 es inferior al estrato 2.
• Como la posición del cuartil 3 es 82,5, su valor es el promedio de los datos ochenta y dos y
ochenta y tres (revisamos la posición Nº 82 y 83 en los datos de la variable) es decir, Q3 (3+3)/2 = 6/2 = 3. Este resultado indica que el 75% de los estudiantes de instituciones educativas públicas y privadas del municipio de San Sebastián de Mariquita ( Tolima) de los grados de básica primaria, en el mes de septiembre de 2014 es inferior al estrato 3.
DECILES: Los deciles son ciertos números que dividen la sucesión de datos ordenados en diez partes porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son también un caso particular de los percentiles. Los deciles se denotan D1, D2,..., D9, que se leen primer decil, segundo decil, etc. Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el aprovechamiento académico. FORMULAS PARA CALCULAR LOS CUARTILES PARA DATOS
NO AGRUPADOS Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes fórmulas: Cuando n es par: Cuando n es impar: Siendo A el número del decil.
MEDIDAS DE POSICIÓN PARA DATOS NO AGRUPADOS
EJEMPLO: CÁLCULO DE LOS DECILES 5 y 7 PARA VARIABLE ESTRATO n=110, lo cual significa que n es par, por lo cual se procede a realizar los siguientes cálculos: • Segundo cuartil: Q2=D5 =P50=Mediana, entonces D5 = 55 • D7= 7*(110)/ 10 = 77. • INTERPRETACIÓN: • El quinto decil, es aquel valor de la variable que supera al 50% de las observaciones,
es decir que la posición 55 representa el D5, el cual representa tambien a la mediana de los datos, por lo cual D5= 2. Este resultado indica que el 50% de los estudiantes de instituciones educativas públicas y privadas del municipio de San Sebastián de Mariquita ( Tolima) de los grados de básica primaria, en el mes de septiembre de 2014 es inferior al estrato 2.
• El séptimo decil, es aquel valor de la variable que supera al 70% de las
observaciones y es superado por el 30% de las observaciones, es decir que la posición 77 representa el D7, por lo cual D7 = 3. Este resultado indica que el 70% de los estudiantes de instituciones educativas públicas y privadas del municipio de San Sebastián de Mariquita ( Tolima) de los grados de básica primaria, en el mes de septiembre de 2014 es inferior al estrato 3.
MEDIDAS DE POSICIÓN PARA DATOS NO AGRUPADOS
PERCENTILES: Son los valores de una variable que dividen al conjunto de datos ordenados en 100 subconjuntos; cada conjunto de datos tiene 99 percentiles. El k-esimo percentil, Pk, es un valor tal que cuando mucho (100-k) % de los datos es mayor. Procedimiento : Paso 1. Ordenar los datos del menor al mayor. Paso 2. Calcular Cuando n es par: Cuando n es impar: donde n es el tamaño de la muestra y k la medida de posición buscada (percentil). Paso 3. a) Si el resultado del cálculo anterior (nk/100 ) es un número entero, se le deberá sumar 0.5. b) Si el resultado del cálculo anterior (nk/100 ) no es un número entero, este se deberá tomar como el siguiente entero más grande. Paso 4. Con la posición encontrada en el paso anterior, remitirse a los datos ordenados y verificar a que valor de nuestros datos le corresponde la posición buscada.
EJEMPLO: CÁLCULO DE LOS PERCENTILES 30 Y 50 PARA VARIABLE ESTRATO n=110, lo cual significa que n es par, por lo cual se procede a realizar los siguientes cálculos: • P30= (110)(30)/ 100 = 33. • Segundo cuartil: Q2=D5 =P50=Mediana, entonces P50 = 55 • INTERPRETACIÓN: • El Percentil treinta, es aquel valor de la variable que supera al 30% de las
observaciones, es decir que la posición 33 representa el P30, por lo cual P30 = 2. Este resultado indica que el 30% de los estudiantes de instituciones educativas públicas y privadas del municipio de San Sebastián de Mariquita ( Tolima) de los grados de básica primaria, en el mes de septiembre de 2014 es inferior al estrato 2.
• El percentil 50, es aquel valor de la variable que supera al 50% de las observaciones,
es decir que la posición 55 representa el P50,, por lo cual P50= 2. Este resultado indica que el 50% de los estudiantes de instituciones educativas públicas y privadas del municipio de San Sebastián de Mariquita ( Tolima) de los grados de básica primaria, en el mes de septiembre de 2014 es inferior al estrato 2.
MEDIDAS UNIVARIANTES DE TENDENCIA
CENTRAL • Elegir una variable Continua que sea representativa y siguiendo los
lineamientos, diseñar una tabla de frecuencia para datos agrupados, representarla gráficamente por medio de un histograma de frecuencias, un polígono de frecuencias, calcular las medidas de tendencia central, determinar el tipo de asimetría, los cuartiles , deciles 5 y 7 ; percentiles 25, 50 ( Interpretar sus resultados).
Aquí pueden trabajar con cualquiera de las siguientes variables: • Edad. • Estatura. • Peso • Desempeño de comportamiento Para elaborar la tabla de frecuencias deberán de seguir los siguientes pasos: 1. Hallar el rango (R): Se define como la diferencia entre el dato mayor y el
dato menor de una variable. R = Xmax - Xmin.
2. Número de intervalos de clase (K): Se calcula aplicando la Regla de Sturges: K = 1 + 3,322 log(n), si se obtiene un número decimal se debe de redonderar al siguiente número entero. 3. Amplitud del intervalo de clase (A): los intervalos de clase tienen por lo general el mismo ancho, al fijarse el número de clases, obtenemos A, de la siguiente forma:
A = R / K CASO ESPECIAL: Si este cociente no es un entero, conviene redondear al entero superior. De manera que el rango es alterado y requiere por lo tanto, efectuar un ajuste:
R* = (A)(K) Calcular exceso: Con este nuevo rango, se tendra entonces un exceso que deberá distribuirse entre el limite superior y el limite inferior. Este exceso es calculado restando el rango antiguo y el nuevo. 4. Formar intervalos de clase: Se agrega A-1 al limite inferior de cada clase iniciando por el limite inferior del rango. Luego de esto se procede a crear los intervalose clase y así realizar la tablade frecuencias.
FORMULAS PARA CALCULAR LAS MEDIDAS DE
TENDENCIA CENTRAL PARA DATOS AGRUPADOS
FORMULAS PARA CALCULAR LAS MEDIDAS DE
TENDENCIA CENTRAL PARA DATOS AGRUPADOS
MEDIANA
FORMULAS PARA CALCULAR LAS MEDIDAS DE
TENDENCIA CENTRAL PARA DATOS AGRUPADOS
MODA
PASO 2. MEDIDAS UNIVARIANTES DE
DISPERSIÓN
• Participar en el foro Trabajo Colaborativo Momento 2 que se encuentra en el Entorno de Aprendizaje Colaborativo.
• Identificar las variables discretas dentro del problema de estudio y
calcular las medidas univariantes de dispersión más adecuadas, a aquellas que consideren sean relevantes para el problema de estudio.
En este caso deben de trabajar con todas las variables cuantitativas que sean discretas, las cuales son: • Estrato • Número de Textos Escolares que posee en la casa • Materias Aprobadas • Número de materias con desempeño bajo • Número de materias con desempeño básico. De las anteriores, deberán de escoger las variables que consideren más influyentes en el problema de estudio.
• Dirigirse al Blog del curso y revisar información al respecto de las medidas univariantes de dispersión.
Por el entorno de Conocimiento, en el último enlace BLOG DEL CURSO (ovas, videos, tutoriales, enlaces).
MEDIDAS DE DISPERSIÓN Las siguientes formulas se deben tener en cuenta para la solución de los próximos enunciados del trabajo colaborativo:
RANGO O RECORRIDO: Es la diferencia entre el limite superior y el limite inferior de un conjunto de datos.
R = XMax – Xmin
VARIANZA: Se define como la media aritmética de los cuadrados de las desviaciones respecto a la media aritmética. Se simboliza S2.
DESVIACIÓN TIPICA O ESTANDAR: Se obtiene calculando la raíz cuadrada de la varianza, tomando siempre el valor positivo. Se simboliza S. COEFICIENTE DE VARIACIÓN: Se emplea para efectuar comparaciones entre series de observaciones distintas, y así determinar cuál serie presenta mayor o menor variabilidad relativa. Cuando el coeficiente de variación es muy alto se dice que la media aritmética no es lo suficientemente representativa en la distribución.
DESVIACIÓN MEDIA: Se define como ,a media aritmética de las desviaciones respecto a la media , tomadas en valor absoluto. Ella toma todos los valores de la variable y es menos afectada que la desviación estándar por los valores extremos. Su valor siempre será menor que la desviación estándar. Cuanto mayor sea el valor de la desviación media, mayor será la dispersión de los datos; sin embargo este valor no proporciona una relación matemática precisa con la posición de un dato dentro de la distribución y, puesto que se toman los valores absolutos, mide la desviación de una observación sin determinar si está por encima o por debajo de la media aritmética.
Con la variable Discreta Elegida Calcular: rango, Varianza, Desviación típica y coeficiente de variación. Interpretar los resultados obtenidos y asociarlos con el problema objeto de estudio. En este ítem podrán escoger una de las de las siguientes variables: • Estrato • Número de Textos Escolares que posee en la casa • Materias Aprobadas • Número de materias con desempeño bajo • Número de materias con desempeño básico. Con la variable Continua elegida calcular: rango, Varianza, Desviación típica y coeficiente de variación. Interpretar los resultados obtenidos y asociarlos con el problema objeto de estudio. En este ítem podrán escoger una de las de las siguientes variables: • Edad. • Estatura. • Peso • Desempeño de comportamiento. NOTA: En el Texto guía(Contenidos Temáticos el cual ya les he enviado y pueden descargar por el Entorno de Conocimiento, encontraran ejemplos de cómo diseñar la tabla de frecuencias para datos agrupados en las paginas 41 a 47. Con respecto a las medidas de dispersión encontraran un claro ejemplo de las paginas 114 a 121.
PASO 3. CONSOLIDACIÓN
DEL INFORME
Participar En el Foro del Trabajo Colaborativo Momento 2 que se encuentra en el Entorno de Aprendizaje Colaborativo. En el entorno de Evaluación y seguimiento (Entrega Trabajo Colaborativo Momento 2) subir el archivo en formato Word o Pdf, el cual debe de contener: • Portada • Introducción. • Justificación. • Objetivos. • Cálculo e interpretación de las medidas univariantes de tendencia central y • de dispersión para la variable discreta. • Cálculo e interpretación de las medidas univariantes de tendencia central y • de dispersión para la variable Continúa. • Análisis e interpretación de la información obtenida. • Conclusiones. • Referencias Bibliográficas.
BIBLIOGRAFÍA SMITH, A. Stanley. (1992). Curso de Estadística Elemental para las ciencias aplicadas.
Primera edición. Santa fe de Bogotá. Editorial Addison – Wesley Iberoamericana.
CONTENIDO DIDÁCTICO DEL CURSO 100105(2010). Estadística Descriptiva. Segunda Edición. Ibagué.
https://prezi.com/6m0lxozfmsgl/medidas-de-tendencia-central-para-datos-agrupados/
https://tratamientodedatos.wordpress.com/2011/03/07/medidas-de-tendencia-central-para-datos-no-agrupados-y-agrupados/
http://www.seduca2.uaemex.mx/ckfinder/uploads/files/2-1__medidas_de_tend.pdf
http://moodle2.unid.edu.mx/dts_cursos_mdl/lic/AE/E/AM/04/datos_no_agrupados.pdf
ESPERO ESTE MATERIAL LES SEA DE APOYO
GRACIAS PO LA ATENCIÓN
PRESTADA JENNY TATIANA