Transcript
Page 1: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

METODOS Y TECNICAS DE INVESTIGACION PARA LAS CIENCIAS SOCIALES

Guillermo Briones

CAPITULO 7

LA ENCUESTA SOCIAL La encuesta social, uno de los tipos más utilizados de la investiga! cuantitativa, es un método de obtención de información mediante preguntas orales o escritas, planteadas a un universo o muestra de personas que tienen características requeridas por el problema de investigación. La información que se puede obtener mediante la encuesta es muy variada; ello explica su gran utilización en investigaciones teóricas y aplicadas de la sociología, la psicología social, la ciencia política, la demografía, la educación, el estudio de mercados y de costos de vida, etc. Esa información puede clasificarse en las siguientes categorías: • Demográfica: edad, sexo, estado civil, residencia, etcétera. • Socioeconómica: ocupación, salario, ingresos, escolaridad, movilidad social, etcétera. • Conductas: participación social, actividades culturales, innovación, hitos políticos, etcétera. • Opiniones, actitudes e imágenes sociales: orientaciones afectivas, preferencias, predisposiciones a actuar en favor o en contra, representa nos, creencias, etcétera. Información como la señalada se recoge mediante diversos procedimientos en un cuestionario preparado según los objetivos del estudio: 1.- Entrevistas directas con las personas seleccionadas. 2.- Entrega del cuestionario a las personas, para que cada una de ella responda sin la intervención de un entrevistador (cuestionario auto administrado). 3.- Mediante una entrevista telefónica. Cada uno de estos procedimientos tiene sus ventajas y desventajas. Por ejemplo, la entrevista hecha por una persona entrenada para cumplir esa función puede inhibir al entrevistado, pero tiene la ventaja de poder lograr aclaraciones en respuestas vagas o confusas; la entrevista telefónica tiene la ventaja de lograr respuestas con mayor rapidez que las otras, pero queda limitada a un universo de personas que tengan teléfono, con lo cual pierden representatividad; etcétera. En relación con los objetivos de conocimiento que tiene en general la investigación científica, se distinguen dos tipos principales: la encuesta descriptiva y la encuesta explicativa. LA ENCUESTA DESCRIPTIVA La encuesta descriptiva tiene como objetivos principales: 1. Describir la distribución de una o más variables en el total del colectivo objeto de estudio, o en una muestra del mismo. 2. Realizar la misma operación en subgrupos significativos de ese colectivo o en su muestra. 3. Calcular medidas de tendencia central y de dispersión (porcentaje, medias aritméticas, correlaciones, etc.) de esas variables en el colectivo total o en la muestra utilizada, y en los subgrupos.

Page 2: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

Ejemplos de análisis típicos de la encuesta descriptiva, referidos a las variables "opinión sobre la democracia": 1. Concepciones de la democracia en el total del colectivo (%): • La democracia consiste en distribuir la riqueza del país entre todos sus habitantes 15 • Consiste en respetar las ideas de todas las personas. 30 • Los partidos políticos deben funcionar con toda libertad. 20 • Las autoridades deben ser elegidas en elecciones libres, sin control del Gobierno. 35

2. Concepciones de la democracia según sexo (%):

Hombres Mujeres • La democracia consiste en repartir la riqueza entre todos Los habitantes 16 28 • Consiste en respetar las ideas... 38 35 • Deben funcionar los partidos... 22 15 • Las autoridades deben ser elegidas.. 24 22 3. Promedio de escolaridad del colectivo: 6.8 años. Promedio de escolaridad de los hombres: 7.2 años. Promedio de escolaridad de las mujeres: 6.3 años. A partir de los objetivos referidos a subgrupos del colectivo estudiado, el investigador que trabaja con una encuesta descriptiva debe incorporar e cuestionario (en el cual recoge los datos) la información necesaria para formar esos subgrupos. En gran medida, esa información está constituida variables de tipo factual, como el sexo, la edad, la escolaridad, los ingreso; ocupación, etc., todas las cuales permiten definir subgrupos dentro del total del colectivo estudiado (universo o muestra). Pero también algunas varia no (actuales pueden ser utilizadas por el investigador para formar subgrupos. Por ejemplo, si su cuestionario incluye la variable "religiosidad", debidamente operacionalizada, los diversos niveles de tal variable constituirían categorías para la comparación de sus concepciones de la democracia (para seguir con el ejemplo anterior). Do la búsqueda de comparaciones entre subgrupos surge una característica principal de la encuesta descriptiva: el colectivo que se va a estudiar debe ser lo suficientemente heterogéneo como para permitir la diferenciación requerida para hacer esas comparaciones. Estaría de más decir que esa heterogeneidad no debe ser arbitraria, sino que ha de estar en consonancia con el problema y los objetivos de la investigación, exigencia que obliga al investigador en la fase de elaboración del cuestionario, a preguntarse cuáles son los contextos más importantes para la determinación de comparaciones. En su obra clásica sobre la encuesta social (Survey Design and Analysis The Free Press, Glencoe, 111., 1955; existe traducción al español), Hyman llama la atención, entre otros aspectos importantes, sobre la necesidad de introducir normas que permitan evaluar algunos resultados del estudio. Al respecto, cita un estudio de opiniones sobre la radio, en el cual 82% de la muestra dice que ese medio hace un trabajo "excelente" o "muy bueno". Esa cifra, por alta que sea, no permite por sí sola una evaluación, ya que toda evaluación es siempre una comparación. Por eso, Hyman destaca que los autores del estudio tuvieron en cuenta esa situación: Así, con respecto al juicio de la radio como institución, donde el resultado fue que 82% de la muestra estaba muy satisfecho, los analistas presentan el hallazgo que preguntas paralelas de satisfacción con la Iglesia, los diarios, las escuelas y el gobierno local, no dieron

Page 3: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

porcentajes más altos que el porcentaje referido a la radio… Este ejemplo particular ilustra el uso de una norma y la forma de tratar el problema (p. 128). Para terminar esta presentación de la encuesta descriptiva, citaremos de nuevo a Hyman, quien se refiere a las diversas tareas que debe cumplir el análisis de los datos, después de que se ha recogido y revisado la información mediante un cuestionario: En la fase del análisis, el investigador emprende una serie de tareas de rutina: 1. Los datos correspondientes a cada aspecto del fenómeno que han sido conceptualizados se tabulan para el total del grupo para obtener una media estadística global o una descripción cuantitativa. 2. De igual manera se tabulan para cada subgrupo que se ha considerado significativo y que proporciona las descripciones deseadas también como descripciones de cualquier población redefinida que es considerada como especialmente relevante para el problema estudiado. 3. Se aplican diversas técnicas de consolidación de los datos a los diversos aspectos del fenómeno para obtener descripciones globales [medias aritméticas, desviaciones estándar, etc.]. Aquí también se emplean operaciones técnicas como la construcción de índices, escalas, tipologías, perfiles, etc. Las técnicas de consolidación se aplican al total del colectivo o a los subgrupos que se consideran importantes. 4. Todos estos datos se examinan luego en comparación con datos sobre fenómenos similares para mejorar la evaluación de los resulta dos. 5. Se examina una variedad de materiales cualitativos, no estadísticos, para complementar las descripciones cuantitativas. Comentarios de personas individuales, respuestas amplias que pueden darse a preguntas abiertas, informes de los entrevistadores, etc., todos ellos ayudan a reducir el inevitable carácter abstracto de los informes estadísticos, al tiempo que ilustran los significados y apuntan a la variedad que subyace a las categorías usadas en el análisis estadístico (pp. 138-139). LA ENCUESTA EXPLICATIVA Como lo dice su nombre, la encuesta explicativa busca la explicación de un fenómeno (o variable dependiente) mediante el análisis de su relación con una o más "causas" de ese fenómeno (variables independientes). Habitual mente, tal relación se expresa mediante una o más hipótesis propuestas por el investigador. El tipo de análisis explicativo varía según la naturaleza específica del problema estudiado. Por el momento sólo podemos adelantar que uno de esos tipos está constituido por la llamada especificación y explicación de la relación encontrada, mientras otro tipo es la denominada interpretación. Las características de tales análisis serán expuestas en un capítulo posterior. Como sabemos desde el estudio de los diseños experimentales, la confianza en que una variable sea la "causa" de las variaciones de otra, está ligada directamente con el control que se haya podido hacer de otras variables que podrían influir en la variable dependiente. La encuesta explicativa, dice Hyman, sigue el modelo del experimento de laboratorio, con la diferencia fundamental de que esta trata de cumplir ese modelo en un ambiente natural. Por eso, en lugar de crear y manipular la variable independiente, cuyo electo se espera mostrar en la variable dependiente, aquí, en la encuesta explicativa, el investigador debe buscar en tal ambiente los efectos de su variable independiente. Un problema principal en dicha búsqueda lo constituye el hecho de que en ese contexto natural existen muchas otras variables que pueden actuar sobre el fenómeno estudiado. Por lo mismo, en las encuestas explicativas, el investigador debe comenzar por reducir la heterogeneidad del colectivo en el cual se da ese fenómeno:

Page 4: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

La restricción del universo al cual se refiere el estudio y el diseño de la muestra en la encuesta explicativa proporcionan la técnica básica mediante la cual se excluyen otras fuentes de variación del fenómeno [...]. En la encuesta explicativa, la confianza en la inferencia que se hace de la causalidad se logra restringiendo la heterogeneidad del universo (Hyman, p. 81). Para dar un ejemplo de restricción del universo con la finalidad de eliminar algunas variables que podrían afectar la variación de la variable dependiente, confundiendo el efecto de la variable independiente que interesa en el estudio, podemos pensar en un estudio destinado a confirmar la hipótesis: "Las ideologías políticas son causadas por la posición económica de las personad en la estructura social." Si, por ejemplo, posición económica se define por la ocupación, existen muchos centenares de ocupaciones en los diversos sectores de la economía (industria, agricultura, comercio, etc.). De ahí que tal universo podría ser reducido, por razones metodológicas y prácticas (costos), a algunas categorías de un sector, a una o unas pocas regiones del país, a solo hombres de determinada edad, etcétera. Debido a que las restricciones del universo pueden requerir una muestra bastante grande para tener números suficientes de casos en las categorías ocupacionales seleccionadas para los análisis estadísticos (especialmente para la aplicación de pruebas de significación), por un lado, y por otro, debido a la necesidad de describir el fenómeno estudiado en la mejor forma de darse en la realidad social, muchas veces se hace un diseño de compromiso entre el que corresponde a la encuesta descriptiva y el que corresponde a la encuesta explicativa (que, en definitiva, significa tomar una muestra más heterogénea) A este compromiso se refiere Hyman cuando analiza el estudio del investigador estadounidense Richard Centers (The Psychology of Social Classes, Princeton University Press, Princeton, 1949): Desde el punto de vista de una encuesta descriptiva, uno buscaría la medición más comprensiva y exacta del fenómeno en alguna población grande o en muestra de tal población. Restringir el estudio a unos pocos grupos contraste habría ido contra el propósito [de comprobar la hipótesis según la cual ciertas actitudes son provocadas por la posición económica de las personas], ya que no habría sido posible una descripción general del fenómeno en toda la población. Además, tomar una muestra de todos los grupos con el número suficiente de casos aparte de los costos prohibitivos, complicaría la investigación, ya que la descripción del estado de la conciencia de clase habría implicado computaciones especiales. Parear los grupos económicos previamente con respecto a otras variables independientes, restringiendo el universo severamente, habría sido un error, porque esto no habría permitido cualquier descripción del fenómeno tal cual este se daba en el contexto natural de América (pp. 84-85). DISEÑO DE LA ENCUESTA La preparación y diseño de la encuesta social es similar, en cuanto a sus momentos y etapas, a los que fueron presentados en el primer capítulo al referirnos a la investigación social cuantitativa. Como se recordará, se distinguieron tres momentos en ese proceso:

Page 5: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

I. Acercamiento inicial al tema y al problema de investigación. II. Preparación del proyecto de investigación, con las siguientes tareas: 1. Planteamiento del problema de investigación. 2. Elaboración del marco conceptual del problema. 3. Formulación de los objetivos de la investigación. 4. Finalidades de la investigación. 5. Determinación del diseño metodológico. 6. Cronograma de trabajo. 7. Presupuesto. III. Ejecución del proyecto, con las siguientes tareas: 1. Preparación del marco poblacional con el cual se trabajará o del cual, si procede hacerlo, se tomará la muestra. 2. Selección del tipo de muestra y determinación de su tamaño. 3. Elaboración de los instrumentos para la recolección de la información. 4. Prueba de los instrumentos, y modificaciones y adaptaciones, si son necesarias. 5. Selección y capacitación de los entrevistadores o encargados de la aplicación de las pruebas. 6. Trabajo de campo para la recolección de la información. 7. Revisión de la información recogida. 8. Codificación de la información. 9. Preparación de un plan de análisis. 10. Elección de un paquete estadístico apropiado. 11. Análisis e interpretación de los resultados. 12. Preparación de la estructura del informe. 13. Redacción del informe final o de informes parciales. En los capítulos siguientes se expondrán detalladamente algunas de las tareas que, de manera más directa, corresponden al diseño de la encuesta social.

Page 6: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

CAPITULO 8 EL CUESTIONARIO

El cuestionario es el componente principal de una encuesta; sin embargo, para decirlo de alguna manera, no existe una "teoría" que nos diga cómo debe prepararse. Por el contrario, su construcción es más bien la expresión de la experiencia y el sentido común del investigador. Si bien reconocemos como validos esos juicios, se pueden dar diversas indicaciones que ayuden a cumplir en mejor forma esa tarea. A las principales de ellas nos referimos en los siguientes párrafos. DISEÑO DEL CUESTIONARIO 1. Las preguntas del cuestionario deben derivarse de los objetivos del estudio y, por tanto, del problema de investigación planteado. Los objetivos de la encuesta (y, en general, de otros tipos de investigaciones) son de dos tipos: general y específicos.

a) Ejemplo de objetivos generales:

• Obtener (conocer, determinar, describir, etc.) las actitudes de la población respecto de los partidos políticos (de la Iglesia, del aborto, la propaganda comercial, etc.).

• Relacionar las actitudes hacia los partidos políticos (Iglesia, etc.) con otras variables; por ejemplo, nivel de religiosidad, interés por la situación el país, autoestima, etcétera.

b) Objetivos específicos (derivados del objetivo general). Aquí conviene recordar la

clasificación de los objetivos en el diseño general de una investigación: descriptivos, clasificatorios, relaciónales y explicativos

• Ejemplos derivados del objetivo general 1: Los objetivos específicos son: I

1. Determinar (describir) las actitudes de la población según: 1.1. Sexo. 1.2. Grupos de edad. 1.3. Nivel educativo. 1.4. Ingreso personal.

• Ejemplos de objetivos derivados del objetivo general 2: 1. Determinar (establecer) las relaciones de las actitudes hacia los partidos políticos (la Iglesia, etc.) con las siguientes variables: 1.1. Nivel de participación social. 1.2. Nivel de lectura. 1.3. Afiliación religiosa. 1.4. Identificación política. 1.5. Autoestima

El primer objetivo, que en el ejemplo está tomado en sentido descriptivo podría considerarse también como el de buscar relaciones entre las variables factuales indicadas y las actitudes generales (clasificadas, por ejemplo, entre: positivas y negativas). Sin embargo, podría convenir mantenerlo en su función descriptiva. El segundo objetivo se puede cumplir aplicando uno u otro coeficiente relación o de correlación de los tipos que veremos en un próximo capítulo. Conviene tener presente que el investigador, antes de preparar el cuestionario, debe

Page 7: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

preguntarse en qué subgrupos de la población conviene describir el fenómeno estudiado, como también con qué variables relacionarlas. Desde luego, esta decisión no es mecánica; al contrario: debería basarse en la teoría o en el marco conceptual empleado en el estudio. En estas tareas, el investigador debe utilizar toda su curiosidad investigativa, todo su capital intelectual, todo su compromiso social, para obtener de fuentes los elementos que le permitirán enriquecer la investigación que está realizando. 2. No hay un criterio al cual se pueda apelar para saber cuántas preguntas debe contener un cuestionario. Si bien conviene, en una primen» etapa, formular cuantas preguntas parezcan apropiadas para cubrir el problema de investigación, en revisiones posteriores se podrá encontrar que preguntas que parecieron importantes en un cierto momento, no lo son después. 3. El cuestionario debe comenzar con preguntas generales simples, al alcance de cualquier persona, con el fin de establecer un clima favorable, de armonía entre el entrevistado y el entrevistador. 4. Una pregunta puede influir sobre la siguiente. Conviene examinar cuidadosamente esa posibilidad. Una forma de evitar ese riesgo consiste en colocar primero las preguntas generales y luego las más específicas sobre el tema al cual se refieren. Por ejemplo: la pregunta: "¿Qué opina usted sobre la atención que el gobierno le da a la educación?" debería ir después de una pregunta general como: ¿Qué opinión tiene usted acerca del Gobierno?" Las preguntas generales proporcionan al entrevistado un marco de referencia para contestarlas. 5. Las preguntas deben organizarse en una secuencia lógica, como siguiendo el hilo de una conversación. Conviene avisar al entrevistado cuando se pasa a un tema diferente del tratado hasta un cierto momento; por ejemplo, decir: “Ahora vamos a pasar a otro tema." 6. No utilice preguntas que pueden inducir la respuesta; por ejemplo, la pregunta: "¿Piensa usted que su situación ha empeorado en el último año?”, podría llevar a la respuesta inmediata "Sí". 7. No utilice preguntas directas que pueden colocar al entrevistado” en una situación embarazosa. La pregunta: "¿Qué opinión tiene usted acerca de la unión Matrimonial libre?", podría ser remplazada por una fórmula indirecta como esta: "Algunas personas están de acuerdo y otras en desacuerdo con la unión matrimonial libre. ¿Cuál es su opinión al respecto?" La idea aquí es despersonalizar la pregunta. 8. Evite emplear expresiones vagas que proporcionan respuestas también vagas. Así sucede con el uso de expresiones como: con qué frecuencia, con que regularidad, diría usted que generalmente, a menudo, etcétera. 9. El cuestionario debe comprender tres secciones de preguntas:

• Caracterización del entrevistado, que permite saber si corresponde o no al grupo de personas requeridas por el estudio ("¿Tiene usted una ocupación remunerada?").

• Preguntas demográficas o de clasificación (edad, sexo, ingresos, ocupación, etc). Muchas veces, este tipo de preguntas provocan inquietud en el entrevistado, por lo cual se colocan al final del cuestionario.

• Preguntas referidas al tema central del estudio (pueden ser preguntas abiertas o cerradas). Forman la parte más larga del cuestionario.

10. Según los objetivos y las necesidades del análisis, el cuestionario podrá utilizar tipos de preguntas como las que presentamos a continuación:

a) Preguntas cerradas: • Dicotómicas: "¿Tiene intenciones de votar en la próxima elección?

Sí No

Page 8: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

• Con respuestas múltiples: "¿En cuál de las siguientes posiciones políticas se ubicaría usted?" Derecha Centro-derecha Izquierda Centro-izquierda

b) Preguntas abiertas • Principal: "¿Cuáles son para usted los principales problemas q tiene el país en estos

momentos?" • De profundización: "¿Podría ampliar su respuesta?" • De clarificación: "¿Qué quiere usted decir con 'mucho desorden'?"

c) Preguntas con graduaciones en una dirección (unipolar) • ¿Cómo definiría usted su situación económica actual?"

Muy buena Buena Regular Mala Muy mala

d) Preguntas con graduaciones en dos direcciones (bipolar) • "Según su opinión, usted diría que la educación básica es actualmente":

Demasiada práctica Algo práctica Sin orientación Algo teórico. Demasiada teórica

e) Preguntas de acuerdo-desacuerdo. Son, en general, las preguntas que se utilizan

en la construcción de escalas tipo Likert, o en la construcción de índices con una, dos o tres preguntas que representan indicadores de una misma variable (por ejemplo, intolerancia, individualismo, autoritarismo, etc.):

• "En la lista siguiente, indique su grado de acuerdo o desacuerdo con la siguiente proposición. “'Para arreglar los problemas de este país se necesita una persona que gobierne con mano dura'." Muy de acuerdo De acuerdo Ni de acuerdo ni en desacuerdo En desacuerdo Muy en desacuerdo

Page 9: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

f) Preguntas de ordenamiento en rangos: • "Por favor, ordene según la importancia que usted le da a las siguientes

características de una persona, siendo 1 la más importa y 5 la menos importante." Ser: Buen amigo(a) Honrada Creyente Leal Confiable

g) Preguntas con diferencias semánticas: • "Por favor, coloque una X en el espacio que mejor se acerque a la opinión que usted

tiene acerca de Estados Unidos." Ambicioso No ambicioso Corrupto Incorrupto Benefactor Egoísta Realista Idealista

• "Por favor, indique en la escala, que va de mayores a menores lores, cómo le parece

este producto." Bueno 1 2 3 4 5 6 7 Malo. Lento 1 2 3 4 5 6 7 Rápido Barato 1 2 3 4 5 6 7 Caro Feo 1 2 3 4 5 6 7 Bonito

PRUEBA DEL CUESTIONARIO. CONTROL DE LOS ENTREVISTAD ORES La prueba del cuestionario en una pequeña muestra o grupo de personas con características similares a las de la muestra total del universo elegido para cumplir con los objetivos del estudio, cumple algunas o todas estas funciones: • Comprobar la comprensión de las preguntas por parte del entrevistado • Ubicar preguntas que suscitan rechazo o inhibición. • Examinar las respuestas a preguntas abiertas que puedan llevar a remplazarlas por preguntas cerradas. • Considerar la eliminación de preguntas con respuestas obvias. • Eliminar o remplazar preguntas que producen respuestas ambiguas. • No emplear preguntas que induzcan respuestas en una cierta dirección • No emplear términos técnicos que las personas del estudio puedan reconocer. Durante el proceso de aplicación de la encuesta, o al final del proceso, es necesario verificar el trabajo de los entrevistadores en un pequeño número de entrevistas ya realizadas, ya sea por supervisores o mediante preguntas por teléfono. Con esta verificación se trata de establecer: a) si efectivamente se hizo la entrevista; b) si se entrevistó a la persona indicada para dar las respuestas; c) si el entrevistador siguió las instrucciones que recibió para hacer la entrevista. PRECODIFICACIÓN Y CODIFICACIÓN DEL CUESTIONARIO Cuando la información final recogida en una encuesta va a ser procesada con un programa de computadora, cada cuestionario debe llevar un número y debe asignársele tantas

Page 10: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

columnas como dígitos tenga el número mayor. Por ejemplo, si se trata de una población o muestra de 750 personas por entrevistar, se emplearán tres columnas (columnas 1 a 3). De igual manera debe precederse para las preguntas cerradas. Aquí presentan dos situaciones principales: 1. La pregunta pide una sola respuesta elegida de una lista de alternativas:

• "¿En cuál categoría se ubicaría usted en función de su posición política?": Derecha 1 Centro 2 Izquierda 3 Otra 4 No contesta 5

En preguntas de este tipo, con una sola respuesta de entre varias opciones de procesamiento, usar una sola columna.

2. La pregunta admite varias respuestas de una lista prefijada:

• "¿Cuáles de los siguientes objetos posee usted en su casa?": Televisor 1 Radio 2 Lavadora de ropa 3 No contesta 4 :

En casos como el del ejemplo se deben utilizar varias columnas. Así, como la persona puede tener los tres objetos citados, a cada uno de ellos se le asignará una columna, en la cual se marcará "1" si tiene el objeto del caso y "O" si no lo posee. Otra columna se asignará a la posibilidad "No contesta". Cuando se emplean preguntas abiertas, en algunas ocasiones podrán clasificarse según su contenido, de manera similar a las situaciones anteriores y asignárseles las columnas correspondientes (si por alguna razón no se prefiriera usar una pregunta cerrada). Tal caso se presentaría si la pregunta fuera del tipo de las dos preguntas dadas antes. La situación cambia cuando las respuestas a preguntas abiertas contienen más respuestas o apuntan a diversos tipos o categorías de respuestas, como lo señalamos a continuación.. Supongamos que se tiene la siguiente pregunta abierta: "¿A qué atribuye que algunas personas de este país tengan mejor situación económica que otras?". Es evidente que ante esta pregunta se pueden obtener muy variadas respuestas de mayor o menor amplitud. Para su codificación, después de aplicar la encuesta, se seleccionan al azar unos pocos cuestionarios (digamos cinco o 10) y se copian las respuestas obtenidas. Mediante un análisis de su contenido, se determinan categorías que las agrupen. Por ejemplo, las respuestas podrían agruparse en categorías como "económicas (1)", "políticas (2), "parentesco (3)", "educativas (4)", etc. Con este código se procede a codificar todas las encuestas. Algunas de ellas podrán contener más de una categoría, en consecuencia, se clasifican con los signos correspondientes (por ejemplo, 1,3). En la asignación de columnas para su análisis se procede como en el caso de preguntas cerradas. Muchas veces, el uso de una pregunta abierta sigue a una pregunta cerrada. Supongamos que se hace la pregunta: "¿Tiene dificultades para llevar a sui hijos a control de salud?"

Sí. No No contesta Si la persona contesta "Sí", se le hace la pregunta abierta correspondiente "¿Podría decirme por qué tiene problemas?" (o "¿Por qué no tiene problemas?)

Page 11: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

PLAN DE ANÁLISIS El plan de análisis define el procesamiento de los datos obtenidos por la encuesta, de acuerdo con los objetivos de ésta, además de las características generales de la población o muestra entrevistada; por ejemplo, la distribución por edades de la población encuestada; la composición por sexo, por categorías de ingreso, de educación, y por otras variables demográficas de identificación. Desde luego, también se indicarán los cálculos estadísticos correspondientes a los otros tipos de preguntas del cuestionario. Si bien los objetivos del estudio pueden pedir algunos de los datos anteriores, otros se refieren directamente a aspectos centrales de la investigación y llevan a cálculos con el uso de dos o tres variables (o cruzamiento de dos o más variables). Así, por ejemplo, en el plan de análisis se dirá:

• Cruzar entre sí las siguientes columnas (recordar que tales columnas contienen variables del estudio): 1. 4 y 7 2. 6 y 16 etcétera.

Si la columna 4 correspondiera al sexo de las personas, y la 16, a orientación política, lo que se está pidiendo es la distribución por sexo de las orientaciones políticas de hombres o de mujeres. Así, se tendrá un cuadro cruzado formado por las categorías de esas dos variables. Ejemplo de un cuadro obtenido mediante el uso del SPSS (Statistical Package for the Social Science, Inc., 1988), en el cual se entrega un cruce de variables que definen varias celdas o casillas. Note que la computadora entrega un cuadro con el cálculo realizado respecto del total de respuestas (en las filas) y respecto del total de casos (en las columnas) (SPSS, p 237).

Page 12: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

CROSSTABS RUN A SYSTEM FILE FILE ORGSTUDY (CREATION DATE = 03/13/74 STUDY OF ORGANIZATIONAL

MEMBERSHIP AND ACTIVITY SUBFILE NETWORK NWJERSEY PENNSYLV

........................... .CROSSTABULATION OF- ............................... ENDERSPON LASYEAR SCHOOL COMPLETED BY NMEN TOTAL NUMBER OF

MEMBERSHIPS CONTROLLING FOR SEX RESPONDENTS SEX VALUÉ I MALE

Page 13: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

INFORME FINAL Si bien no existe una forma invariable de presentar el informe final una investigación, se considera necesario incluir en el las siguientes partes • Introducción: presentación del problema de investigación, su importancia, problemática teórica o práctica dentro de la cual se le ha estudian antecedentes en la bibliografía del tema, hipótesis sometidas a contrastación empírica en el estudio. • Metodología: población del estudio, tamaño y tipo de la muestra (si cede), trabajo de campo, instrumentos utilizados en el trabajo de campo, problemas encontrados y soluciones dadas, técnicas empleadas en el análisis de los datos. • Capítulos que exponen los resultados obtenidos, con los correspondientes comentarios. • Bibliografía utilizada. • Anexo: cuestionario utilizado, cuadros complementarios. ENCUESTA POR TELÉFONO Para una encuesta por teléfono se utiliza el directorio telefónico de área o áreas geográficas definidas para el estudio. Para la selección se emplean el directorio telefónico del caso al cual se aplica un intervalo similar en cálculo y aplicación al de una muestra sistemática. Es una encuesta de bajo costo, pero pueden presentarse los inconvenientes de que aun los directorios más recientes no incluyan todas las casas con teléfono (por instalaciones reciente), que los habitantes están ausentes, etc. Se utiliza frecuentemente en estudios de mercado, de opinión pública, en estudios preelectorales, etcetera. BIBLIOGRAFÍA SELECCIONADA PARA LA TERCERA PARTE Briones, Guillermo, Métodos y técnicas de investigación para las ciencias sociales, Trillas, México, 1998, caps. 6, 7 y 8. Harvatopoulos, Jannis, I-F. Livan y Ph. Sarmin, El arte de la encuesta, Ediciones Deusta, Madrid, sin fecha Hyman, Herbert, Survey Desig and Analysis, The Free Press, Glencoe, III., I955, primera y secunda partes (existe traducción al español). Krathwhol, David, Methods of educational and Social Science Research, Longman, Nueva York, 1988, cap 16 Moser, C.A. y G Galton, Survey Methods in Social Investigation, Heineman educational books, Londres, 1971, caps. 1, 2 y 10 a 17. Pope, Jeffrey, Investigación de mercados, Norma, Bogotá, 1984. EJERCICIO 3 (AUTOEVALUACIÓN) Tomando como base las autoevaluaciones 1 y 2, formule: 1.- Dos o más preguntas por cada uno de los objetivos señalados por usted. 2.- Para cualquiera de esas preguntas, diga con que variables del estudio cree usted que es pertinente. 3.- Haga un cruce entre preguntas y variables (por ejemplo, si la pregunta fuera: “¿Cuántas veces al año solicita atención en el consultorio de salud de su comunidad?”, ésta podría cruzarse con la variable sexo).

Page 14: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

CAPITULO 12 RAZONES PROPORCIONES PORCENTAJES Y TASAS

Las razones, las proporciones, los porcentajes y las tasas son medidas estadísticas sencillas que se utilizan para describir la distribución de las personas de un colectivo, en una o más categorías de una variable cualitativa o nominal. Tales medidas tienen especial uso en la comparación de resultados entre esas categorías, como también en la caracterización global de un colectivo RAZONES Las razones son cocientes que resultan de comparar el número de personas que quedan ubicadas en una de las categorías de una variable cualitativa dicotómica, con el número de personas que queda en la otra categoría de esa variable. Si, por ejemplo, en una encuesta se encuentra que 120 personas están de acuerdo con la pregunta "¿Está usted de acuerdo con el divorcio?", y 80 están en desacuerdo, la razón entre esos números es:

120/80 Ese valor se expresa diciendo que la razón de las personas que están de acuerdo con el divorcio respecto de las que están en desacuerdo es de 120 a 80, o simplificando, de 3 a 2. Al hacer la división, la razón sería igual a 1.5. Si la anterior relación se hubiese calculado en sentido inverso, se habría obtenido una razón de:

80/120, o sea, de 2 a 3 (= 0.67) En casos como el anterior, si la división de los valores diera un resultado menor que 1, conviene multiplicar el resultado por 100 (o por 1000 el número de decimales obtenidos). Conforme a esta convención, la razón entre las personas en desacuerdo y de acuerdo, en el ejemplo dado ai mente, sería de 80:120 = 0.6666 X 100 = 66.7%. Cuando se cualquier potencia de 10 en los cálculos, conviene señalarlo de manera explícita. Como decíamos, las razones tienen especial utilización al comparar la variable del caso entre dos o más grupos. Si hubiese ocurrido que la encuesta citada hubiera sido aplicada en otro lugar y respecto de la pregunta sobre el divorcio hubiese dado una razón de 1.2, diríamos que aquí hay menor diferencia entre los que están de acuerdo con el divorcio y los que están en desacuerdo, ya que en el caso anterior la razón era de 1.5. Igual comparación podría hacerse en un mismo lugar en momentos diferentes para mostrar si ha habido un cambio en la actitud frente al divorcio (o en cualquier otra situación enfocada por una investigación). Conviene hacer notar que la razón no depende del número absoluto de personas consideradas en el cálculo. Así, si los números de las respectivas categorías de la variable cualitativa (actitud frente al divorcio) hubiesen sido 12 y 8, la razón habría sido la misma: 1.5. Esto significa que las razones son medidas relativas que permiten hacer comparaciones similares con otros grupos, con independencia de sus tamaños. PROPORCIONES Las proporciones, de manera similar a las razones, son medidas que sintetizan la distribución de las personas en las categorías que pueda la variable cualitativa que se considere en el análisis. En este caso, el cálculo se realiza entre el número de unidades o

Page 15: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

personas en la categoría p y el total de las personas del grupo. Para utilizar el ejemplo dado al presentar las razones, si las personan que están de acuerdo con el divorcio son 120 y el total del grupo es de 200 (120 + 80), entonces la proporción de personas que tienen esa actitud, en el nivel del grupo, es de:

120/200 = 0.6 (o 0.60, según quiera presentarse el resultado) La proporción de las personas en desacuerdo es: 80/200 = 0.4 (o 0.40)

En general, si “p” es el número de personas de una de las categorías de una variable dicotómica, y “q” es el número de personas de la otra categoría, entonces:

p + q = i En el ejemplo: 0.6 + 0.4 = 1. A partir del conocimiento del valor de una razón se puede calcular la p correspondiente. Si la razón entre quienes están de acuerdo con el divorcio fuera de 7/4 (siete de acuerdo y cuatro en desacuerdo), la proporción sería de

7/11, o sea, 0.63. Cuando la variable cualitativa tiene dos categorías, es indiferente calcular o una razón o una proporción. Sin embargo, cuando esa variable tiene más de dos categorías, es conveniente utilizar proporciones. En la tabla que sigue se muestran las distribuciones de la variable "tipo de educación", completa e incompleta, de 850 personas de las localidades de Amira y de Belicia. La comparación de las cifras absolutas correspondientes a los tipos de educación en ambas localidades hace difícil cuál de las dos tiene una distribución de la educación más equitativa o en cuál de ellas existe un mayor nivel de educación superior, pues las localidades difieren bastante en el tamaño de la población que se compara.

Proporción de personas de 30 años y más en tres tip os de educación, en las localidades de Amira y Belicia, 1995

Tipo de educación

Amira p Belicia q

Básica 480 0,57 284 0,54 Media 320 0,38 190 0,36

Superior 45 0,05 51 0,10 Total 845 1,00 525 1,00

El cálculo de proporciones facilita mostrar la distribución entre las diversas categorías de una variable dentro de un mismo grupo. Por ejemplo, en el caso de la localidad de Amira, se puede constatar la baja proporción de personas con educación superior (0.05). Con esta cifra, la proporción de personas con educación superior en Belicia es el doble del subgrupo correspondiente de Amira (0.10).

Page 16: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

PORCENTAJES Un porcentaje es una proporción multiplicada por 100. Los porcentajes cumplen la misma función comparativa que esa medida. De acuerdo con lo expresado, el cuadro anterior (utilizado para el cálculo de proporciones) quedaría así:

Proporción de personas de 30 años y más en los tres tipos de Educación, en las localidades de Amira y Belicia, 1 995

Tipo de educación Amira (%) Belicia (%)

Básica 57,0 54,0 Media 38,0 36,0

Superior 5,0 10,0 Total 100,0

(845) 100,0 (525)

En el ejemplo, los porcentajes se han derivado directamente de los correspondientes cálculos de las proporciones, en los cuales se hizo una aproximación de los decimales para presentarlos con dos dígitos. Si el cálculo original se hubiese hecho con tres dígitos, entonces la proporción de personas con educación básica en Amira habría sido de 0.568, y el correspondiente porcentaje de 56.8. Las necesidades de precisión deberán considerarse en cada caso. Cuando se calculan porcentajes, es necesario tener en cuenta la recomendación que nos dice que siempre debe indicarse la base respecto de la cual se hizo el cálculo (en el ejemplo, 845 y 525). TASAS La tasa es un tipo especial de razón en la cual el numerador indica el numero de un cierto suceso que ocurre durante un determinado periodo, y el denominador es el número de sucesos con los cuales el primero esa relacionado. Generalmente, el cociente obtenido se multiplica por 100 o por 1000. Veamos unos ejemplos de tasas. 1. Tasa de atención en salud en el municipio A:

�������ℎ��������� ����������

�������������� ���������� ����

Las horas de atención en salud pueden referirse al total mensual de horas de prestación por el médico o médicos de los servicios de salud del municipio, de las enfermeras, de los auxiliares de salud o de otro personal de salud, de manera separada o por categoría profesional 2.- Tasa de participación en la fuerza de trabajo:

(������������������������)

����� ���������100

Page 17: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

3.- Tasa de retención escolar. Es la proporción o porcentaje de alumnos que terminan un cierto ciclo escolar respecto del número de esa cohorte al iniciar el ciclo. Así, si en 1985, 200 alumnos comenzaron sus estudios de un ciclo que terminó en 1990 con 112 alumnos, la tasa de retención es de:

112/200 = 0.56 (o 56 %) Otra razón modificada es el llamado porcentaje de cambio, que expresa la magnitud del cambio de una variable entre dos periodos. Por ejemplo, si en, digamos, 1990, el número de alumnos matriculados en la carrera de trabajo social era de 1250 (fi) y en 1999 era de 25 (f2) el porcentaje del cambio de la matrícula en esa carrera se calcula con la siguiente fórmula: Introduciendo los datos del ejemplo: Porcentaje de cambio de la matrícula en la carrera

� =2540 − 1250

1250�100 = 103

Los cálculos muestran que la matrícula experimentó un aumento de 3 puntos porcentuales entre 1990 y 1999.

Page 18: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

CAPITULO 13 DISTRIBUCION DE FRECUENCIAS

A diferencia de las variables cualitativas que vimos en el capítulo anterior, en las cuales las unidades de un colectivo se distribuyen en dos categorías (en el caso de variables dicotómicas) o en unas pocas categorías (como sucede en las variables politómicas), esta situación cambia cuando se trata de describir y analizar la distribución de casos en los múltiples valores que puede tomar una variable cuantitativa que, en el caso de una variable teórica, es un número infinito de valores. Para los objetivos enunciados de describir y analizar los datos recogidos para una investigación, se utilizan tres tipos principales de su distribución: distribución de frecuencias absolutas, distribución de porcentajes y distribuciones acumuladas de frecuencias o de porcentajes. DISTRIBUCIONES DE FRECUENCIAS ABSOLUTAS Las distribuciones de frecuencias muestran las frecuencias con las cuales se presentan los valores de una variable, ordenadas según el tamaño valores. Cuando la variable es discreta (es decir, cuando entre dos valores de ella no hay otro valor intermedio), no hay mayor problema en el ordenamiento de sus valores; en tal caso, lo primero es elegir un número de intervalos no debería ser mayor que 8, con el fin de favorecer la comparación entre los grupos. Por ejemplo, supongamos que tenemos las escolaridades de 150 personas con los siguientes números de años de estudio:

12, 14, 11, 13, 8, 7 y 9 Para hacer la distribución de frecuencias, procedemos a elegir un número de intervalos, como dijimos. Si se eligen cinco intervalos (también denominados intervalos de clase), dividimos la diferencia entre los valores extremos (14 – 7 = 7) entre el número de intervalos elegido (7/5 = 1.4). Como el reí inferior a 1.5 (cifra que permitiría elevar ese valor a 2), bajamos al número 1. Entonces los intervalos son:

7-8; 9-10; 11-12; 13-14 y 15-16 A continuación se procede a anotar el número de personas incluidas en cada intervalo, según su nivel educativo. Para simplificar la presentación, supongamos que se da la siguiente distribución de frecuencias:

Niveles de escolaridad Frecuencias 7 – 8 77

9 – 10 45 11 – 12 19 13 – 14 9 15 – 16 0

Total 150

Page 19: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

La distribución muestra que el mayor número de personas tiene escolaridad de siete y ocho años, seguido por las personas que tienen nueve y 10 años. En el grado de mayor escolaridad sólo se tienen nueve personas. (En la tabla se colocó el intervalo 15 – 16 que fue definido por los cinco intervalos elegidos al comienzo. En ese intervalo no se tiene ninguna persona. Cuando sucede esto, no se coloca pero conviene decir la razón por la cual no figura en la tabla.) Cuando la variable es continua, es decir, variable en la cual entre dos números sucesivos de ella puede darse otro valor (por ejemplo, entre 4 y 5 puede el valor 4.86), la elaboración de la distribución de frecuencias es un poco más complicada, como veremos a continuación. Supongamos que se tienen los valores que se indican enseguida, correspondientes a tasas de deserción de 33 escuelas de la localidad de Salvadores 17.8, 6.9, 21.2, 28.5, 3312, 12.5, 18.2, 23.8, 28.5, 7.5, 14.2, 17.5, 21.9, 26.8, 24.5, 8.5, 18.3, 22.7, 2.3.5, 22.8, 8.7, 12.4, 19.5, 27.8, 13.8, 16.4, 23.4, 25.8, 11.0, 18.1, 21.7, 32.1 y 23.2 Para organizar esos datos con propósitos de análisis, es necesario realizar las siguientes operaciones: 1.- Seleccionar el número de categorías en las cuales se distribuirán los datos: Un número entre 5 y 8, recordemos, se considera habitualmente como conveniente. Sin embargo, ese número dependerá del interés que tenga el investigador en mostrar con mayores o menores detalles la distribución de los datos. 2. Determinar el tamaño del intervalo de clase. Si bien se han propuesto fórmulas sencillas para determinar ese tamaño, como lo hicimos en el ejemplo anterior (diferencia entre el tamaño del dato mayor y el tamaño del dato menor, dividida entre el número de intervalos que se desea tener), en general es preferible utilizar tamaños pequeños, pues, si es conveniente para un análisis posterior, podemos reagrupar los intervalos en otros de mayor amplitud (por ejemplo, reagrupar los datos en intervalos de 10 puntos, en lugar de intervalos de cinco puntos). 3. Formar los intervalos. Si, para los datos del ejemplo, elegimos un intervalo de 5, el límite inferior del primer intervalo podría ser 5.0 (que es inferior al menor de los datos: 6.9), y el límite superior, 9.9; el segundo quedaría entre 10.0 y 14.9, etcétera. La tabla quedaría como sigue:

Distribución de las frecuencias de las tasas de des erción de 33 escuelas de la localidad de Salvadores

Intervalos Frecuencias 5.0 – 9.9 4

10.0 – 14.9 5 15.0 – 19.9 7 20.0 – 24.9 10 25.0 – 29.9 5 30.0 – 34.9 2

Total 33 Como se puede ver en la tabla, los límites de los intervalos se han elegido de modo que no se confundan con los que le siguen. Sin embargo, si se considera que en el cálculo de las tasas de deserción (o de los datos que estamos agrupando) se ha podido proceder a redondear las cifras decimales, entonces queda la pregunta acerca de que sucede con

Page 20: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

tasas que, como ejemplos, tenían los valores 19.95 y 19.94. La respuesta general es que, en casos como ésos, si el valor del segundo decimal es igual o mayor que 5, hace subir al primer decimal al dígito inmediato superior, y si el valor es menor que 5, el primer decimal no cambia el valor. Según esta convención, la tasa de 19.05 queda en el intervalo de 20.0-24.9 y la tasa de 19.94 queda en el intervalo de 15.0-19.9. Los valores de 19.95 y 19.94 constituyen los límites reales de los intervalos de clase, DISTRIBUCIONES DE PORCENTAJES Las distribuciones de porcentajes están constituidas por los porcentajes de las frecuencias absolutas calculadas respecto del total de ellas. En general, los porcentajes permiten una mejor comparación de la distribución relativa de los casos en el colectivo. En el ejemplo anterior, la distribución de frecuencias tomaría esta forma:

Distribución porcentual de 33 escuelas de la locali dad De Salvadores, según sus tasas de deserción

Tasas Frecuencias Porcentajes

5.0 – 9.9 4 12.1 10.0 – 14.9 5 15.2 15.0 – 19.9 7 21.2 20.0 – 24.9 10 30.3 25.0 – 29.9 5 15.2 30.0 – 34.9 2 6.0

33 100 (33)

En la tabla de una distribución de porcentajes no es necesario colocar Ias columnas de frecuencias absolutas, pero sí debe indicarse la base de su cálculo. En el ejemplo, el número 33, que se coloca al pie de 100%. La utilidad de las distribuciones de porcentajes para comparaciones se puede ver en la tabla que sigue, tomada de una investigación sobre el proceso de "elitización de las universidades chilenas durante el periodo 1976-1981 (publicada en Guillermo Briones, "La educación superior en el modelo de la economía neoliberal”, en Las transformaciones educacionales bajo el régimen militar, vol. 2, PIIE, Santiago, 1984, pp. 237-354).

Composición social de los estudiantes seleccionados Para ingresar a las universidades chilenas, 1976 y 1981

Nivel educativo del padre 1976 1981 1976 1981

Sin estudios 208 139 0,8 0,5 Primaria incompleta 3,058 3.186 11,9 12,6 Primaria completa 4,387 3,296 17,0 13,0 Enseñanza media incompleta 5,652 4,484 21,9 17,7 Enseñanza media completa 6,446 7,276 25,0 28,7 Universitaria incompleta 1,514 1,479 5,9 5,8 Egresado de universidad 546 586 2,1 2,3 Universitaria completa 3.201 4,010 12,4 15,8 Estudios militares 739 881 2,9 3,5 Total 25,751 25,337 100,0 100,0

Page 21: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

Nota: En este y en los cuadros siguen no se consideran los alumnos seleccionados para las carreras que se indican a continuación, por carecer de información comparable en ambos años o por tener sólo la condición de preseleccionados: carreras de Universidad Católica de Valparaíso, Psicología, Pedagogía en artes Plásticas, Música, Idiomas, Educación diferencial, Ingeniería de la Universidad Técnica Federico Santa María; Bioquímica de la Universidad Católica. Fuente: Comisión coordinadora de Admisión de Alumnos a las Universidades Chilenas. DISTRIBUCIONES DE FRECUENCIAS ACUMULADAS En algunos casos, los datos de una investigación se presentan de maneta tal que se pueda mostrar el número de casos que son mayores o menores que un cierto valor. La presentación se puede hacer a partir de distribuciones de frecuencias absolutas o de frecuencias porcentuales, como se ve en la tabla siguiente: I

Distribuciones de frecuencias acumuladas de Consultas mensuales de salud, de una muestra de 138 personas

Número

de consultas

Frecuencias (%)

Frecuencias acumuladas

Porcentaje acumulado

(1) (2) (3) (4) (5) (6) (7) 1 – 2 15 10,9 15 138 10,9 100,0 3 – 4 22 15,9 37 123 26,8 89,1 5 – 6 36 26,1 73 101 52,9 73,2 7 – 8 40 29,0 113 65 81,9 47,1

9 – 10 15 10,9 128 25 92,8 18,1 11 – 12 10 7,2 138 10 100,0 7,2

La columna 6 de la tabla presenta los porcentajes acumulados hacia abajo y cada cifra indica el porcentaje de casos que queda dentro y por encima del intervalo de clase que le corresponde. Así, la cifra 52.9 significa que ese porcentaje de personas han solicitado atención de salud entre una y seis veces. En la columna 7, los porcentajes se han acumulado hacia arriba, y cada cifra indica el porcentaje de casos que quedan dentro y por debajo del intervalo de clase correspondiente. Así, la cifra 18.1 indica que ese porcentaje de personas han hecho entre nueve y 12 consultas. CRUCE DE VARIABLES. REGLA DE ZEISEL En los ejemplos dados de distribuciones de frecuencias vimos como las personas se distribuían en las categorías o intervalos de una sola variable. Una forma distinta de distribución se da cuando se utilizan dos o tres variables con dos o más categorías, cada una de ellas para comparar, precisamente, cómo se distribuyen en las subcategorías que resultan por el cruce de ellas. Un cuadro en el cual las dos variables tienen el mismo número de categorías se denomina cuadro de n X n (por ejemplo, de 3 X 3). Un cuadro en el cual se han cruzado dos variables con distinto número de categorías se denomina de m x n. La multiplicación da el número de celdas del cuadro. Lo que queremos decir hasta aquí se podrá apreciar directamente en el siguiente ejemplo. Supongamos que hemos aplicado una prueba de autoestima a una muestra de personas que tienen distintos niveles de escolaridad. Supongamos, además, que cada una de esas

Page 22: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

variables ha sido categorizada en tres niveles. Al cruzarlas y calcular los respectivos porcentajes, obtendríamos un cuadro de doble entrada, como el siguiente:

Escolaridad Autoestima Alta (%) Media (%) Baja (%)

Alta 61,3 51,2 26,3 Media 27,2 29,3 52,6 Baja 11,4 19,5 21,1 Total 100,0

(44) 100,0 (84)

100,0 (114)

Las cifras del cuadro muestran que una mayor proporción de personas con alta escolaridad tiene mayores niveles de autoestima (61.3%); siguen las personas con escolaridad media (51.2%), y luego, las personas con baja escolaridad (21,1%). Los cuadros de doble entrada tienen dos tipos de marginales o de totales: los que corresponden a las filas y los que corresponden a las columnas. Por lo mismo, en algunas ocasiones se produce una cierta confusión para determinar en qué sentido deben calcularse los porcentajes que se van a comparar. Las respuestas a esta duda están dadas por la llamada regla de Zeisel, que dice: los porcentajes deben calcularse en la dirección de la variable independiente. Es decir, las bases de los porcentajes son los números correspondientes a cada una de las categorías de esa variable. En el ejemplo dado, la variable independiente es la escolaridad, ya que esta característica podría producir variaciones en la autoestima. Las bases de cálculo son, por consecuencia, los números 44, 84 y 114. (En el ejemplo no dimos las frecuencias absolutas correspondientes a cada una de las celdas del cuadro de porcentajes.) REPRESENTACIONES GRÁFICAS Las diversas técnicas que se utilizan en la presentación de datos permiten a muchas personas captar mejor los datos numéricos obtenidos en una investigación. De esas técnicas, que toman numerosas formas, vamos a presentar solo las que expresan, por medio de gráficos, distribuciones de frecuencias y que, según el caso, reciben los nombres de histograma, polígono de frecuencias y ojiva. HlSTOGRAMA El histograma es la representación gráfica de una distribución de frecuencias absolutas o de porcentajes, en la cual las frecuencias o los porcentajes correspondientes a cada categoría o intervalo de clase se representan mediante una barra o rectángulo, cuya altura es proporcional al número de casos (se indica en el eje de las y) y su base tiene una longitud arbitraria (que se marca en el eje de las x) que es igual para todos los intervalos si éstos tienen igual tamaño. Debe tenerse en cuenta que el eje de las y siempre comienza en el origen o en el punto cero, pero el eje de las x comienza, convencionalmente, con el intervalo que tiene la menor frecuencia. En el caso de variables nominales, las barras que representan proporcionalmente las frecuencias suelen presentarse separadas para indicar que corresponden a categorías diferentes (por ejemplo, si las frecuencias del caso

Page 23: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

correspondieran a un cierto número de personas que respondieran "Sí" y "No" a una pregunta de un cuestionario). La representación gráfica se conoce comúnmente con el nombre de diagrama de barras (véase fig. 13.1). En el caso de variables ordinales, el procedimiento de representaciones es similar al que se realiza con una variable continua. '

Fig. 13.1 Histogramas de las frecuencias absolutas y porcentuales de las edades de 223 niños. POLÍGONOS DE FRECUENCIAS Son figuras que resultan de unir los puntos medios de las bases superiores de las barras o rectángulos del respectivo histograma. Los rectángulos no aparecen en el gráfico final. Al unir los puntos mencionados, es necesario que el polígono inicie en el punto medio del primer rectángulo y llegue hasta el punto medio del último rectángulo del histograma. La prolongación errada hasta el punto cero de los intervalos del histograma implica una falsa representación de los datos que sirven de base a la representación gráfica. Cuando se comparan polígonos de dos o más grupos, es necesario convertir las frecuencias absolutas de las correspondientes distribuciones en frecuencias relativas o porcentuales (véase fig. 13.2).

Fig 13.2

Page 24: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

OJIVA La ojiva es la representación gráfica de las frecuencias absolutas acumuladas o de los respectivos porcentajes acumulados. El procedimiento de construcción es, en ambos casos, similar al que se utiliza en el histograma. Cualquiera de las dos ojivas permite apreciar en forma gráfica el número de casos o de porcentajes que quedan por encima o por debajo de un determinado valor de la variable (véase fig. 13.3).

Fig 13.3

SERIES DE TIEMPO Una serie de tiempo es un conjunto de datos numéricos que se recolectan en intervalos sucesivos de tiempo. En el análisis de una serió de tiempo se consideran los siguientes cuatro componentes: • La tendencia (T). • La fluctuación cíclica (C). • La variación estacional (E). • Un movimiento irregular (/) De acuerdo con esta distinción, se acepta que el valor de una serie temporal puede expresarse en función de la tendencia que se dé en ella, de su fluctuación cíclica, de su variación estacional o de un movimiento irregular. La tendencia se define como aquella parte de la serie de tiempo que muestra un movimiento suave o regular en un periodo largo. La variación estacional es la componente que muestra una forma o patrón regular de comportamiento durante ciertos subperiodos del periodo total considerado. La variación cíclica se muestra en los datos como movimientos alrededor de encía y finalmente, la componente irregular es la parte de la serie que se explica por fenómenos poco frecuentes que la afectan, como podría ser una catástrofe natural (terremoto, huelga, etc.) o también podría presentarse por baja calidad de los datos. A continuación veremos dos métodos que se utilizan en la determinación de la tendencia y de una serie de tiempo.

Page 25: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

CALCULO DE LA TENDENCIA Loa métodos más utilizados son: el método de los semipromedios y el método de los promedios móviles. Método de semipromedios Consiste en dividir la serie temporal en dos partes, calcular luego la media aritmética de cada parte, ubicar esos dos valores en la serie original y finalmente unir esos dos puntos mediante una recta. Tal recta es la expresión gráfica de la tendencia buscada. Veamos estos cálculos con un ejemplo. Supongamos que tenemos la serie siguiente, que muestra las variaciones de la población en edad escolar que termina el último año de la enseñanza básica en cada uno de los años que se indica

Año x Población de escolares que termina la educación básica (en miles): y

1993 0 50.4

1994 1 55.2

1995 2 62.4 X0 = 56.0

1996 3 68.4

1997 4 74.4

1998 5 79.2 X1 = 74.0

Como dijimos, en primer lugar se calcula el promedio de los alumnos egresados en los años 1993, 1994 y 1995, correspondientes a la primera mitad de la serie, que es igual a 56.0; luego se procede con un cálculo similar en la segunda mitad, correspondiente a los años 1996, 1997 y 1998, lo que da una media aritmética de 74.0. Enseguida se realiza -si no se ha hecho antes- la representación gráfica de la serie original, y en tal representación se hace pasar una línea entre los puntos 56.0 y 74.0, ubicados en el centro de los semiintervalos de tiempo (1994 y 1997). Tal línea se denomina línea de los semipromedios; su prolongación hasta cortar el eje de los números de egresados indica la tendencia de la serie. Esa tendencia muestra que, por ejemplo, en el año 2000, el número de egresados sería de unos 108 000 (véase fig. 13.5).

Page 26: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

Cuando la serie temporal se compone de un número impar de periodos, se puede eliminar uno de ellos para obtener un número par de valores. Método de los promedios móviles Este método permite eliminar en mayor magnitud las variaciones de una serie, debidas a componentes distintos de la tendencia. Por eso se le utiliza, en general, para suavizar los datos de una serie temporal. Comprende las siguientes etapas: 1. Se determinan en la serie periodos de tres o cinco años, según convenga mejor a los datos de la serie total. 2. Se calculan los totales de la serie formada por los datos del primer periodo elegido (vamos a suponer periodos de tres años). 3. El segundo periodo elegido comienza en el segundo dato del primer periodo. El tercero y siguientes se calculan de la misma manera (es es, tomando siempre el segundo dato de la serie anterior como origen de la serie siguiente). 4. En cada uno de los periodos calculados según el procedimiento señalado anteriormente, se calculan los promedios dividiendo el total entre número de años del periodo (en el ejemplo, 3). Veamos un ejemplo parcial de este procedimiento. Supongamos que tenemos la serie de la población femenina matriculada en la educación básica de una cierta región.

Page 27: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

Año Población femenina

Serie

1993 13580 13580 + 15430 + 18260 = 47270

1994 15430 47270 : 3 = 15757

1995 18260 15430 + 18260 + 21530 = 55220

1996 21530 55220 : 3 = 18406

1997 25720 etcétera

1998 29800

Como en el caso anterior, la unión de los puntos dados por los promedios móviles da la recta que, al cortar el eje de la variable de la serie, indica su tendencia. Sin embargo, este procedimiento tiene dos inconvenientes principales: 1. Se pierden los años del extremo inferior y del extremo superior de la serie, y 2. No se puede calcular la forma matemática de la línea recta.

Page 28: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

CAPITULO 14 MEDIDAS DE TENDENCIA CENTRAL, DE DISPERSION Y DE

CONCENTRACION Las medidas de tendencia central son números calculados con fórmulas especiales que representan, en forma sumaria, una serie de valores de una variable cuantitativa. Por su lado, las medidas de desviación expresan la heterogeneidad u homogeneidad de esos valores. En esos casos, ambas medidas como variables colectivas que son, caracterizan al colectivo en el cual se dan los correspondientes valores individuales. Así, por ejemplo, si un grupo tiene un promedio de edad de 15.5 años y otro tiene un promedio de 18.6, el primero se caracteriza por su "menor" edad respecto del segundo. MODA La moda es el valor de una serie que se da con mayor frecuencia entre los miembros de un colectivo. Puede ser utilizado con variables nominales, ya que basta contar los números de sujetos que hay en cada categoría de una variable de este tipo (por ejemplo, el número de hombres y el número de mujeres). Obviamente, es muy fácil de determinar y por ello se le emplea como una primera medida de tendencia central. En la serie siguiente se ve sin problemas que la moda es el número 20:

8, 7, 6,10, 15, 16, 20, 20, 20, 21, 23 Algunas veces hay más de una moda:

6, 7, 8, 9, 9, 9, 10, 11, 12, 12, 12 En las cifras anteriores hay dos modas: los números 9 y 12. A una distribución como ésa se lo denomina bimodal. La facilidad de cálculo de la moda se paga con algunas debilidades: a) La medida varía considerablemente de una muestra a otra tomada mismo universo. b) Puede no dar una buena representación del colectivo del cual proviene. Por ejemplo, las dos distribuciones siguientes, muy distintas entre sí por sus valores componentes, tienen la misma moda (el número 5), con lo cual podría creerse que las dos series de valores son semejantes, cuando, en realidad, hay bastantes diferencias entre ellas: • 1, 3, 4, 5, 5, 5, 6, 7, 9 • 4, 5, 5, 5, 8, 8, 10, 10,18 ,25 MEDIANA La mediana (md) es el valor que ocupa el lugar central de una distribución ordenada de valores, habitualmente en orden ascendente. Si el número de valores es impar, la mediana es el valor central. Si ese número es par la mediana es la semisuma de los dos valores centrales. Ejemplos: • Número impar de valores, ya ordenados: 10, 12, 14, 16, 19; la media es 14. • Numero par de valores, ya ordenados: 12, 14, 15, 16, 18, 20. La media es la semisuma de los valores centrales, 15 y 16; es decir, 15.5.

Page 29: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

Cuando se agrupan los datos en intervalos de clase, se utiliza la fórmula correspondiente que aparece en cualquier texto de estadística. La mediana es una medida de tendencia central que está especialmente indicada para datos ordinales, como puntajes obtenidos en la medición de actitudes, calificaciones, etc. A diferencia de la media aritmética, que presentamos a continuación, no está influida por valores extremos -muy altos o muy bajo- que se pueden dar en una serie de valores. MEDIA ARITMÉTICA La media aritmética es una de las medidas de tendencia central más utilizada para caracterizar a un colectivo mediante un solo valor. Ese valor es la suma de los valores de una variable cuantitativa continua, de carácter interval o proporcional, dividida entre el número de valores sumados. Su fórmula para datos no agrupados es la siguiente:

� = ∑��

Por ejemplo, si las cifras siguientes indican el número de horas de cada uno de seis niños que ven televisión al día -2.5, 3, 3, 3.5, 2, 1-, el método aritmético de esa actividad es la suma de las horas dividida entre 6:

� =(2,5 + 3 + 3 + 3,5 + 2 + 1)

6= 2,5

En algunas oportunidades, de manera incorrecta, se utiliza la media aritmética con datos ordinales (por ejemplo, con calificaciones dadas a los alumnos por el profesor). En tales casos, debe tenerse en cuenta que el valor obtenido es sólo aproximado, por cuanto esos puntajes indican jerarquía entre ellos, y por tanto, los intervalos entre cualquier par de números pueden ser desiguales. Esta observación tiene especial importancia cuando se hacen comparaciones entre medias aritméticas, repetimos, de nivel ordinal, respecto de las cuales el investigador que analiza los datos debe tomar las precauciones del caso. Como dijimos antes, cuando en una serie de datos hay valores extremos que pueden distorsionar la representatividad de ella (como sería el caso en la serie 3, 6, 8, 21), conviene utilizar la mediana. VARIANZA Y DESVIACIÓN ESTÁNDAR Son medidas de dispersión o de variabilidad de los datos de una serie de valores. Indican, como se dijo en la introducción de esta parte, la homogeneidad o heterogeneidad de ellos y, por tanto, la semejanza o diferencia que existe entre los individuos de un colectivo en relación con una cierta variable cuantitativa (la edad, los ingresos, etc.). Las principales de esas medidas son la varianza, la desviación estándar y el índice de dispersión. Las dos primeras deben utilizarse con variables intervales o proporcionales; el índice de dispersión se aplica a variables ordinales y nominales. La varianza es el promedio de las desviaciones elevadas al cuadrado, de cada uno de los valores de una serie respecto de la media aritmética de ella. La desviación estándar, a su vez, es la raíz cuadrada de la varianza. Las fórmulas de estas medidas son: Varianza

'2 =∑(�� − �)2

Page 30: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

Desviación estándar

� =√�2

Analicemos un ejemplo de cálculo. Se ha preguntado a seis niños el número de horas que dedican al estudio fuera de la escuela. Las respuestas son las que se indican a continuación. Calcular la varianza y la desviación estándar de esas horas:

Niño Horas de estudio x (x – ẋ) (x – ẋ)2

1 2 2 – 2,75 = –0,75 0,56

2 3 3 – 2,75 = 0,25 0,06

3 2,5 2,5 – 2,75 = –0,25 0,06

4 3 3 – 2,75 = 0,25 0,06

5 2 2 – 2,75 = –0,75 0,56

6 4 4 – 2,75 = 1,25 1,56

2,86

Para calcular la varianza y derivar de ella la desviación estándar, la tarea consiste en calcular la media aritmética de los valores de las horas:

� =(2 + 3 + 2,5 + 3 + 2 + 4)

6= 2,75

Luego se hacen las otras operaciones: Varianza: 0,48 Des, estándar: 0,69 Las desviaciones estándar de dos distribuciones de frecuencia no se pueden comparar directamente, pues dependen del tamaño de la media aritmética respectiva. Para hacerlo, hay que expresarlas como porcentajes de esas medias, las cuales, reciben el nombre de coeficientes de variación. Su fórmula de cálculo es la siguiente:

* =�

Page 31: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

Por ejemplo, supongamos que, en un cierto grupo, el promedio de las edades es de 26 años, con una desviación estándar de 3. En otro, el promedio es de 38 años, con una desviación estándar de 5. Los coeficientes de variación son respectivamente, de 3: 26 X 100 = 11.5 y 5 : 38 X 100 = 13.2. Si se hubiesen comparado directamente las desviaciones estándar, se podría haber dicho que la dispersión era mucho mayor en el segundo grupo que en el primero, pues la desviación del caso era de 5 contra 3 (1,7 veces más). En cambio, los coeficientes de variación muestran una diferencia menor (1.1 veces más). MEDIDAS DE CONCENTRACIÓN DE UNA VARIABLE Para determinar la concentración que puede tener una variable cuantitativa en un cierto colectivo, se utilizan dos medidas principales: una de ellas es el índice de Gini y la otra es la diferencia de la variable entre quintiles extremos de la distribución. ÍNDICE DE GlNI Supongamos que deseamos averiguar cuál es el grado de concentración de la educación en una población de personas de la cual conocemos los siguientes datos:

Tipo de ocupación Porcentaje respecto del total Porcentaje de personas con educación universitaria

Obreros rurales 17,0 2,5

Obreros urbanos 38,5 4,8

Agricultores 22,8 5,1

Empleados 11,8 20,9

Empresarios 7,2 26,9

Profesionales y técnicos 2,7 30,8

100.0 100.0 Para el cálculo de la concentración se usa el índice de Gini, cuya fórmula de cálculo es:

Gini = 1 – Ʃ(pi + pi–1) x (qi + qi+1) En la cual, Pi : proporciones de personas acumuladas en cada grupo (tipo de ocupado en el ejemplo). Qi proporciones acumuladas de la participación de cada grupo en la variable del caso (educación, en el ejemplo). El coeficiente varía de O a 1 (1 es la concentración máxima). Veamos un ejemplo de cálculo. (Aquí, los porcentajes se expresan en proporciones)

Page 32: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

pi qi pi–1 qi + qi+1 (pi + pi–1) x (qi + qi+1)

0,170 0,025 – – –

0,555 0,073 0,385 0,098 0,04

0,783 0,124 0,228 0,197 0,04

0,901 0,333 0,118 0,457 0,05

0,973 0,602 0,072 0,935 0,06

1,000 1,000 0,027 1,602 0,04

0,23 El índice de Gini es de 1 - 0.23 = 0.77, valor que indicaría alta concentración o desigualdad de la educación superior en el grupo estudiado (ficticio). El coeficiente de Gini es la expresión matemática de la curva de Lorenz, que resulta de representar en un eje cartesiano los porcentajes de población y de los de la variable cuya concentración se desea conocer. Esta corresponde al área que queda entre la diagonal del diagrama -diagonal que expresa una distribución perfecta- y la curva de Lorenz, que indica la distribución real observada en la población del caso. En la figura 14.1 (tomada de Sierra Bravo, pág. 481) se puede apreciar una situación como esta última.

Frecuencias acumuladas

Porcentaje acumulado población

Porcentaje acumulado universo

17,0 2,5

55,5 7,3

78,3 12,4

90,1 33,3

97,3 60,2

100,0 100,0

Page 33: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

QUINTILES Es otro procedimiento para determinar si existe o no concentración de una variable en un colectivo. Consiste en dividir en quintiles el total de la población (grupos de 20% de ella); con los valores de la variable que determinan esa división se calculan los totales de la variable que queda en cada grupo. El nivel de concentración se comprueba comparando los valores que quedan en los quintiles extremos. Como ejemplo, supongamos la siguiente situación, en relación con la escolaridad de una comunidad, con los valores de la variable que se indican en cada quintil. El total de la segunda columna resulta de multiplicar el número de personas (que en cada quintil corresponde a 20% del total) por los valores de la variable del quintil correspondiente.

Quintiles (en años) Total en años de escolaridad

Porcentaje respecto del total de año de

escolaridad Primero

1 – 2 3 – 4 96200 12,9

• • •

Quinto 15 – 16 224960 30,3 17 – 18

Total 100,0 (742960)

Las cifras utilizadas en el ejemplo muestran que mientras 20 % con menor escolaridad recibe 12.9% del total de la escolaridad que existe en toda la comunidad, 20 % del quintil más alto recibe más del doble de esa escolar: 30,3 3%. Este procedimiento puede utilizarse dividiendo la distribución en quintiles de otra variable para calcular en cada uno de ellos el total de la variable cuya concentración se desea conocer. Así se puede ver en el siguiente ejemplo que muestra la concentración de la educación superior en cada quintil de ingreso y los cambios ocurridos en dos periodos (Ministerio de Planificación de Chile, Programas Sociales: Su impacto en los hogares chilenos, 1990, pp. 62-63).

Page 34: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

Distribución comparativa 1987-1990 de la matrícula De educación superior, según quintil de ingreso per cápita

Quintil de ingreso per

cápita

1987

1990 Variación de porcentaje =

n2/n1 ni

Porcentaje n2 Porcentaje

1 12243 5,2 22709 9,1 85,5 2 19495 8,3 29605 11,9 51,9 3 40993 17,4 41869 16,8 2,1 4 63766 27,1 59883 24,1 –6,1 5 99154 42,1 94765 38,1 –4,4

Total 235651 100,0 248765 100,0 5,6 Fuente: ODEPLAN, Encuesta CASEN 1987. Departamento de planificación y Estudios sociales, MIDEPLAN, Encuesta CASEN, 1990. De acuerdo con la información que proporciona la encuesta CASEN, la matricula total de educación superior ha aumentado de 235651 alumnos en 1987 a 248831 en 1990, lo que representa un incremento promedio de 5.6 %. Si se analiza la distribución de la matrícula según el nivel de ingreso per cápita del hogar, se puede apreciar que en ambos casos la distribución es bastante heterogénea: las diferencias entre los quintiles extremos alcanzan 36.9 puntos porcentuales en 1987 y 29.0 puntos en 1990. Entre 1987 y 1990 se constatan cambios significativos en la distribución de la educación superior según quintil de ingreso. La matrícula del primer quintil aumenta de 5.6% en 1987 a 9.1 % en 1990; en el segundo, de 8.3% a 11.9 %. En el tercero, cuarto y quinto quintiles, que corresponden a los más altos ingresos, se produce una disminución que fluctúa entre menos de 1 % y 4%. Este aumento de matrícula, que se concentra fundamentalmente en los quintiles de menores ingresos, representa un incremento de 85.5% en la matrícula del primer quintil y de 51.9% en el segundo. En los quintiles de mayores ingresos, en cambio, representa una disminución en la matrícula de 6.1 % y 4.4%, respectivamente. BIBLIOGRAFÍA SELECCIONADA PARA LA QUINTA PARTE Blalock, Hubert, Estadística social, Fondo de Cultura Económica, México, 1996, segunda parte. Ferrán, Magdalena, SPSS para Windows. Programación y análisis estadístico, McGraw-Hill, Madrid, 1996, parte II: 4. Estadística descriptiva. Loether, Hermán y Donald G. MacTavish, Descriptive Statistic for Sociologists, Allyn and Bacon, Boston, 1974. Salkind, Neil, Métodos de investigación, Prentice Hall, México, 1999, cap 7

Page 35: Guillermo Briones. Metodos y Tecnicas de Investigacion Para Las Ciencas Sociales 2

EJERCICIO 5 (AUTOEVALUACIÓN) 1. ¿Cuáles son las principales funciones que cumplen las razones, proporciones, porcentajes y tasas en el análisis de datos? 2. ¿En qué casos es conveniente utilizar una proporción en lugar de una razón, al tratar la distribución de casos entre las categorías de una variable cualitativa? 3. ¿Qué dice la regla de Zeisel? 4. ¿Cuáles son los métodos más utilizados para determinar una tendencia en una serie de tiempo? 5. Calcule los efectos de las variables "antigüedad en el cargo" y "autoestima profesional" en el siguiente cuadro que corresponde a 208 empleados en una empresa.

Antigüedad (años)

Autoestima Alta Mediana Baja

15 – 20 15 20 25 19 – 14 32 30 15

13 y menos 28 25 18 6. En la población del ejercicio anterior, se tiene la siguiente información sobre porcentajes de educación superior en cada grupo de antigüedad

15 – 20 20 % 19 – 14 35 % 13 y menos 45 %

7. Calcule en esa población, mediante el índice de Gini, el grado de concentración de la educación superior. Comente el resultado.