15
202 [289] 13 Escalas y escalamiento Este capítulo aborda la construcción y utilización de escalas. Haré foco en cuatro tipos: (a) índices, (b) escalas Guttman, (c) escalas Likert, y (d) escalas de diferencial semántico. Existen otros tipos de escalas (escalas Thurstone, escalas de magnitud directa), pero las cuatro listadas inicialmente son las más usadas en la investigación social actual, particularmente en antropología. Primero, sin embargo, consideremos algunos conceptos básicos sobre escalamiento. Escalas con indicadores únicos Una escala es un artificio que sirve para asignar unidades de análisis a las categorías de una variable. La asignación es ordinariamente hecha con números, y las preguntas son muy usadas como dispositivos de escalamiento. He aquí tres preguntas típicas de escalas: [290] 1. “¿Cuántos años tiene?” Puede usar esta pregunta para asignar individuos a una categoría de la variable “edad.” Dicho de otro modo, puede escalar a la gente según edad. El guarismo que produce esta pregunta tiene propiedades de razón (alguien que tiene 50 años es dos veces mayor que uno de 25). 2. “¿Cuán satisfecho está con las clases recibidas este semestre? ¿Está satisfecho, neutral o insatisfecho?” Puede usar esta pregunta para asignar alumnos a una de las tres categorías de la variable “satisfecho” Es decir, puede escalarlos de acuerdo con el grado de satisfacción con sus clases. Consideremos satisfecho = 3, neutral = 2, e insatisfecho = 1. Entonces, alguien a quien se le asigna el número 3 está más satisfecho que uno a quien se le asigna el número 1. No sabemos si eso significa el triple de satisfacción, o 10 veces, o tan sólo levemente más satisfecho, por lo que este reactivo produce números que exhiben propiedades ordinales. 3. “¿Cómo se considera a sí mismo: heterosexual, bisexual, homosexual o asexual?” Este ítem de escalamiento permite asignar individuos a (escalarlos por medio de) categorías de la variable “orientación sexual.” Sea heterosexual = 1, bisexual = 2, homosexual = 3, y asexual = 4. Los números producidos por este dispositivo tienen propiedades nominales. No podría sumarlas y así obtener el “promedio de orientación sexual.” 1 Estas tres preguntas tienen diferentes contenidos (refieren a distintos conceptos) y producen números con propiedades distintas, pero comparten dos propiedades muy importantes. Las tres preguntas son dispositivos (artificios, reactivos) que permiten escalar a la gente, y en los tres casos el informante es la fuente principal de error. 1 Sí podría resumir los resultados usando proporciones o porcentajes, e identificar la categoría más frecuente (la moda). (N. del T.)

17 Cap 13 Escalas

Embed Size (px)

DESCRIPTION

ESCALAS

Citation preview

Page 1: 17 Cap 13 Escalas

202

[289]

13

Escalas y escalamiento

Este capítulo aborda la construcción y utilización de escalas. Haré foco en cuatro tipos: (a) índices, (b) escalas Guttman, (c) escalas Likert, y (d) escalas de diferencial semántico. Existen otros tipos de escalas (escalas Thurstone, escalas de magnitud directa), pero las cuatro listadas inicialmente son las más usadas en la investigación social actual, particularmente en antropología. Primero, sin embargo, consideremos algunos conceptos básicos sobre escalamiento.

Escalas con indicadores únicos Una escala es un artificio que sirve para asignar unidades de análisis a las categorías de una

variable. La asignación es ordinariamente hecha con números, y las preguntas son muy usadas como dispositivos de escalamiento. He aquí tres preguntas típicas de escalas: [290]

1. “¿Cuántos años tiene?”

Puede usar esta pregunta para asignar individuos a una categoría de la variable “edad.” Dicho de otro modo, puede escalar a la gente según edad. El guarismo que produce esta pregunta tiene propiedades de razón (alguien que tiene 50 años es dos veces mayor que uno de 25).

2. “¿Cuán satisfecho está con las clases recibidas este semestre? ¿Está satisfecho, neutral o insatisfecho?”

Puede usar esta pregunta para asignar alumnos a una de las tres categorías de la variable “satisfecho” Es decir, puede escalarlos de acuerdo con el grado de satisfacción con sus clases. Consideremos satisfecho = 3, neutral = 2, e insatisfecho = 1. Entonces, alguien a quien se le asigna el número 3 está más satisfecho que uno a quien se le asigna el número 1. No sabemos si eso significa el triple de satisfacción, o 10 veces, o tan sólo levemente más satisfecho, por lo que este reactivo produce números que exhiben propiedades ordinales.

3. “¿Cómo se considera a sí mismo: heterosexual, bisexual, homosexual o asexual?”

Este ítem de escalamiento permite asignar individuos a (escalarlos por medio de) categorías de la variable “orientación sexual.” Sea heterosexual = 1, bisexual = 2, homosexual = 3, y asexual = 4. Los números producidos por este dispositivo tienen propiedades nominales. No podría sumarlas y así obtener el “promedio de orientación sexual.”1

Estas tres preguntas tienen diferentes contenidos (refieren a distintos conceptos) y producen números con propiedades distintas, pero comparten dos propiedades muy importantes. Las tres preguntas son dispositivos (artificios, reactivos) que permiten escalar a la gente, y en los tres casos el informante es la fuente principal de error.

1 Sí podría resumir los resultados usando proporciones o porcentajes, e identificar la categoría más frecuente (la moda). (N. del T.)

Page 2: 17 Cap 13 Escalas

Escalas y escalamiento

203

Las unidades de análisis pueden ser miembros de las Girls Scout o casos judiciales o culturas, y la principal fuente de error de medición puede ser Ud. mismo. Si hace una encuesta y asigna personas por observación a la categoría de “varón” o “mujer”, entonces Ud. es la principal fuente de error de medición, y lo mismo ocurriría si estuviera escalando culturas.

Suponga que dispone de una lista de 100 culturas y su tarea consiste en asignar a cada una un número que significa que la forma predominante de residencia postmatrimonial es patrilocal, matrilocal, neolocal, bilocal, etc. Para cada cultura dispone de una etnografía – un estante con 100 libros. Ud. lee cada libro, busca indicios sobre residencia postmatrimonial, y asigna un número (1, 2, 3, etc.) a [291] cada cultura. Es este caso, cada cultura es una unidad de análisis y es escalada en una variable nominal llamada “residencia postmatrimonial”.

Escalas con indicadores múltiples Puede ver que incluso una sola pregunta de un cuestionario funciona como una escala si le permite asignar a las personas (o grupos, u objetos o artefactos) que está estudiando a categorías de una variable. El problema es que muchas de las variables más interesantes en ciencias sociales son complejas y no pueden ser evaluadas fácilmente con indicadores únicos. Tratamos de medir variables complejas con instrumentos complejos – es decir, instrumentos compuestos con varios indicadores.

A estos instrumentos los llamamos ordinariamente escalas. Un concepto clásico en ciencia social es el de estatus socioeconómico [en inglés, socioeconomic status o SES]. Se estima combinando medidas de ingreso, educación y prestigio ocupacional. Cada una de estas medidas es una operacionalización del concepto de SES, pero ninguna de estas medidas, por sí misma, capta la complejidad de la idea de estatus socioeconómico. Cada indicador capta un aspecto del concepto y los indicadores en conjunto producen una única medición de SES.

Ahora bien, aplicando la navaja de Ockham,2 no deberíamos usar una escala compleja para medir algo cuando sea posible hacerlo con una escala simple. Suponga que formula a la gente algunas preguntas diseñadas para saber qué siente a medida que se hace grande. Si solamente su ingreso predice sus respuestas a las preguntas sobre actitud al hacerse grande, entonces no hay razón para elaborar una escala más compleja. Ordinariamente, no obstante, una medida compleja del SES predice mejor actitudes que indicadores simples.

Luego, repetimos: la función de medidas de indicador simple es asignar unidades de análisis a categorías de una variable. La función de medidas compuestas (escalas complejas) es exactamente la misma, pero se usan cuando los indicadores simples no funcionan.

Índices La medida compuesta más sencilla es el índice acumulativo. Es elaborado con varios ítems, que valen lo mismo. Los exámenes de opción múltiple son índices acumulativos. La idea es que la respuesta a una sola pregunta sobre el material de curso no sería un buen indicador del conocimiento que los alumnos tienen sobre dicho contenido. En cambio, se suele examinar a los alumnos con 50, 60 o más preguntas de opción múltiple.

Tomadas en conjunto, sigue el razonamiento, todas las preguntas miden el grado de dominio del material estudiado logrado por un estudiante. Si rinde una prueba compuesta por 60 [292] preguntas de opción múltiple y obtiene 45 correctas, suma 45 puntos, 1 por cada respuesta correcta. Tal número, 45 (o 75%), es un índice acumulativo de sus resultados en la prueba.

2 Guillermo de Ockham (c. 1285-c. 1349), filósofo inglés y teólogo escolástico, considerado el mayor representante de la escuela nominalista, la más consistente y directa rival de las escuelas tomista y escotista. Su nombre se atribuye al principio de economía en lógica formal, conocido como ‘la navaja de Ockham’, según la cual las entidades no tienen que ser multiplicadas sin necesidad. (Biblioteca de Consulta Microsoft ® Encarta ® 2005.)

Page 3: 17 Cap 13 Escalas

MÉTODOS DE INVESTIGACIÓN EN ANTROPOLOGÍA 204

Fíjese que en un índice acumulativo no cuenta cuáles ítems hayan sido sumados. En una prueba de 6 preguntas, por ejemplo, hay 6 formas correctas de conseguir un 1, pero hay 15 maneras de conseguir 2 respuestas correctas, 20 para conseguir 3, y así siguiendo. Los estudiantes pueden obtener el mismo puntaje de 80% en un test de 100 preguntas y haberse equivocado en conjuntos enteramente distintos de 20 preguntas. Por otro lado, esto vuelve robustos a los índices acumulativos; ofrecen muchas oportunidades de medir una variable subyacente o latente (en el caso de un examen, la variable subyacente es competencia.) Por otro lado, en ello también radica la debilidad de los índices acumulativos. Veamos por qué.

Suponga que estudia la aculturación entre los indígenas bolivianos. Si piensa que los indios que hablan castellano están más aculturados que aquellos que no lo hacen, les asignará un punto por hablar la lengua dominante. Si piensa que los indios que usan ropas de estilo occidental están más aculturados que lo que visten trajes tradicionales, les asignará otro punto en aculturación.

Si piensa que los indios que viven en casas modernas están más aculturados que aquellos que habitan casas tradicionales, les dará un punto más. Puede elaborar índices con variables observables (como observar el tipo de vestimenta que usa la gente o si hablan una lengua determinada), o con variables actitudinales (del tipo preguntar a la gente si están de acuerdo o en desacuerdo con una proposición).

Sólo enhebrar una serie de ítems para formar un índice, sin embargo, no implica que la medida compuesta sea útil, del mismo modo que agrupar una serie de preguntas de opción múltiple no es garantía de que un alumno sea evaluado equitativamente sobre su conocimiento de antropología. ¿Es un indio que viste ropa occidental y vive en una casa de tipo occidental pero no habla castellano, más o menos aculturado que otro que habla castellano y usa ropa occidental pero habita en una casa tradicional? Una forma de poder resolver este problema es ver si los datos forman una escala Guttman.

Escalas Guttman En una escala Guttman, en comparación con un índice acumulativo, las mediciones de los ítems exhiben patrones distintos. A fin de entender el patrón que estamos buscando, considere las tres preguntas siguientes. [293]

1. ¿Cuánto es 124 más 14?

2. ¿Cuánto es 1/2 + 1/3 + 1/5 + 2/11?

3. Si 3x = 133, ¿cuánto vale x?

Si conoce la respuesta a la pregunta 3, probablemente sepa las respuestas a las preguntas 1 y 2. Si responde correctamente a la pregunta 2, pero no a la 3, es razonable suponer que conoce la respuesta a la pregunta 1.

De igual modo, si todos los informantes en un pueblo boliviano que habitan casas modernas también hablan castellano y visten ropas occidentales, sólo tiene que determinar el tipo de casa de un informante indio y llenar los datos para las otras dos variables. La Tabla 13.1 registra visualmente el patrón de datos de 16 informantes en los tres ítems del hipotético índice de aculturación.

Los datos de los primeros 12 informantes en la Tabla 13.1 forman una escala perfecta. Los informantes 1, 2, 3, y 4 exhiben puntajes positivos en los tres ítems. Los tres informantes siguientes hablan castellano y visten ropas de estilo occidental pero viven en [294] casas tradicionales. Los tres siguientes visten ropas occidentales pero sólo hablan su lengua indígena y viven en casas tradicionales. Los informantes 11 y 12 son totalmente no aculturados de acuerdo con este índice: usan ropas tradicionales, hablan solamente su lengua indígena y viven en casas tradicionales.

Considerando estos datos, resulta evidente que vivir en una casa de estilo occidental es el ítem más difícil de lograr en el índice. Al tiempo en que alguien pueda estar en condiciones de construir

Page 4: 17 Cap 13 Escalas

Escalas y escalamiento

205

tal vivienda, ya debe hablar castellano y vestir ropas occidentales. Por el contrario, resulta más fácil que alguien adopte ropas occidentales sin hablar castellano o vivir en una casa estilo occidental.

TABLA 13.1 Un ejemplo de índice que escala con un

coeficiente de reproductibilidad de Guttman mayor que 0,90

Informante Casa de tipo

occidental Habla castellano Ropas de estilo

occidental 1 + + + 2 + + + 3 + + + 4 + + + 5 – + + 6 – + + 7 – + + 8 – – + 9 – – + 10 – – + 11 – – – 12 – – – 13 – + (–) error 14 – + (–) error 15 + + (–) error 16 + + (–) error

NOTA: un ejemplo de un índice que escala con un coeficiente de reproductibilidad de Guttman mayor de 0,90. Hay 4 errores de escalamiento de 48 entradas posibles (16 informantes x 3 ítems del índice = 48). El coeficiente de reproductibilidad es de 0,92 (1 – 4 / 48 = 0,92).

Hay cuatro informantes que rompen con la norma. Los informantes 13 y 14 habla castellano pero usan trajes tradicionales y habitan en casas tradicionales. Podría ser que hayan aprendido castellano en los mercados pero por lo demás lleven una vida no aculturada. Los informantes 15 y 16 son ricos; viven en casas modernas y hablan castellano pero usan vestimenta tradicional. Podría ser que hayan conseguido suficiente riqueza como para edificar casas modernas pero desean marcar su procedencia étnica usando ropas tradicionales.

Cualesquiera sean las razones, los informantes 13, 14, 15, y 16 no se acomodan al patrón exhibido en la mayoría de los casos. Estos informantes causan “errores” en el sentido de que sus datos disminuyen el grado en que el índice de aculturación formaría una escala perfecta. Ud. puede testar la cercanía de un conjunto de datos de un índice a la reproducción de una escala perfecta aplicando el coeficiente de reproductibilidad de Guttman, o CR.

1 – (Nº errores / Nº entradas)

Dado el patrón de la Tabla 13.1, no esperamos ver esos signos menos en la columna 3 para los informantes 13, 14, 15, y 16, de modo que los contamos como errores al intentar reproducir una escala perfecta. Para la Tabla 13.1 el CR es

1 – (4 / 48) = 0,92

Lo que significa que los datos están a un 8% de ser una escala perfecta. Por convención, un coeficiente de reproductibilidad de 0,90 o mayor es aceptado como una aproximación estadísticamente significativa a una escala perfecta (Guttman, 1950).

Cómo testar una escala Guttman

Robert Carneiro (1962, 1970) tuvo la idea de que la evolución cultural es ordenada y acumulativa. Si Carneiro estuviera en lo cierto, las culturas evolucionarían añadiendo ciertos rasgos

Page 5: 17 Cap 13 Escalas

MÉTODOS DE INVESTIGACIÓN EN ANTROPOLOGÍA 206

de modo ordenado y deberían mostrar un patrón semejante a una escala Guttman. Carneiro codificó 354 rasgos de 100 culturas e inspeccionó los datos en busca de patrones. Aquí sigue una muestra de 12 sociedades y 11 rasgos. [295]

TABLA 13.2(a) Matriz de Carneiro mostrando la presencia (+) o ausencia (–)

de 11 rasgos culturales en 12 sociedades. El orden es aleatorio tanto para rasgos como para sociedades

El líder político dispone de considerable autoridad + + – – + – – + – + – – Leyes para regular lo superfluo – – – – + – – + – – – – Cacique, jefe o rey + + – – + + + + – + + + Superávit de alimentos producidos regularmente + + – – + – – + – + – + Comercio entre las comunidades + + – + + + + + – + + + El gobernante concede audiencias – + – – + – – + – + – – Profesionales religiosos especializados + + – + + + + + + + + + Calles asfaltadas – – – – – – – + – – – – Agricultura de subsistencia del 75% o más + + – – + – + + – + – + Especialistas en servicios con dedicación full time – + – – + – – + – – – – Asentamientos de 100 o más personas + + – – + + + + – + – + Iroqueses

Marquesanos

Tasm

anianos

Yahganes

Dahom

ey

Mundurucú

Ao N

aga

Inca

Sem

ang

Tanala

Vedda

Bontoc

FUENTE: Carneiro R. C. (1970), Análisis escalar, secuencias evolutivas y la calificación de culturas. En R. Naroll y R. Cohen (Eds.). A handbook of method in cultural anthropology, p. 830. Reimpreso con permiso de Doubleday, una división de Bantam, Doubleday, Dell Publishing Group, Inc.

TABLA 13.2(b) Datos reacomodados de la TABLA 13.2(a).

Los datos forman una escala Guttman perfecta

Calles asfaltadas – – – – – – – – – – – + Leyes para regular lo superfluo – – – – – – – – – – + + Especialistas en servicios con dedicación full time – – – – – – – – – + + + El gobernante concede audiencias – – – – – – – – + + + + El líder político dispone de considerable autoridad – – – – – – – + + + + + Superávit de alimentos producidos regularmente – – – – – – + + + + + + Agricultura de subsistencia del 75% o más – – – – – + + + + + + + Asentamientos de 100 o más personas – – – – + + + + + + + + Cacique, jefe o rey – – – + + + + + + + + + Comercio entre las comunidades – – + + + + + + + + + + Profesionales religiosos especializados + + + + + + + + + + + + T

asmanianos

Sem

ang

Yahganes

Vedda

Mundurucú

Ao N

aga

Bontoc

Iroqueses

Tanala

Marquesanos

Dahom

ey

Inca

FUENTE: Carneiro R. C. (1970), Scale analysis, evolutionary sequences, and the rating of Cultures, en R. Naroll y R. Cohen (Eds.), A handbook of method in cultural anthropology, p. 830. Reimpreso con permiso de Doubleday, una división de Bantam, Doubleday, Dell Publishing Group, Inc. [296]

Cuando recopila datos sobre casos, no sabe qué patrón (si lo hubiera) emergerá de los mismos, por cuanto sea cuidadoso al hacerlo y codifíquelos en orden aleatorio. Las 12 sociedades y rasgos de la Tabla 13.2(a) están arregladas en orden aleatorio.

Lo primero que hay que hacer es ordenar los signos más y menos en su “mejor” orden posible – el orden que conforma de modo más perfecto la escala – y calcular el CR. Buscamos el rasgo que

Page 6: 17 Cap 13 Escalas

Escalas y escalamiento

207

ocurre con mayor frecuencia (aquel que tiene más signos positivos a lo largo de la fila) y lo colocamos al final de la matriz. El rasgo que ocurre con la frecuencia máxima es la existencia de profesionales religiosos especializados. Luego buscamos el siguiente rasgo más frecuente y lo ponemos en la penúltima fila de la matriz.

Seguimos así hasta reacomodar los datos de forma más adecuada, cualquiera sea el patrón subyacente en la matriz. En la Tabla 13.2(b) se muestra el mejor arreglo de los signos más y menos. Ahora podemos contar los “errores” en la matriz y calcular el coeficiente de reproductibilidad de Guttman. Para estas 12 sociedades y 11 rasgos, el coeficiente es un perfecto 1,0.

Por supuesto, es algo excepcional encontrar este patrón en una matriz de 12 sociedades y 11 rasgos. Carneiro, Ud. recordará, codificó 100 sociedades en 354 rasgos y luego fue viendo subgrupos que mostraban el patrón deseado en los datos. Cuando Carneiro hizo esto en la década de los 1960, fue un trabajador heroico. Hoy en día, ANTHROPAC (Borgatti, 1992a) dispone de una rutina para explorar grandes matrices de signos más y menos, reordenar las entradas para lograr el mejor patrón, calcular el CR, y mostrar cuáles unidades de análisis y rasgos resultan en orden para obtener la solución óptima del problema.

De Walt (1979) usó el escalamiento Guttman para testar su índice de estilo de vida material en una comunidad agraria mexicana. Calificó 54 informantes en lo referido a su posesión de 8 ítems materiales (una radio, una cocina, una máquina de coser, etc.) y obtuvo un notable CR de 0,95. Esto significa que, para sus datos, el índice de estilo de vida material es altamente fiable y marca la diferencia entre los informantes.

Debe controlar la escalabilidad Guttman de un índice cada vez que lo use en una población. Mi sospecha es que la escala de De Walt sobre el estilo material de vida tiene su análogo en casi todas las sociedades. El particular listado de ítems de De Walt usado en México puede que no escale en un pueblo de Camerún, pero alguna lista de ítems materiales escalará también allí. Sólo tiene que encontrarlos.

El modo de hacerlo es codificar en cada vivienda la presencia o ausencia de ítems materiales anotados en una lista de chequeo. El detalle de la lista emergerá de la observación participante y de entrevistas informales. Luego use un programa como ANTHROPAC para clasificar la matriz, descartar algunos ítems materiales, y elaborar el índice material que tenga un CR de 0,90 o mejor. [297]

Índices que no escalan

Aún cuando los índices no escalen pueden servir para comparar poblaciones. Dennis Werner (1985) estudió el estrés psicosomático entre granjeros brasileños que enfrentaban la incertidumbre de que sus tierras quedaran anegadas por el agua de una gran represa. Usó un índice de estrés de 20 ítems desarrollado por Berry (1976).

Puesto que su índice no constituye una escala, Werner no pudo diferenciar entre sus informantes (en términos del nivel de estrés que sufrían) con tanta precisión como De Walt pudo diferenciar entre sus informantes (en cuanto a su calidad de vida). Pero los agricultores de la muestra de Werner dieron una respuesta de estrés a un promedio de 9,13 preguntas en una prueba de 20 ítems, mientras que Berry encontró que los granjeros canadienses daban respuestas de estrés en un promedio de 1,79 preguntas. Es muy improbable que una diferencia de tal magnitud entre dos poblaciones ocurra por mero azar.

Unidimensionalidad

Si los ítems de un índice acumulativo de una escala Guttman alcanzan un CR de 0,90 o mejor, podemos decir que, para la muestra testada, el concepto medido por el índice es unidimensional. Es decir, los ítems son una medición combinada de uno, y sólo un concepto subyacente. El índice de Carneiro muestra que, para las 12 culturas estudiadas, la evolución cultural es un concepto unidimensional (al menos para la operacionalización de indicadores elegidos por Carneiro). Los

Page 7: 17 Cap 13 Escalas

MÉTODOS DE INVESTIGACIÓN EN ANTROPOLOGÍA 208

datos de De Walt muestran que, para los informantes por él estudiados, el concepto de “estilo material de vida” es unidimensional (al menos para los indicadores por él usados).

Quiero dejar absolutamente claro que la unidimensionalidad de un índice depende de la muestra. La técnica de Guttman es un modo de testar si se sostiene la unidimensionalidad para un conjunto particular de datos.

Escalas Likert Puede que la forma más común de escalamiento es la atribuida a Renis Likert (1932). Likert introdujo la popular escala de 5 puntos de la cual ya hemos hablado en el Capítulo 12 sobre la elaboración de cuestionario. Recuerde que una pregunta típica podría ser la siguiente: “Por favor, considere las siguientes afirmaciones atentamente. Luego, para cada afirmación, haga un círculo alrededor de la respuesta que mejor refleje su opinión. ¿Diría Ud. que acuerda mucho o que acuerda poco, es neutral, desacuerda un poco o está muy en desacuerdo con cada afirmación?” [298]

La escala de 5 puntos puede transformarse en una de 3 puntos o de 7 puntos, y la escala de acuerdo-desacuerdo puede volverse apruebo-desapruebo, estoy a favor-en contra, o excelente- malo, pero el principio es el mismo. Todas son escalas Likert.

Likert hizo algo más además de introducir este formato. Estaba interesado en medir estados interiores de la gente: actitudes, emociones y orientaciones, y se dio cuenta de que la mayoría de los estados interiores son multidimensionales. Quería encontrar una forma de separar las distintas dimensiones. “Orientación política,” por ejemplo, de ningún modo es unidimensional. Tiene una dimensión económica, una dimensión asociada a la política nacional, una dimensión ligada a la política externa y lo que podríamos llamar una dimensión de “conducta personal”.

Una persona que se asume como liberal en materias fiscales en política interna (a favor de una salud pública gestionada por el gobierno, por ejemplo) puede ser bastante conservador en asuntos de política exterior (en contra de acciones militares en el extranjero prácticamente bajo ninguna circunstancia). Alguien progresista en política exterior (a favor de ayuda económica para las democracias que lo soliciten) puede ser bastante conservador en asuntos de conducta personal (en contra de igualdad de derechos para los homosexuales).

Además, incluso una dimensión latente como “actitud en asuntos de conducta personal” resulta complicada. No podríamos asignar gente a una categoría de esta variable haciendo una sola pregunta. Tendríamos que preguntar cuál es la preferencia en asuntos sexuales, o sobre el aborto, o sobre el divorcio, o sobre sexo extramatrimonial. Tomando todos juntos, estos indicadores podrían ser una mejor medida de la variable “actitud hacia asuntos de conducta personal.”

Por cierto, existen tendencias y efectos de empaquetamiento [responder ‘en paquete’]. Es probable que gente conservadora en una dimensión de orientación política sea conservadora en otras dimensiones, y la gente liberal en un tipo de conducta personal es probable que sea liberal en otras. Aún así, una única pregunta nunca permitiría escalar a la gente en general a lo largo de una variable tan compleja como “actitud hacia conducta personal,” para no hablar de “orientación política.”

Pasos para elaborar una escala Likert El método propuesto por Likert consistía en reunir una larga lista de posibles ítems de escala para un concepto e identificar los subconjuntos que mejor midieran las distintas dimensiones. Si el concepto resultara ser unidimensional, entonces un subconjunto podría medirlo. Si fuera multidimensional, entonces se requerirían varios subconjuntos. Aquí se enuncian los pasos a seguir para elaborar y testar una escala Likert.

1. Identificar y adoptar un apelativo para la variable que desea medir. Esto es hecho generalmente por inducción de nuestra propia experiencia (Spector, 1992:13). Luego de convivir un tiempo en una comunidad, desarrollará algunas ideas sobre las [299] variables que desea medir.

Page 8: 17 Cap 13 Escalas

Escalas y escalamiento

209

Puede llamarle la atención la opinión de sus informantes respecto de que “la gente tiene miedo al crimen” y por ello decidir escalar gente respecto de la variable “miedo al crimen”.

Podrá observar que algunas personas parecieran ser muy modernas mientras que otras se mostrarán muy tradicionales. La tareas consistirá, entonces, en escalar (medir) a la gente en la variable de “tradicionalismo” con toda su multidimensionalidad. (El otro modo de proceder consiste en identificar variables por deducción. Esto generalmente implica el análisis de matrices de similitud, sobre lo que hablaremos más en el Capítulo 19.)

2. Escriba una larga lista de preguntas o afirmaciones indicadoras. Este es otro ejercicio inductivo. Ideas sobre indicadores pueden proceder de la etnografía, de leer periódicos, o de entrevistas hechas a informantes expertos.

También pueden proceder de un ejercicio de asociación de ideas. Si desea construir una escala para el concepto de “actitudes hacia el envejecimiento”, podría comenzar preguntando a un grupo grande de gente que “enumeren cosas que asocian con el envejecimiento”. Podría entonces elaborar preguntas o afirmaciones en una escala Likert tomando ítems de la lista.

Si ha estado hacienda etnografía en una comunidad por unos meses, tendrá gran cantidad de intuiciones que guíen su redacción de ítems para una escala Likert. Asegúrese de usar indicadores tanto positivos como negativos. Si tuviera una afirmación del tipo “La vida en Xakalornga se ha mejorado desde la llegada de los misioneros”, entonces necesita una frase expresada negativamente para balancear, del tipo “Los misioneros han originado muchos problemas en nuestra comunidad”.

Y no tome ítems indicadores en los extremos. Este es un ítem mal redactado: “la llegada de los misioneros es el acontecimiento más terrible que jamás haya ocurrido aquí”. La idea es permitir que sus informantes le digan dónde se posicionarían ofreciéndoles un rango de elecciones de respuesta (fuertemente de acuerdo – fuertemente en desacuerdo). No fuerce a los informantes con ítems tan extremos que se sientan obligados a reducir la intensidad de sus respuestas.

Al redactar ítems, se aplican todas las precauciones señaladas en el Capítulo 12 sobre diseño de cuestionario: tenga presente quiénes son sus informantes y use su lenguaje. Redacte los ítems del modo más breve y sencillo posible. No use doble negativos. No use ítems con doble sentido. “La gente debería hablar español y olvidar su lengua materna” es un ítem deplorable. Un informante puede acordar con ambas partes, o acordar con una y estar en desacuerdo con la otra.

Una vez hecho esto, debería contar con cuatro o cinco veces el número de ítems que crea necesarios en su escala definitiva. Si desea una escala de, digamos, 6 ítems, use 25 o 30 en la prueba preliminar (DeVellis, 1991:57).

3. Determine el tipo y número de categorías de respuesta. Algunas categorías de respuesta muy usadas son de acuerdo-en desacuerdo, a favor-en contra, útil-inútil, [300] muchos-ninguno, me gusta-no me gusta, verdadero-falso, adecuado-inadecuado, siempre-nunca, y así por el estilo. La mayoría de los ítems de escalas Likert ofrecen un número impar de opciones de respuesta: tres, cinco, o siete. La idea es ofrecer a la gente un rango de respuestas que incluya un punto medio. El punto medio ordinariamente conlleva la idea de neutralidad – ni de acuerdo ni en desacuerdo, por ejemplo. Un número par de opciones de respuesta fuerza a los informantes a “tomar posición”, mientras que un número impar de opciones de respuesta permite a los informantes a “abstenerse”. No existe un formato que sea el mejor. La elección de un formato u otro tiene sus propias consecuencias.

4. Pruebe su conjunto de ítems en algunos informantes. Idealmente, necesitaría al menos unos 100 sujetos para poder probar un conjunto inicial de ítems. De hecho, los antropólogos que trabajan en comunidades rurales ordinariamente hacen la prueba con 20 o 30 respondientes, pero este número no es ciertamente el ideal ya que no puede estar seguro de haber incluido el rango completo de respuestas con un número tan reducido de informantes.

Si trabaja en un área urbana y si se lo permiten sus recursos, asegúrese 100 o incluso 200 respondientes para la prueba piloto inicial (Spector, 1992:29). Esto asegurará captar la variación completa en las respuestas a todos los ítems. Si pudiera seleccionar entre 100 y 200 respondientes

Page 9: 17 Cap 13 Escalas

MÉTODOS DE INVESTIGACIÓN EN ANTROPOLOGÍA 210

al azar, esto también asegurará que la variabilidad de respuesta representa la variabilidad en general de la población en la cual finalmente aplicará su escala.

5. Realice un análisis de ítems para identificar aquellos que conformen una escala

unidimensional de la variable que trata de medir.

6. Use la escala en su estudio y vuelva a hacer un análisis de ítems para asegurarse de que la

escala funciona bien. Si así fuere, puede continuar estudiando relaciones entre los puntajes obtenidos en la escala y otras variables asociadas a las personas de su estudio.

Análisis de ítems Aquí radica la clave para hacer escalas. El propósito consiste en detectar, entre todos los ítems que está probando, aquellos que debe conservar y cuáles debe desechar. El conjunto de ítems que le permitan medir una única dimensión social o psicológica. Dicho de otro modo, la escala debe ser unidimensional.

A continuación, recorreremos la lógica de la construcción de escalas unidimensionales. Lea estas páginas cuidadosamente. Al final de esta sección, abogo por el uso del análisis factorial para hacer análisis de ítem de modo rápido, sencillo y fiable. No obstante, carece de sentido usar análisis factorial para la construcción de una escala si no comprende la lógica de construcción. [301]

Hay que dar tres pasos para realizar un análisis de ítems e identificar el subconjunto que constituye una escala unidimensional: (a) puntuar los ítems, (b) obtener la correlación interítem, y (c) obtener la correlación ítem-total.

1. Puntuar las respuestas

Lo primero que hay que hacer es asegurar que todos los ítems han sido puntuados correctamente. Suponga que tratamos de encontrar ítems para una escala que mida la fuerza a favor de un entrenamiento formal en métodos de investigación para estudiantes de antropología. Aquí siguen dos ítems potenciales para la escala: Debería ser obligatorio el entrenamiento en estadística de todos los estudiantes de antropología.

1 2 3 4 5 Fuertemente en

desacuerdo En desacuerdo Neutral De acuerdo Fuertemente de

acuerdo Los antropólogos no necesitan entrenamiento en estadística.

1 2 3 4 5 Fuertemente en

desacuerdo En desacuerdo Neutral De acuerdo Fuertemente de

acuerdo

Cuando puntúe las respuestas de sus informantes, debe recordar que un 1 en el primer ítem es un 5 en el segundo, y viceversa. Aquellos informantes que hagan un círculo en “fuertemente de acuerdo” en el primer ítem recibirán un 5 por tal ítem. Los informantes que hagan un círculo en “fuertemente de acuerdo” en el segundo ítem recibirán un 1. Podrá permitir que los valores altos y bajos sigan la dirección que desee, pero debe ser consistente. En este caso, he decidido adoptar el criterio de que los valores altos (4 y 5) representen apoyo al entrenamiento formal en métodos de investigación y los números bajos (1 y 2) representen falta de apoyo a este concepto.

2. Calcular la correlación interítem y el coeficiente Alfa de Cronbach

Luego, compruebe cuáles ítems contribuyen a medir el constructo que está tratando de estimar y cuáles no lo hacen. Esto exige dos tipos de cálculos: la intercorrelación de los ítems y la correlación de los puntajes de los ítems con el puntaje total para cada informante. A continuación siguen los puntajes de tres respondientes en tres ítems, en ítems puntuados de 1 a 5. [302]

Page 10: 17 Cap 13 Escalas

Escalas y escalamiento

211

ítem 1 ítem 2 ítem 3 persona 1 1 3 5 persona 2 5 2 2 persona 3 4 1 3

Para obtener la correlación interítem, debemos considerar todos los pares de columnas. Existen tres posibles pares de columnas para una matriz de tres ítems:

ítem 1 ítem 2 ítem 1 ítem 3 ítem 2 ítem 3 1 3 1 5 3 5 5 2 5 2 2 2 4 1 4 3 1 3

Una medida simple de la medida en que estos pares de números son iguales o distintos consiste en sumar sus diferencias. En el primer par, la diferencia entre 1 y 3 es 2; la diferencia entre 5 y 2 es 3; la diferencia entre 4 y 1 es 3. La suma de las diferencias es 2 + 3 + 3 = 8. Para cada ítem, puede haber como máximo 4 puntos de diferencia – por ejemplo, alguien podría haber respondido 1 al ítem 1 y 5 al ítem 2.

Para tres ítems, la diferencia total posible sería 4 × 3 = 12. La diferencia efectiva es 8/12 = 0,67, lo que significa que estos dos ítems son 0,33 iguales. Ítems 1 y 3 también son 0,33 iguales, y lo ítems 2 y 3 are 0,67 iguales.

Los ítems que miden el mismo constructo subyacente deben estar relacionados entre sí. Si respondo “fuertemente de acuerdo” a la afirmación “Debería ser obligatorio el entrenamiento en estadística de todos los estudiantes de antropología”, entonces (si fuera consistente en mi actitud y los ítems que buscan medir mi actitud estuvieran correctamente redactados) debería estar en fuerte desacuerdo con la afirmación “Los antropólogos no necesitan entrenamiento en estadística.” Si cada uno que responde “fuertemente de acuerdo” a la primera afirmación y responde “fuertemente en desacuerdo” a la segunda, entonces los ítems están perfectamente correlacionados.

El alfa de Cronbach es una prueba estadística para estimar cuánto correlacionan los ítems de una escala entre sí. Uno de los métodos para probar la unidimensionalidad de una escala es la denominada prueba de fiabilidad de partición por mitades. Si una escala de, digamos, 10 ítems, fuera unidimensional, todos los ítems deberían medir aspectos del mismo concepto subyacente. En tal caso 5 ítems cualesquiera deberían producir puntajes más o menos parecidos a los puntajes de otros 5 ítems. Así, sería:

puntaje en ítems 1-5 puntaje en ítems 6-10 persona 1 X1 Y1 persona 2 X2 Y2 persona 3 X3 Y3 . . . persona n Xn Yn Total A B

Existen muchas formas de partir un grupo de ítems en dos mitades, y cada partición daría un conjunto diferente de totales. En promedio, sin embargo, el total de todas las pruebas posibles de particiones por mitades deberían ser bastante similares. El coeficiente alfa de Cronbach es esta prueba.

La fórmula del alfa de Cronbach es

)]1(ρ1/[ρα −+= NN donde ρ es la media de la correlación interítem. La letra griega ρ (llamada rho) en la fórmula representa la correlación promedio entre todos los pares de ítems testados.

Page 11: 17 Cap 13 Escalas

MÉTODOS DE INVESTIGACIÓN EN ANTROPOLOGÍA 212

Por convención, un buen conjunto de ítems en una escala debe alcanzar un alfa de Cronbach de 0,80 o superior. Sepa, sin embargo, que si usa una larga lista de ítems en una escala, la probabilidad de obtener un coeficiente alfa alto es buena. Una correlación de solo 0,14 produce un alfa de 0,80 en un juego de 25 ítems (DeVellis, 1991:92).

Finalmente, uno desea un coeficiente alfa de 0,80 o más alto para un juego pequeño de ítems, que todos estén relacionados y midan lo mismo. El alfa de Cronbach le dirá si la escala está bien relacionada, pero no le dirá cuáles ítems descartar y cuáles retener. Para lograr esto, necesita identificar los ítems que no discriminan entre los respondientes que puntúan alto y gente que obtiene bajos puntajes en el conjunto de ítems.

3. Determinación de la correlación ítem-total

En primer lugar, calcule el puntaje total para cada persona. Sume los puntajes de cada respondiente en todos los ítems. Suponga que hay 50 ítems en su juego de ítems, y que los ha testado en 200 personas. Su matriz de datos se vería así:

ítem 1 ítem 2 ítem 3 … ítem 50

persona 1 x x x x

persona 2 x x x x

persona 3 x x x x

.

.

.

persona 200 x x x x

[304] en donde las x representan los valores de cada persona en cada ítem. En los 50 ítems, puntuados desde 1 a 5, cada persona puede obtener un puntaje total mínimo de 50 (obteniendo un 1 en cada ítem) o uno máximo de 250 (obteniendo un puntaje 5 en cada ítem). En la realidad, por supuesto, cada respondiente en una encuesta obtendrá un puntaje ubicado entre estos dos extremos.

Una forma tosca y rápida para identificar ítems que discriminen bien entre respondientes consiste en dividirlos en dos grupos, el 25% con los puntajes más altos y el 25% con los más bajos. Identifique cuáles ítems tienen en común ambos grupos. Estos ítems son los que no discriminan entre los informantes en cuanto al concepto testado. Por ejemplo, los ítems que fallan al discriminar entre aquellos que están a favor de un entrenamiento en métodos (el 25% superior) y aquellos que están en contra (el 25% inferior) no son buenos ítems para escalar a la gente en este constructo. Nos deshacemos de ellos.

Existe un modo más formal para identificar ítems con buena discriminación entre los respondientes e ítems que no la tienen. Es la correlación ítem-total. Para calcularla dispone de los datos de este modo:

puntaje total ítem 1 ítem 2 ítem 3 … persona 1 persona 2 persona 3 . . .

En el caso de 50 ítems, el puntaje total le da una idea del nivel que cada persona alcanza en el concepto que trata de medir. Si la correlación interítem fuera perfecta, entonces cada ítem estaría contribuyendo de igual modo a nuestra comprensión de la posición del respondiente. Por cierto,

Page 12: 17 Cap 13 Escalas

Escalas y escalamiento

213

algunos ítems funcionan mejor que otros. Aquellos que no contribuyan suficientemente correlacionarán débilmente con el puntaje total de cada persona. Retenga los ítems que manifiestan la correlación más alta con los puntajes totales.

Puede usar cualquier paquete estadístico para calcular las correlaciones interítem, el coeficiente alfa y las correlaciones ítem-total para un juego preliminar de ítems de escala. Su objetivo es deshacerse de aquellos ítems que no manifiesten una correlación interítem alta y retener un coeficiente alfa superior al 0,80. Para hallar una excelente explicación paso a paso del análisis de ítem de escalas en investigación social, consulte Spector (1992:43-46). [305]

Prueba de unidimensionalidad usando análisis factorial El análisis factorial es una técnica provechosa para reducir datos. (Vea el Capítulo 20 para una breve introducción al análisis factorial, y Comrey, 1992, para una cobertura más completa.) Si dispone de 30 ítems en un juego de ítems potenciales para una escala, y las respuestas de una muestra de gente a ese conjunto de ítems, el análisis factorial le permitirá reducir los 30 ítems a un conjunto menor – digamos, 2 o 3 o 4. Cada ítem obtiene un puntaje, llamado carga del factor. Este valor le dice el grado de “pertenencia” de cada ítem a cada uno de los factores subyacentes.

Muchos expertos en desarrollo de escalas actualmente aplican el análisis factorial para probar la unidimensionalidad en escalas Likert. Si una escala es unidimensional, aparecerá un único factor dominante subyacente a todas las variables (ítems) y todos los ítems “cargarán alto” en ese único factor. Los constructores de escalas reúnen un juego extenso de potenciales ítems para la escala (al menos 40), piden a mucha gente (al menos 200 personas) que respondan los ítems, ejecutan un análisis factorial, y seleccionan aquellos ítems con carga alta en el factor (el concepto subyacente) que tratan de comprender.

Me imagino que con los sencillos programas informáticos que facilitan realizar el análisis factorial, la mayoría de quienes desarrollan escalas del futuro usarán este método y similares. Puede sacar ventaja de cualquier paquete estadístico para analizar factorialmente cualquier matriz de respuestas a ítems de una escala. ANTHROPAC (Borgatti, 1992a) contiene un comando para probar la unidimensionalidad de un conjunto de ítems de escala Likert.

Si desea saber lo que hacen los profesionales que desarrollan escalas, consulte alguno de los siguientes artículos recientes: Koeske y Koeske (1989) (una escala para medir el ‘burnout’ laboral), Morris et al. (1990) (escala de auto-evaluación para ancianos en siete dimensiones), Gatz y Hurwicz (1990) (una escala pare medir la depresión en personas mayores), Heatherton y Polivy (1991) (una escala que mide auto-estima), Simpson y Gangstad (1991) (una escala que mide la disposición para empeñarse en relaciones sexuales libres de compromiso), y Handwerker (1994) (una escala desarrollada en Barbados para medir violencia familiar).

Dicho sea de paso, Margo-Lea Hurwicz y Penn Handwerker (dos de los autores nombrados) son antropólogos. La mayoría de los antropólogos no elaboran escalas para uso de otros investigadores. Lo que hacen (y deben hacer), es probar la unidimensionalidad de las mediciones en sus propios datos de campo, usando las técnicas de desarrollo de escala que acabo de presentar.

Diferencial semántico Siempre me ha gustado el método de escalamiento del diferencial semántico. Fue desarrollado en los años 1950 por Charles Osgood y sus asociados en la Universidad [306] de Illinois y se ha vuelto una herramienta importante para la investigación en psicología (Osgood et al., 1957; Snider y Osgood, 1969). He contabilizado 377 artículos y capítulos de libro en los que se informa haber usado este método en 1992.

El diferencial semántico resulta particularmente apropiado para el análisis antropológico: su construcción resulta sencilla para ser probada en cualquier cultura; la prueba es fácil de administrar, incluso con informantes escasamente alfabetizados; y los resultados son intuitivamente fáciles de interpretar.

Page 13: 17 Cap 13 Escalas

MÉTODOS DE INVESTIGACIÓN EN ANTROPOLOGÍA 214

Osgood estaba interesado en saber cómo la gente interpreta cosas – objetos inanimados (tales como artefactos o monumento), objetos animados (tales como personas, o sí mismo), conductas (como el incesto, o adquirir un nuevo vehículo, o cazar ciervos), y conceptos abstractos (como el control de armas o la alfabetización). Por supuesto, para medir lo mismo se elaboran escalas Likert. Osgood hizo pruebas sobre los sentimientos de la gente proponiéndoles un ítem objetivo y ofreciendo una lista de pares de adjetivos sobre dicho objetivo. Los pares de adjetivos podrían identificarse en entrevistas etnográficas.

La Figura 13.1 es un ejemplo de una prueba de diferencial semántico. El objetivo es el concepto de “estadística en antropología.” Si respondiera a la prueba ahora mismo, se le pediría que coloque una cruz en una celda de cada línea, dependiendo de su reacción a cada par de adjetivos.

Estadística en antropología:

1 2 3 4 5 6 7 Bueno Malo Activo Pasivo Difícil Fácil

Permanente Transitorio Cálido Frío

Ético Corrupto Bello Feo

Fuerte Débil Tranquilizante Perturbador

Importante Trivial Rápido Lento Limpio Sucio

Excitante Aburrido Útil Inútil

Figura 13.1. Una escala de diferencial semántico para estimar los sentimientos de los antropólogos respecto de la estadística. Las dimensiones de esta escala son provechosas para medir individuos de varias culturas respecto de sus sentimientos hacia muchas cosas diferentes. [307]

En una escala Likert, se plantea a los informantes una serie de preguntas relacionadas al concepto objetivo. En una escala de diferencial semántico, se nombra el concepto objetivo y se pide a los informantes que califiquen sus sentimientos por el objetivo en una serie de variables. El diferencial semántico usa ordinariamente una escala de 7 puntos, como se indica en los pares de adjetivos usados en la Figura 13.1. Se puede eliminar los números y dejar que los informantes respondan en una escala visual. El puntaje en esta prueba será la suma de todas las respuestas a los 14 pares de adjetivos.

Osgood y sus asociados replicaron esta prueba cientos de veces, usando cientos de adjetivos, en 26 culturas distintas. Sus análisis factoriales evidenciaron que en cada cultura existen tres tipos principales de adjetivos. Los más importantes (aquellos que dan cuenta de la mayor parte de la variación en las respuestas de la gente) son los adjetivos de evaluación (bueno-malo, difícil-fácil), seguidos por adjetivos de potencia (fuerte-débil, dominante-sometido, etc.), y de actividad (rápido-lento, activo-inactivo, sedentario-móvil, etc.).

En el test de diferencial semántico anterior, puede sustituir la frase “Estadística en antropología” por “Los EEUU de fin de siglo,” o “cómo soy yo,” o “solicitar aborto,” o “reforma agraria”. A medida que cambia el objetivo, por supuesto, debe asegurarse que los pares de adjetivos tengan sentido. El par de adjetivos interior-aire libre funciona con muchos objetivos (tipo de música, pasatiempo, incluso personas famosas), pero puede no resultar apropiado para otros (como el concepto de estadística en antropología.).

Page 14: 17 Cap 13 Escalas

Escalas y escalamiento

215

Otras escalas Existen muchas variaciones interesantes en la construcción de escalas. Hadley Cantril (1965) ideó una escalera de la vida de 10 peldaños, mostrada en la Figura 13.2. Se pide a los informantes que nombren sus preocupaciones en la vida (éxito financiero, hijos saludables, estar libre de guerra, y así por el estilo). Se les dice que el peldaño inferior de la escalera representa la peor situación posible, mientras que el superior represente la mejor. Para cada una de sus preocupaciones se les pide que indiquen dónde están hoy, dónde estaban hace 5 años, y dónde creen que estarán dentro de 5 años.

10

9

8

7

6

5

4

3

2

1

0

Figura 13.2. La escalera de la vida. FUENTE: Extraído de El patrón de las preocupaciones humanas de Hadley Cantril © 1965 por Rutgers, La Universidad Estatal. Reimpreso con permiso de la Rutgers University Press.

La escalera de la vida es una escala de auto-anclaje. Se pide a los respondientes que expliquen, con sus propias palabras, el significado de los peldaños superiores e inferiores de la escala – es decir, cuáles podrían ser los resultados peores y mejores de la vida.

Art Hansen y Lucia McSpadden (1993) usaron esta técnica en sus estudios de refugiados de zambianos y etíopes. En Zambia, Hansen de hecho construyó una pequeña escalera de madera para usarla como apoyo y encontró que el método funcionó bien, incluso con informantes iletrados. McSpadden usó varios métodos para explorar cómo los refugiados etíopes se ajustaron para vivir

Page 15: 17 Cap 13 Escalas

MÉTODOS DE INVESTIGACIÓN EN ANTROPOLOGÍA 216

en los [308] EEUU. Incluso cuando fallaron otros métodos, McSpadden encontró que el método de la escalera de la vida hizo que la gente hablara sobre sus experiencias, miedo y esperanzas (ibíd.).

Otro artilugio interesante es la escala de rostros de Andrews y Withey (1976), mostrada en la Figura 13.3. Es una escala de 7 puntos con rostros estilizados que cambian desde alegría a tristeza. Se dice a los informantes: “Aquí hay varios rostros que expresan varios sentimientos. ¿Cuál de ellos está más cerca de lo que siente sobre _____ ?” Puede presentar una lista de ítems para esta escala. Trate de usar esta escala con una lista de figuras políticas bien conocidas como señuelo, sólo para ver lo interesante del método.

Figura 13.3. La escala de rostros. FUENTE: Andrews y Withey (1976:Apéndice A, p. 13). Uso autorizado.

Existen cientos de escalas publicadas. Cualquiera sea el tema que le interese, hay buenas probabilidades de que alguien haya desarrollado y testado una escala para medirlo. Por cierto, las escalas no son automáticamente portátiles. Una escala que mide el estrés emocional entre las mujeres de Barbados puede que no sirva para medir estrés emocional entre los hombres de Ghana.

Aún así, tiene sentido buscar escalas publicadas relacionadas con las variables que está estudiando. Podrá adaptarlas a sus necesidades, o podrá inspirarse para desarrollar y probar una escala alternativa. Puesto que las escalas no son perfectamente transferibles de un tiempo a otro entre culturas no significa que sean inútiles. Para comenzar a buscar escalas que pueda adaptar, consulte el Manual de diseño de investigación y medición social de Delbert Miller (D. Miller, 1991).