Descargar

Manual de construcción de instrumentos psicológicos (página 4)


Partes: 1, 2, 3, 4, 5
edu.red

54 2. Los tres factores del WISC-R. En el año 1959 Cohen realizó uno de los primeros análisis factoriales con el WISC, analizándolas puntuaciones de 200 sujetos de la muestra de estandarización y en- contró cinco factores: ComprensiónverbalI,Organizaciónperceptiva,Independenciaaladistracción,Compren- siónverbalII,yunquintofactorcasiespecífico.Cohenoptópornointerpretarlosfactores cuartoyquintoyagrupólossubtestysuscargasfactorialesenlostresprimerosfactores. Un análisis factorial llevado a cabo con cada uno de los 11 grupos de edad con los que se estandarizó el WISC-R puso de manifiesto la existencia de tres factores: Comprensión verbal, Organización perceptiva e Independencia a la distracción (Kaufman, 1975). Esta estructura factorial se ha encontrado, también, en diferen- tes muestras de sujetos con retraso mental, superdotados, con trastornos de apren- dizaje o problemas conductuales y emocionales (Juliano, Haddad y Carroll, 1988; Reynolds y Kaufman, 1990; Macmann, Plasket, Barnett y Siler, 1991). Cada uno de los 12 sub test del WISC-R se ubica en uno de los tres factores, tal como se recoge en la siguiente tabla. TABLA 2. Composición de los tres factores del WISC-R. UNIDAD II: “LOS ÍTEMS EN LOS INSTRUMENTOS PSICOLÓGICOS”

edu.red

CONSTRUCCIÓN DE INSTRUMENTOS PSICOLÓGICOS MANUAL AUTOFORMATIVO 55 3. Interpretación de las puntuaciones del WISC-R. En este apartado se propone un método para interpretar los cocientes intelectua- les y el perfil de puntuaciones típicas que se obtienen con la administración del WISC-R. El método consta de tres apartados: el primero hace referencia al cociente intelectual total, como resumen global delos resultados obtenidos por un individuo en la prueba. El segundo paso requiere atender a los cocientes intelectuales verbal y manipulativo, y a sus discrepancias, si las hay. El tercer paso consiste en elaborar hipótesis sobre las habilidades e inhabilidades del sujeto, a partir del perfil de las puntuaciones típicas de los sub test.

3.1 Interpretar el cociente intelectual total (CIT). El CIT es una puntuación que resume la ejecución de una persona en 10 o 12 tareas y, por tanto, debe ser tomada como tal. No se debe sobreestimar como indicador de la capacidad cognitiva, sobre todo si aparecen discrepancias entre el cociente intelectual verbal (CIV) y el manipulativo (CIM) o si el perfil de puntuaciones presenta una o más diferencias significativas. Diferencias amplias entre el CIV y el CIM, fluctuaciones notables en las puntuaciones típicas de los sub test administrados, o la presencia de variables como fatiga, ansiedad o la UNIDAD II: “LOS ÍTEMS EN LOS INSTRUMENTOS PSICOLÓGICOS”

El primer factor mide la comprensión verbal, los conocimientos adquiridos con la educación y la capacidad para aplicar la habilidad verbal a situaciones nuevas. Su relación con la escala verbal es bastante clara.

El segundo factor, claramente relacionado con la escala manipulativa mide, funda- mentalmente, organización espacial y perceptiva. Aprecia la habilidad para orga- nizar e interpretar el material visual, percibido en situaciones en las que el tiempo está limitado.

Estos dos factores corresponden prácticamente a la distinción entre CIV y CIM, por lo que el propio Kaufman (1982) afirma que estos CI pueden ser considerados como buenas estimaciones de la capacidad de comprensión verbal y de organiza- ción perceptiva en sentido factorial. El tercer factor, que ya había sido encontrado en otros análisis factoriales del WISC (Cohen, 1959), mide la capacidad para permanecer atento y concentrado. La ha- bilidad numérica y la memoria a corto plazo pueden ser componentes importantes de este factor. Mientras que los dos factores anteriores son, básicamente, de tipo cognitivo, este tercer factor puede corresponder tanto al campo cognitivo como al conductual o afectivo.

2.1 Interpretación del factor de independencia a la distracción. Este factor se analiza cuando la puntuación de cualquiera de los sub test que lo componen se desvía de la media del sujeto en el resto de la escala. Si aritmética y dígitos no difieren de los sub test verbales y claves de los manipulativos, es inne- cesario analizarlo como un factor independiente.

Cuando interpretemos este tercer factor no es adecuado utilizar los CIV y CIM puesto que puede haber en uno de ellos, o en ambos, algún sub test que provoca un desequilibrio. En este caso de la capacidad de comprensión verbal y de orga- nización perceptiva en sentido factorial.

Puntuaciones altas o bajas en el factor de independencia a la distracción no im- plican, necesariamente, superioridad o deficiencia en esta área. Una deficiencia puede ser debida, también, a ansiedad, falta de atención e hiperactividad, pro- blemas en el manejo de los números, deficiente memoria a corto plazo o mala coordinación viso motora, por ejemplo. Una superioridad puede indicar buena capacidad de secuenciación, buena memoria a corto plazo o habilidad para el manejo de los números. Indudablemente una puntuación alta o baja no implica, necesariamente, todas estas habilidades o discapacidades. La historia clínica, la observación del sujeto durante la prueba, así como el resto de pruebas que haya- mos administrado, nos indicarán a cuales de ellas podemos atribuirlas.

edu.red

TEMA N° 3: PUNTUACIÓN DE UN TEST 56 Diagrama Objetivos Inicio Desarrollo de contenidos

Lecturas seleccionadas Recordatorio Anotaciones ACTIVIDAD N° 1: Actividades Autoevaluación Esta actividad puede consultarla en su aula virtual.

Glosario Bibliografía 1 CALIFICACIÓN DE UNA PRUEBA PSICOLÓGICA 1.1 NORMAS DE PUNTUACIóN En un test formado por varios ítems, el sujeto evaluado debe emitir una respues- ta, el resultado inicial se conoce como puntaje bruto o puntaje directo (PD), generalmente se obtiene de la sumatoria de respuestas correctas o respuestas clave, estas puntuaciones no son suficientes para interpretar los resultados y esto obedece a según (Tornimbeni, S. 2004)9 : a. Carecen de cero absoluto (el cero no indica ausencia absoluta del rasgo). b. No poseen unidades de medida constante (cada test emplea unidades de me- dida diferente). c. No son reconocidas ampliamente en el ámbito fuera de la especialidad (como si ocurre por ejemplo con el sistema métrico decimal).

Por lo tanto en los test lo que interesa es interpretar la puntuación del sujeto en función de cierto nivel o grado que posee en ese rasgo.

La estrategia comúnmente usada es la comparación de los resultados individua- les con el rendimiento del grupo de referencia de esas personas en la misma prueba.

1.1.1 Métodos de Trasformación de puntuaciones Trasformaciones lineales: Es cuando se obtienen una nueva escala de me- dición que respeta las distancias entre las unidades de medida de la escala original. La relación entre los intervalos es independiente de la unidad de medida empleada y del punto de origen de la escala. Las transformaciones lineales más utilizadas son las puntuaciones estándar o z. (Aiken 2003)

1.1.2 Trasformaciones no lineales: Asumen una distribución a priori que altera la forma de distribución de los puntajes originales, Las puntuaciones no pue- den ser sumadas, promediadas o correlacionadas puesto que no respetan las diferencias entre los intervalos de la escala de medida original. a) Percentiles Expresan el porcentaje de personas en un grupo de referen- cia que queda por debajo de una puntuación original determinada. b) Puntuaciones estándar normalizada Facilita la comparación de diferen- tes puntuaciones transformadas (puntuaciones z con puntuaciones per- centiles). El procedimiento empleado se denomina normalización y las puntuaciones obtenidas mediante este proceso reciben el nombre de normalizadas.

9 Tornimbeni, S 2004 Introducción a los Test Psicológicos tercera edición p.103. UNIDAD II: “LOS ÍTEMS EN LOS INSTRUMENTOS PSICOLÓGICOS”

pertenencia a grupos socioculturales deprimidos o marginales, disminuye la im- portancia del CIT como indicador de la capacidad cognitiva de una persona.

3.2 Comprobar si existe discrepancia entre el cociente intelectual verbal (CIV) y el cociente intelectual manipulativo (CIM). Determinar si la discrepancia es esta- dísticamente significativa.

edu.red

CONSTRUCCIÓN DE INSTRUMENTOS PSICOLÓGICOS MANUAL AUTOFORMATIVO 57 UNIDAD II: “LOS ÍTEMS EN LOS INSTRUMENTOS PSICOLÓGICOS”

Ejemplo de ello podemos encontrar en las tablas de conversión de puntua- ciones directas a percentiles en el test de inteligencia de Wechsler (WPPSI) Manual del test p. 74.

TEMA N° 4: PROCESO DE VALIDACIÓN DE UN TEST. 1 VALIDACIÓN DE UN TEST. 1.1 Validez de contenido: 1.1.1 Análisis lógico de los ítems y de la estructura de la prueba: Consiste en estu- diar de manera lógica y racional los ítems. Explicar el por qué se incluyen en el instrumento.

1.1.2 Análisis por criterio de jueces: Recibir el apoyo de un conjunto de perso- nas calificadas con amplios conocimientos del tema. Los resultados pue- den ser cuantificados en base a diferentes coeficientes, los cuales posibili- taran la aceptación o rechazo de los ítems evaluados.

1.2 Valides de construcción: Es definida como el grado en que una prueba mide y evalúa una característica psicológica, demostrando construcciones teóricas que explican en una cierta mediada el resultado encontrado

Calidad de un método de evaluación que refleja con fidelidad los cambios o necesidades a evaluar. La validez de construcción se logra de manera íntegra cuando los conceptos clave son completamente transparentes y / o cuando los indicadores miden lo que deben medir.

1.3 Validez externa: Calidad de un método de evaluación que posibilita la obtención de hallazgos que pueden generalizarse hacia otros grupos, áreas, períodos, etc. La validez externa se logra de manera íntegra cuando el equipo de evaluación es capaz de dejar en claro que una intervención similar implementada en otro contexto tendría los mismos efectos bajo determinadas condiciones.

Sólo una fuerte validez externa permite la transferencia de las lecciones apren- didas. También se busca validez externa cuando la evaluación está destinada a identificar y validar las buenas prácticas. La validez externa se ve amenazada cuando el análisis no logra identificar los factores externos fundamentales que son influyentes en el contexto de la intervención evaluada pero que tendrían una influencia diferente en otro contexto.

1.4 Validez interna: Calidad de un método de evaluación que, en la medida de lo posible, limita los sesgos imputables a la recolección de datos o a las técnicas de análisis. La validez interna se logra de manera íntegra cuando el equipo de evaluación aporta argu- mentos irrefutables mostrando que la intervención ha tenido (o no) un efecto determinado.

Se solicita una fuerte validez interna cuando se supone que la evaluación debe informar acerca de los resultados e impactos directos. Se pone en peligro la validez interna cuando el análisis no confirma adecuada- mente las relaciones de causa y efecto, cuando se realizan comparaciones de gru- pos que no son lo suficientemente similares, o cuando las pruebas estadísticas no son significativas.

Las evaluaciones más útiles tal vez no sean siempre las más válidas. Sin embargo, la falta de validez expondrá a la evaluación a críticas devastadoras por parte de aquellas partes interesadas que no estén satisfechas con las conclusiones y reco- mendaciones. Se le debería prestar una mayor atención a la validez cuando hay

edu.red

58 • Coeficiente de validez: Consiste en correlacionar los resultados obtenidos en la prueba con puntajes de un criterio externo. – – – –

• Seleccionar un grupo Aplicar la prueba predictiva Aplicar el tratamiento Reunir los datos de criterio

Diferenciación de grupos: 2 Consiste en determinar si las calificaciones predictivas del instrumento son capaces de establecer diferencias entre dos o más grupos específicos.

PRUEBA PILOTO O PRETEST COGNITIVO: Recordatorio Anotaciones La prueba piloto es aquella práctica de investigación en donde se prueba la meto- dología, la muestra, la funcionalidad de los instrumentos, el análisis de los datos y la viabilidad del proyecto investigativo. La prueba piloto permitirá identificar: • Tipos de preguntas más adecuados. • Si el enunciado es correcto y comprensible, y si las preguntas tienen la extensión adecuada. • Si es correcta la categorización de las respuestas. • Si existen resistencias psicológicas o rechazo hacia algunas preguntas. • Si el ordenamiento interno es lógico; si la duración está dentro de lo aceptable por los encuestados. En cuanto a los métodos utilizados para la realización del pre-test cognitivo, éste se lleva a cabo mediante la realización de: • Entrevistas informales. Diagrama Objetivos Inicio • Grupos focales de la población diana. • Encuesta sobre comprensión de las preguntas. • Valoración del cuestionario por parte de los participantes en el estudio. Desarrollo Actividades Autoevaluación de contenidos

LECTURA SELECCIONADAS N° II Lecturas Glosario Bibliografía seleccionadas Directrices para la traducción – Adaptación de los Test Adaptadas de la International Test Comisión (ITC)11 1. Contexto Los efectos de las diferencias culturales que no sean relevantes para los objetivos centrales del estudio deberían minimizarse en la medida de lo posible. Debería de evaluarse la cuantía del solapamiento de los constructos en las pobla- ciones de interés.

10American Psychological Association (APA) is a scientific and professional organization that represents psycho- logists in the United States. 11 Dra. Isabel M. Mikulic Construcción y Adaptación de Pruebas Psicológicas. UNIDAD II: “LOS ÍTEMS EN LOS INSTRUMENTOS PSICOLÓGICOS”

partes interesadas con intereses en conflicto entre los usuarios previstos. LA Asociación Psicológica Americana (APA)10: Establece los métodos de clasifi- cación como validez relacionadas con el siguiente criterio: a. Concurrente:Es el estudio de los puntajes de la prueba y un criterio. Su pro- pósito es determinar si las calificaciones del criterio pueden ser sustituidas por los puntajes obtenidos con la prueba. b. Predictiva: La prueba es capaz de predecir un determinado rendimiento. Un criterio es una medida o norma de ejecución de una determinada conducta o área de comportamiento.

edu.red

CONSTRUCCIÓN DE INSTRUMENTOS PSICOLÓGICOS MANUAL AUTOFORMATIVO 59 2. Adaptación de los test 3. Los constructores/ editores de test deberían de asegurarse que el proceso de adap- tación tiene en cuenta las diferencias lingüísticas y culturales entre las poblaciones a las que se dirigen las versiones adaptadas de los test.

Los constructores / editores de los test deberían de proporcionar datos que ga- ranticen que el lenguaje utilizado en las instrucciones, en los propios ítem y en el manual del test, son apropiados para todas la poblaciones culturales e idiomáticas a las que va dirigido el test.

Los constructores / editores de test deberían de aportar evidencia de que las téc- nicas de evaluación elegidas, los formatos de los ítems, las reglas de los test y los procedimientos son familiares a todas las poblaciones a las que van dirigidos.

Los constructores / editores de test deberían de asegurarse que el diseño de reco- gida de datos permite el uso de técnicas estadísticas apropiadas para establecer la equivalencia entre los ítems correspondientes a las diferentes versiones idiomáticas del test.

Los constructores / editores de test deberían aplicar técnicas estadísticas apropia- das para 1) establecer la equivalencia entre las diferentes versiones de un test,y 2) identificar componentes problemáticos o aspectos del test que puedan ser inade- cuados para alguna de las poblaciones a las que va destinado el test.

Los constructores / editores de test deberían de proporcional información sobre la evaluación de la validez en todas las poblaciones objetivo a las que va dirigido el test adaptado.

No deben utilizarse preguntas no equivalentes en todas las versiones dirigidas a di- ferentes poblaciones cuando se prepara una escala común, o cuando se comparan estas poblaciones. Sin embargo, pueden ser útiles para reforzar la validez de conte- nido de las puntuaciones de cada población por separado.

Aplicación Los constructores y los aplicadores de los test deberían tratar de prever los tipos de problemas que cabe esperar, y tomar las medidas oportunas para evitarlos mediante la preparación de materiales e instrucciones adecuados.

Quienes aplican los test deberían de ser sensibles a cierto número de Editores re- lacionados con los materiales utilizados para los estímulos, los procedimientos de aplicación, y las formas de respuesta, que pueden reducir la validez de las inferen- cias extraídas de las puntuaciones.

Aquellos aspectos del entorno que influyen en la paliación del test deberían de mantenerse lo más parecidos posibles para todas las poblaciones a las que va diri- gido el test.

Las instrucciones para la aplicación del test en el idioma fuente y en el objetivo deben minimizar la influencia de variación no deseada.

El manual del test debería de especificar todos los aspectos del test y de su aplica- ción que han de revisarse al utilizarlo en un nuevo contexto cultural. El aplicador no debe de interferir, debiendo minimizarse su influencia sobre los examinados. Deben de seguirse al pie de la letra las reglas explicitas descritas en el manual del test. UNIDAD II: “LOS ÍTEMS EN LOS INSTRUMENTOS PSICOLÓGICOS”

edu.red

TAREA ACADÉMICA I • Organiza toda tu información y material bibliográfico. 60 4.

5. Interpretación de las puntuaciones Cuando se adapta un test para utilizarlo en otra población, debe de facilitarse la documentación sobre los cambios, así como los datos acerca de la equivalencia entre las versiones.

Las diferencias entre las puntuaciones obtenidas por las muestras a las que se aplicó el test no deben de tomarse sin más directamente. El investigador tiene la respon- sabilidad de sustanciar las diferencias con otros datos empíricos. Las comparaciones entre poblaciones solo pueden hacerse al nivel de la invarianza que se haya establecido para la escala en la que se expresan las puntuaciones. El constructor del test debería de proporcionar información específica acerca de las distintas formas en las que los contextos socioculturales y ecológicos de las po- blaciones pueden afectar al rendimiento en el test, y debería sugerir procedimien- tos para tener en cuenta estos efectos en la interpretación de los resultados.

CONCLUSIONES La utilización de los test psicológicos construidos en otros contextos culturales es una práctica frecuente no solo en nuestro medio sino en todo el mundo. El uso de un test en un contexto cultural diferente, donde se usa un lenguaje distinto y se está familiarizado con estímulos muy diversos, produce dificultades traducibles como fuentes de sesgo. La existencia de sesgo puede tener consecuencias iatrogénicas al aplicar los test y al obtener resultados totalmente erróneos. En un ámbito clínico podemos asumir la existencia de un rasgo de personalidad patológico, cuando este rasgo puede ser normal sí está dentro de un rango correc- tamente medido.

Además de ser muy necesario contar con instrumentos adecuados para la práctica psicológica y para la investigación, la adaptación de instrumentos responde a razo- nes de índole científico y practico.

Es importante reconocer que la mayoría de las teorías psicológicas actuales se han desarrollado en contextos de cultura occidental y que la validación empírica de las mismas se ha realizado con muestras de jóvenes universitarios de raza blanca. Ahora enfrentamos el desafió de demostrar la Universalidad de esas teorías si es que es posible. Es por ello que para poder evaluar si un determinado rasgo psicoló- gico existe en culturas diferentes es necesario contar con instrumentos equivalentes a través de diferentes culturas, es decir que midan lo mismo en ambas culturas en donde va a ser aplicado.

Para ello proponemos comenzar por desarrollar mayor cantidad de instrumentos que cumplan con los requisitos necesarios para ser aplicados según las teorías de los test que últimamente han cobrado vigor y siguiendo parámetros internacionales. Diagrama Objetivos Inicio Desarrollo de contenidos

Lecturas seleccionadas

Recordatorio ACTIVIDAD N° II: Actividades Autoevaluación Esta actividad puede consultarla en su aula virtual.

Glosario Bibliografía 1. Redacta el marco teórico y la respectiva matriz organizativa de su test psicológico. Instrucciones Antes de Empezar, debe realizar los pasos siguientes: Anotaciones • Desarrolla un esquema del marco teórico a realizar • Busque información sobre la estructura de un marco teórico. • Obtener información (bibliografía, citas, estadísticas, etc.) UNIDAD II: “LOS ÍTEMS EN LOS INSTRUMENTOS PSICOLÓGICOS”

edu.red

CONSTRUCCIÓN DE INSTRUMENTOS PSICOLÓGICOS MANUAL AUTOFORMATIVO 61 Objetivos Inicio s Actividades s Glosario o Anotaciones AUTOEVALUACIÓN DE LA UNIDAD N° II Autoevaluación 1. Anote en el espacio en blanco, la expresión que mejor complete la idea inconclusa, luego marque la alternativa que estime correcta: “Cuando un ítem solo mide la ocurrencia o no ocurrencia de un fenómenos, se Bibliografía denomina__________________”. A) Escala Ordinal B) Escala Nominal C) Escala de Frecuencia D) Escala de razón E) Escala de Intervalo

2. Con respecto a la validez de un instrumento, Anote en el espacio en blanco, la expresión que mejor complete la idea inconclusa, luego marque la alternativa que estime correcta: “Puede definirse como la _______________ entre las puntuaciones o medida de una prueba y la cualidad que se cree que se está midiendo”. A) Consistencia. B) Concordancia. C) Recurrencia. D) Persistencia. E) Similitud.

3. Anote en el espacio en blanco, la expresión que mejor complete la idea inconclusa, luego marque la alternativa que estime correcta. La estimación de confiabilidad test- retest se usan para:_____________________ _________________________. A) Evaluar el error asociado con la administración de una prueba en dos rasgos diferentes B) Evaluar el error asociado con la administración de una prueba en dos tests dife- rentes C) Evaluar la consistencia asociado con la administración de una prueba en dos momentos diferentes. D) Evaluar el error asociado con la administración de una prueba en dos momentos diferentes E) Evaluar el error asociado con la puntuación de una prueba en dos momentos diferentes

4. Con respecto a la confiabilidad, anote en el espacio en blanco, la expresión que mejor complete la idea inconclusa, luego marque la alternativa que estime correcta. “Es el grado de ______________ que existe entre dos medidas de un mismo evento, objeto o constructo” A) Seguridad. UNIDAD II: “LOS ÍTEMS EN LOS INSTRUMENTOS PSICOLÓGICOS”

1.1 La estructura del marco teórico es la siguiente: a. Antecedentes. b. Definición de términos básicos de su test. c. Bases Teóricas (teorías) en la que se sustenta su test (constructo).

1.2 Matriz organizativa completa. Resuelva el siguiente cuestionario, marcando la respuesta correcta en cada caso, para fijar los conceptos e ideas fundamentales tratados en la Unidad:

edu.red

62 UNIDAD II: “LOS ÍTEMS EN LOS INSTRUMENTOS PSICOLÓGICOS”

B) Resultado. C) Recurrencia. D) Consistencia. E) Consistencia interna.

5. Anote en el espacio en blanco, la expresión que mejor complete la idea inconclusa, luego marque la alternativa que estime correcta. “En la etapa que se encuentran en la elaboración de su prueba, están en__________________” A)Competencia Inconsciente B) Incompetencia Inconsciente C) Competencia Consciente. D) Incompetencia consciente E) Competencia subconsciente.

6. Con respecto a la matriz organizativa, está conformada esencialmente por: A) ítems e indicadores B) ítems y situaciones de medida C) Indicadores y situaciones de medida D) Situaciones de medida E) Indicadores

7. Conrespecto al proceso de elaboración de una prueba, las interrogantes referidas a: ¿qué tema voy abordar, para quienes está dirigido, qué recursos necesito, para cuándo lo voy a realizar?, están referidas a: A)Organización B) Ejecución C) Planificación D) Elaboración E) Evaluación

8. Anote en los espacio en blanco, la expresión que mejor complete la idea inconclusa, luego marque la alternativa que estime correcta: “Para hacer una prueba psicológica se debe tener en cuenta primero el_____________, luego _____________sin descuidar la ____________además la_______________ y los _________________ “. A) Lenguaje, público al que va dirigido, redacción, tendencia del ítem B) Lenguaje, publico al que va dirigido, redacción, errores gramaticales C) Lenguaje, extensión, público al que va dirigido, redacción, tendencia del ítem D) Lenguaje, extensión, redacción, tendencia del ítem, errores gramaticales E) Lenguaje, extensión, errores gramaticales, tendencia del ítem

9. Con relación a la Validez de contenido y de criterio de jueces, anote en el espacio en blanco, la expresión que mejor complete la idea inconclusa, luego marque la alternativa que estime correcta: “al buscar la validez de contenido intentamos determinar si una prueba ha sido_________ _____________________________________________ “. B)Adecuadamente estandarizada C) Adecuadamente planificada. D) Adecuadamente aplicada. E) Adecuadamente elaborada. F) Adecuadamente calificada.

edu.red

C) FFVV. CONSTRUCCIÓN DE INSTRUMENTOS PSICOLÓGICOS MANUAL AUTOFORMATIVO 63 Diagrama Objetivos Inicio D) VVFF. E) VVVF. Desarrollo de contenidos Actividades Lecturas seleccionadas

Recordatorio Autoevaluación

GLOSARIO12 Glosario Bibliografía 1. ANALISIS DE íTEMS. (Ingles: ítem analysis): Comprobación empírica de la utilidad de los ítems componentes de un test. 2. AQUIESCENCIA: En los test, la tendencia a reaccionar con una actitud, espontánea, Anotaciones irreflexiva de conformidad, que se observa, sobre todo, en la perseveración de un tipo de respuesta. Por ejemplo, contestar a todos los ítems de un inventario como “verdadero”, “falso”, o de un cuestionario como “sí”, “no”, etc. Altera y falsea los resultados. (Dorsch, 1991) 3. Coeficiente de validez: Correlación entre las puntuaciones obtenidas por los sujetos en el test y las obtenidas en el criterio 4. Iatrogénicas: (iatrogénicas) La norma clásica de “ante todo no hacer daño” (pri- mum non nocere) es una de las bases de la ética médica. 5. Percentil: Puntuación en un test, que indica el “tanto por ciento” de sujetos del gru- po normativo que dicha puntuación deja por debajo 6. Proceso discriminante: Proceso subjetivo originado en el sujeto ante la presentación de un estímulo a través del cual le asignará un valor también subjetivo en el conti- nuo psicológico. 7. Puntaje Observado. La puntuación obtenida por un sujeto es un test psicológico. Puntuación empírica de un test compuesta por una parte denominada puntuación o puntaje verdadera/o y de otra que es el error de medida 8. Puntaje Transformado. Transformación de las puntuaciones brutas en cualquier escala derivada a fin de hacer comparables los resultados. Los más usuales son los puntajes de normas intra grupo (percentil, puntaje T, Cociente Intelectual por des- viación). Véase “Normas Intra grupo” 9. Puntaje Verdadero. La puntuación verdadera es constante, pero las puntuaciones observadas y los errores son aleatorios. Si, por ejemplo, suponemos que el puntaje verdadero de una persona en inteligencia es de CI = 110 no podemos predecir con certeza cuál será la puntuación observada o empírica que obtendrá esa persona en aplicaciones estandarizadas y repetidas del mismo test, dada la influencia del error de medida (Martínez Arias, 1996) 12 http://psicopsi.com/Diccionario-terminos-psicometricos. UNIDAD II: “LOS ÍTEMS EN LOS INSTRUMENTOS PSICOLÓGICOS”

10. Con respecto a la prueba piloto, determine la falsedad (F) o la veracidad (V) de las siguientes afirmaciones, luego marque la respuesta correcta: I.- Verificar la comprensión de los ítems ( ) II.- Se aplica a un grupo normativo ( ) III.- Nos da la facilidad de reajustar los ítems ( ) IV.- Sirve para vislumbrar la posibilidad de otro instrumento ( ) A. VFVF. B) VVFV.

edu.red

UNIDAD II: “LOS ÍTEMS EN LOS INSTRUMENTOS PSICOLÓGICOS” 64 Diagrama

Desarrollo de contenidos

Lecturas seleccionadas

Recordatorio Objetivos

Actividades

Glosario

Anotaciones Inicio

Autoevaluación

BIBLIOGRAFIA DE LA UNIDAD II: Bibliografía 1.- AMERICAN PSYCHOLOGICAL ASSOCIATION (APA) (1999). Standards for psy- chological and educational test. Washington, D.C. 2.- ANASTASI, A. & URBINA, S. (1998) Test Psicológicos. Prentice Hall. México. Sép- tima Edición. 3.- CORTADA DE KOHAN, N. (1999) Teorías Psicométricas y Construcción de Test. Lugar Editorial. Buenos Aires 4.- WECHSLER, David. WISC-R, ESCALA DE INTELIGENCIA DE WECHSLER PARA NIñOS-REVISADA editorial: TEA S. http://www.ula.ve/personal/cargos_unicos/psicologo.htm http://glosarios.servidor-alicante.com/psicometria

Diccionario de términos psicométricos

edu.red

DIAGRAMA DE PRESENTACIÓN DE LA UNIDAD CONTENIDO CONSTRUCCIÓN DE INSTRUMENTOS PSICOLÓGICOS MANUAL AUTOFORMATIVO 65 BIBLIOGRAFÍA EJEMPLOS AUTOEVALUACIÓN ACTIVIDADES Diagrama Objetivos Inicio Desarrollo de contenidos

Lecturas seleccionadas Diagrama UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN” Actividades Autoevaluación

Glosario Bibliografía Objetivos Inicio Recordatorio Anotaciones Desarrollo Actividades Autoevaluación de contenidos Lecturas seleccionadas Glosario Bibliografía

edu.red

66 1 NORMAS: CONCEPTO, INTERPRETACIÓN. Tiler (1978) citado por Tornimbeni, S. dice que, la evaluación por criterios supone un concepto de la educación diferente al de la evaluación por normas. Por lo tanto la evaluación que se realiza dentro de la escuela, no tiene una función selectiva sino formativa. La función del maestro noes identificar a los mejores alumnos y a los peores sino en hacer que unos y otros logren los aprendizajes 13.

Los test nos permiten obtener datos cuantitativos y cualitativos, arrojan resultados que en sí mismos (puntuaciones brutas) no nos dicen mucho, pero obtenemos más información cuando la comparamos con los resultados obtenidos por otros grupos, así podemos interpretarla.

Existen dos formas para comparar los resultados, dependiendo de la forma en que ha sido construido el test (por normas o por criterios), son las siguientes:

1.1 Normas. Se compara al sujeto con un grupo de referencia (otros sujetos). La mayor parte de los test están construidos en base a normas, fundamentados en la teoría clásica de los test. Por lo tanto: a. Se posiciona al sujeto dentro de un colectivo, un grupo de referencia en cuan- to a una característica. Existen diferentes formas de posicionar al sujeto, por medio de percentiles, desviación típica… b. Los resultados obtenidos se comparan y el sujeto adquiere una posición rela- tiva a un grupo de referencia (grupo normativo).

También existen diferencias en cuanto a cómo se hace la comparación y las in- ferencias: Normas. Juega un papel primordial la varianza, lo que se busca es una diferen- ciación, hacer una discriminación entre sujetos. Por ejemplo, cuando se utiliza la campana de Gauss para obtener la nota de un examen, la puntuación se obtiene en base a las notas del mismo grupo.

1.2 Criterios. Se compara al sujeto con respecto a un objetivo a lograr (lo puedo comparar consigo mismo), hasta qué punto se la logrado o no el objetivo pro- puesto (por ejemplo en lugar de comer una tableta de chocolate comer solo dos onzas al día).

Los test basados en criterios tienen las siguientes características: a. Se construyen y aplican con el fin de saber si un sujeto ha conseguido el obje- tivo o no. b. Para diferenciar si un sujeto se puede catalogar como apto o no para una tarea determinada. c. Clasifico en base a la puntuación obtenida por el sujeto (lo comparo consigo mismo). d. Existen diferentes tipos de población por lo que se utilizan puntos de corte, es decir, puntuaciones que diferencian, por ejemplo a un depresivo de un no depresivo, es el punto donde se divide la población (hasta aquí es normal…), diferencia la población normal de la clínica.

También existen diferencias en cuanto a cómo se hace la comparación y las in- ferencias: Criterios. Se trata de que todos los sujetos puedan llegar al objetivo, no importa la varianza.

13 Tornimbeni, S 2004 Introducción a los Test Psicológicos tercera edición p.103. UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

TEMA N° 1: TEST NORMALIZADOS

edu.red

CONSTRUCCIÓN DE INSTRUMENTOS PSICOLÓGICOS MANUAL AUTOFORMATIVO 67 UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

“La diferencia básica en los dos tipos de pruebas se refleja también en la in- terpretación de sus resultados: en la prueba por normas, el puntaje adquiere significado si se lo interpreta en relación con el rendimiento alcanzado por un grupo de referencia o grupo normativo, es decir nos proporciona información de cómo es el rendimiento de un individuo comparado con el rendimiento de otros en el mismo instrumento… en cambio la prueba por criterios informa la posición de un individuo en relación con un dominio conductual definido explícitamente, refleja un cambio interpretable en términos conductuales y no solo su variación de su posición comparada con las posiciones relativas de otros sujetos (Himmel, 1979)” 14

1.3 La fiabilidad En los tipos de test: a. Los test basados en normas, la fiabilidad está en las medidas que tomamos (un test es fiable si la medida es fiable). b. Los test basados en criterios, se hace énfasis en que la fiabilidad se da en las clasificaciones que hago en base a los criterios. Ambos tipos no son excluyentes, se pueden complementar.

1.4 ¿Para qué sirven los test normalizados? Para transformar las puntuaciones brutas en puntuaciones indirectas, es decir, para comparar a un sujeto con el grupo. Tipificar, es el establecimiento de las normas que nos va a permitir comparar. Las normas se extraen siempre del promedio de actuación de un grupo de re- ferencia (grupo normativo) al que tiene que pertenecer el sujeto o en base a la muestra de normalización, pero debe ser realmente representativa de su pobla- ción de referencia.

Para tipificar un test se siguen los siguientes pasos: a. Acotar la población a la que va dirigida el test. b. Elegir una muestra normativa (parte representativa de la población) para po- der hacer inferencias a la población. Para elegir la muestra utilizamos un muestreo (proceso de elección de mues- tra, extrayéndola de la población). Para hacer el muestreo se utilizan diferentes métodos: probabilístico, intencional u opinático, circunstancial o errático, etc.; y a su vez existen diferentes técnicas para llevarlo a cabo: aleatorio simple, por etapas, estratificado, etc. c. Establecer normas de comparación (edad, sexo, grado, nivel socioeconómi- co, cultura) d. Aplicar el test. e. En base a las normas se analiza la forma de actuación del grupo normativo y obtiene la media de actuación.

Los métodos más usados para describir la posición de un sujeto respecto al gru- po son: a. Puntuación típica (z). b. Rangos percentiles. Son más fáciles de usar e interpretar pero no son exactos en la posición, conllevan más errores.

1.5 El instrumento psicométrico tiene que estar validado lo que conlleva saber en primer lugar ¿qué evaluar?, lo que nos lleva a una definición lógica del atributo a medir. También hay que definir operativamente como se manifiesta el atributo, luego hay que saber cómo dar grado al mismo. Un instrumento psicométrico consta de tres elementos: a. Manual, pautas de manejo b. Protocolo de la prueba(ítems y posible hoja de respuestas aparte) c. Plantilla de corrección

14 Tornimbeni, S 2004 Introducción a los Test Psicológicos tercera edición p.103.

edu.red

68 –

– – ómnibus: las preguntas miden diferentes operaciones mentales que se combinan en una sola puntuación final(escalas evolutivas de Binet) Homogéneos o de tarea única: mide solo una habilidad o tarea (Raven) Batería de test: grupo de sub test tipificado y normalizado en una pobla- ción que dan diferentes características (test de aptitudes de Thurstone), que forman parte de una misma evaluación o contexto. d. Tipo de respuesta que exigiremos al sujeto: –

– Construcción de respuesta: se le presenta un estímulo y el sujeto elabora su propia respuesta de forma libre. Elección de respuesta: se le presenta el estímulo y se le dan alternativas de respuesta cerradas de las que el sujeto elige una. e. Tipo de aplicación: –

– Colectivos: las cuestiones se presentan en un protocolo impreso. El con- tacto personal con el evaluador es mínimo. Las tareas a realizar se pro- ponen a todos los sujetos a la vez, hay un tiempo para realizarlo y la tarea suele ser de elección de respuesta. Las habilidades lectoras del sujeto pueden influir a la hora de responder. No exigen demasiada preparación del examinador. Resultan económicos en tiempo. Individuales: la aplicación se hace persona a persona. El examinador nor- malmente presenta oralmente las preguntas. No hay límite de tiempo. El examinador necesita más experiencia; permiten también que el sujeto responda libremente (construcción de respuesta). El sujeto puede pedir explicaciones sobre la tarea por lo que las influencias de las habilidades lectoras no se dan. El problema es que llevan mucho tiempo.

TEMA N° 2: BAREMACIÓN 1 PUNTUACIÓN PERCENTIL Y PUNTUACIÓN ESTÁNDAR 1.1 Puntuación percentil. Se llaman centiles o percentiles a 99 valores que dividen a la serie de datos en 100 partes iguales. Se representan por P1, P2…, P99 y se leen percentil primero, segundo, …, noventa y nueve. Un percentil es el porcentaje de casos que figuran en o por debajo de la puntuación de un individuo en una distribución. En otras palabras, es el rango de una persona entre cien. Se obtienen dividiendo su rango por el número total de mediciones en la distribución y multiplicándolo por 100. Así, si un profesor indica al padre de un alumno que su hijo se encuentra en el percentil 80, el profesor quiere indicar que dicho alumno deja al 80 por 100 de la clase por debajo de su puntuación, es decir que se encuentra en el grupo del 20 por 100 de los que obtuvieron mejor calificación 15.

1.1.1 Cálculo Si se desea un resultado más preciso se puede utilizar la siguiente expre- sión: (datos agrupados en frecuencias):

15 http://www.e-torredebabel.com/Psicologia/Vocabulario/Percentil.htm. UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

Estos tres elementos varían en su forma de presentación dependiendo de la fina- lidad del test, de su aplicación, de su corrección, etc. Cuando queremos elaborar un test hay que saber a quién queremos evaluar; la longitud del test también será diferente. Hay que saber el tiempo del que dispo- nemos para: Elaborar el test, aplicarlo y corregirlo.

1.6 Criterios para diferenciar los test. b. Forma de presentar los ítems: Estos pueden ser verbales (16PF), gráficos (Ra- ven) o manipulativos (tepsi). Hay instrumentos que combinan diferentes tipos de ítems por ejemplo esca- las Wechsler de inteligencia que combina los tres tipos de ítems. c. Contenido del test:

edu.red

CONSTRUCCIÓN DE INSTRUMENTOS PSICOLÓGICOS MANUAL AUTOFORMATIVO 69 UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

Fórmula N° 2:

Donde: K: porcentaje de casos del centil. Li: Límite inferior de la puntuación donde se encuentra el centil. fi: Frecuencia de la puntuación donde se encuentra el centil. N: Tamaño de grupo. fa: Frecuencia acumulada hasta el límite inferior de la puntuación donde se encuentra el centil.

El percentil representa el porcentaje de los casos de un grupo que alcanzó valores iguales o menores que el citado porcentaje. El rango percentil se calcula dividien- do la frecuencia acumulada entre el total de datos (N) multiplicado por 100. Un rango percentil debe expresarse en relación a algún grupo de referencia.

El rango percentil se utiliza, cuando se quiere averiguar un porcentaje de un valor que cae dentro de los intervalos de la variable.

Así, el rango percentil de un resultado es el porcentaje de puntuación en su dis- tribución de frecuencias que son inferiores a él. Por ejemplo, una puntuación de prueba que es mayor que 75% de las puntuaciones de las personas que toman la prueba se dice que está en el percentil 75.

1.2 Puntuación estándar. Los resultados suelen usarse en la evaluación de normas de referencia para com- parar el rendimiento de un estudiante por ejemplo en una prueba con el desem- peño de otros estudiantes de su edad.

Los resultados estiman si las puntuaciones de un estudiante son superiores a la media, promedio o por debajo del promedio en comparación con sus compa- ñeros. También permiten la comparación de los puntajes del estudiante en di- ferentes tipos de pruebas, como en el diagnóstico de problemas de aprendizaje.

Tipos comunes: a. Z-scores: Estas puntuaciones se escalan en una recta numérica que va desde -4 hasta 4 siendo cero en el medio. En esta escala, el cero es promedio . Re- sultados positivos son superiores a la media, y los resultados negativos son inferiores a la media. b. T-scores: Estos puntajes rango 10 – 90 en intervalos de 10 puntos. Cincuenta es la media en esta escala. c. Stanines: La escala stanine es también llamado el estándar de nueve escala. Estas calificaciones van de 1 – 9 con promedio de cinco. Las puntuaciones menores de cinco años están por debajo de la media. Las puntuaciones por encima de cinco años están por encima del promedio.

Un sistema de puntuación estándar es una conversión de puntuaciones Z, en un nuevo sistema que tiene una media (M) y una DE elegidas de manera arbitraria. Las nuevas M y DE suelen elegirse para que sean cifras fáciles de recordar como 50, 10 o 500 y 100, en pocos casos se buscan otras características deseables 16.

A fin de convertir una puntuación directa en una puntuación estándar, prime- ra se traducirá la puntuación directa en puntuación Z, luego se multiplicará la

16 HOGAN, Thomas Pruebas Psicológicas. Una introducción práctica. p. 59.

edu.red

Mn : Media en el sistema de puntuación natural. 70 Me: Media en el sistema de puntuación estándar. X : Puntuación natural Diagrama Objetivos Inicio Desarrollo de contenidos Actividades Autoevaluación LECTURA SELECCIONADAS N° I Lecturas Glosario Bibliografía seleccionadas

De Dr. Antonio Alva Santos. El aspecto más importante de la evaluación psicológica es la interpretación de los re- Recordatorio 1.

2. Puntuaciones La puntuación absoluta es el recuento numérico de respuestas acertadas. Presenta una utilidad muy limitada, ya que debe transformarse en una puntuación percentil (tanto por ciento de la población que queda por debajo del sujeto) o en una pun- tuación estándar (en desviaciones típicas por encima o por debajo de la media o promedio), puntuaciones que hacen referencia al promedio de la población.

Si un sujeto tiene un percentil 50, significa que el 50% de la población puntúa por debajo de él y el otro 50% por encima. Si es 80, significa que el 20% lo sobrepasa y el 80% está por debajo.

Las puntuaciones estándar dependen de la media o promedio y de la desviación típica.

La media se obtiene de la suma del conjunto de las puntuaciones dividida entre el número total de individuos.

La desviación típica o estándar es la raíz cuadrada de la media del cuadrado de las desviaciones.

Si una puntuación absoluta se resta de la media y se divide entre la desviación típica, nos da la puntuación estándar. Las tablas de normas, que se incluyen en los manuales de evaluación psicológica, indican la escala de puntuaciones absolutas previstas a partir de estudios en los que un determinado test ya ha sido aplicado a grandes grupos representativos de pobla- ción, y deben, por tanto, especificar cuáles eran las características de la muestra en cuanto a sexo, edad, ocupación y situación geográfica. Si las normas se han obtenido partiendo de un grupo de población distinto al del sujeto, no serán una buena referencia de comparación.

Validez En último término, la interpretación de las puntuaciones de un test supone hacer una predicción del comportamiento del sujeto en una situación determinada, por UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

puntuación Z por la nueva DE y se sumará la nueva media y se resume en la siguiente formula:

Fórmula N° 3:

Donde: PE : puntuación estándar deseada. DEe: Desviación estándar. DEn: Puntuación estándar en el sistema de puntuación natural

edu.red

CONSTRUCCIÓN DE INSTRUMENTOS PSICOLÓGICOS MANUAL AUTOFORMATIVO 71 3. Durante el proceso de construcción de un instrumento psicológico. La etapa del análisis de datos se presenta posterior a la aplicación del instrumento y finalizada la recolección de los datos, donde se procederá a aplicar el análisis de los datos para dar respuesta a las interrogantes de la investigación. Hevia (2001).

Luego de haber obtenido los datos producto de la aplicación de los instrumentos psicológico, se procederá a codificarlos, tabularlos, y utilizar la informática a los efectos de su interpretación que permite la elaboración y presentación de tablas y gráficas estadísticas que reflejan los resultados.

“El propósito del análisis es aplicar un conjunto de estrategias y técnicas que le permiten al investigador obtener el conocimiento que estaba buscando, a partir del adecuado tratamiento de los datos recogidos.” (Hurtado, 2000:181). Estrategias de análisis: 3.1 Programas de cómputo • SPSS • Minitab • SAS • STADTS 3.2 La matriz organizativa. 3.3 Análisis estadístico. 3.4 Descriptiva • Distribución de frecuencias • Medidas de tendencia central • Medidas de variabilidad • Graficas • Puntuaciones z UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

lo que si el test permitió realizar pronósticos acertados, se dice que tiene una gran validez (externa o predictiva).

Sin embargo, antes de que la validez sea probada nos debemos enfrentar a una cuestión previa: la fiabilidad, es decir, que mida siempre lo mismo, de un modo consistente, aun si son diferentes profesionales los que lo aplican.

Además de la fiabilidad, un test debe ser válido (que mida lo que debe medir) en al menos tres sentidos:

2.1 Validez interna: que los ítems incluidos en el test sean una muestra suficiente- mente representativa de los que eventualmente se podrían haber utilizado. Por ejemplo, en un test que consista en deletrear palabras, éstas deben presentar distintos grados de complejidad.

2.2 Validez externa o de criterio: se refiere a la capacidad del test para ajustarse a un hecho futuro o concurrente. Por ejemplo, un test de aptitudes artísticas tiene validez externa o predictiva si las puntuaciones más altas las obtienen quienes después tendrán mayor éxito en esa actividad. La validez de criterio de un nuevo test de inteligencia puede establecerse si sus puntuaciones tienen una estrecha correlación con las de un test clásico, de validez ya contrastada.

2.3 Validez de construcción: hace referencia a los rasgos o cualidades psíquicas que el test mide, demostrando que ciertas pautas del comportamiento humano son en cierto grado relevantes para puntuar en el test. Por ejemplo, un test que mida la necesidad de éxito debe demostrar que quienes puntúan más alto son los individuos que trabajan de forma más independiente, que persisten más en las tareas de resolución de problemas y que en situaciones competitivas obtienen los mejores resultados.

edu.red

72 UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

3.5 Inferencial • Estimar parámetros • Distribución muestral

3.6 Pasos • Reportar resultados • Análisis estadísticos de variables he hipótesis • Evaluar la confiabilidad y validez • Explorar datos • Ejecutarlo • Seleccionar el programa

3.7 Categorización analítica de los datos. a. Los datos que han sido recogidos con anterioridad, se sometieron a la clasi- ficación y codificación de esa forma lograr una nueva o mantener la actual interpretación de los hechos recogidos. b. Procesamiento de la información mediante la disposición de la masa de datos para organizarla y proceder a la ordenación de la información.

3.8 Calificación y tabulación de los datos. Tabulación de la información mediante tablas de resumen de resultados, donde se determinan los casos que encajan en las distintas sinergias.

3.9 Análisis e integración de los datos. a. Se relacionó y se compararon los contenidos documentales obtenidos e inte- grarlos en forma holística. b. Los procedimientos utilizados para realizar la tabulación, análisis y la interpre- tación de los datos recopilados fueron realizados a través de una herramienta tecnológica, motivo por el cual se recurrió a la asesoría de un profesional, experto en el área de estadística. Este profesional se encarga de asesorar en los procedimientos estadísticos utilizando el programa SPSS para Windows 7 .

Según Hurtado (2000) el propósito del análisis es aplicar un conjunto de estra- tegias y técnicas que le permitan al investigador obtener el conocimiento que estaba buscando, a partir del adecuado tratamiento de los datos recogidos. Este método permitirá clasificar y reclasificar el material recogido desde diferen- tes puntos de vista hasta que usted opte por el más preciso y convencional. El análisis permitirá la reducción y sintetización de los datos, se considera entonces la distribución de los mismos. (Tamayo, 1995).

3.10 Analizar los datos a. Decidir el programa de análisis de datos que se utilizara. b. Explorar los datos obtenidos en la recolección. c. Analizar descriptivamente los datos por indicador del constructo. d. Visualizar los datos por indicador. e. Evaluar la confiabilidad, validez y objetividad de los instrumentos de medi- ción utilizados. f. Analizar e interpretar mediante pruebas estadísticas las hipótesis planteadas (análisis Estadístico Inferencial). g. Evaluar y realzar la calidad de los datos. h. Describir la población de estudio y su relación con alguna supuesta fuente. i. Evaluar la posibilidad de sesgos (por ejemplo, no-respuesta, negativa a contes- tar, y desaparición de sujetos, grupos de comparación). j. Controlar y analizar los efectos de otros factores relevantes. k. Buscar una mayor comprensión de las relaciones observadas o no observadas. l. Evaluar el impacto o importancia.

edu.red

TEMA N° 3: ANALISIS DE LOS ITEMS Y LA FICHA TÉCNICA CONSTRUCCIÓN DE INSTRUMENTOS PSICOLÓGICOS MANUAL AUTOFORMATIVO 73 Diagrama Objetivos Inicio Desarrollo de contenidos

Lecturas seleccionadas Recordatorio Anotaciones ACTIVIDAD N° 1: Actividades Autoevaluación Esta actividad puede consultarla en su aula virtual.

Glosario Bibliografía 1 PODER DISCRIMINATIVO DEL ÍTEM 1.1 Análisis de los ítems Definición: análisis de ítems = estudio de las propiedades de los elementos (pre- guntas) de un test directamente relacionadas con las propiedades de éste (hacer inferencias sobre algún parámetro del test a partir de propiedades de los ítems) En esta etapa se establecen los criterios de adecuación de los ítems, los que más tarde serán nuevamente controlados en la fase de validación. Principalmente se trata aquí de explorar el grado de dificultad de las tareas o ítems que van a con- formar el test y de determinar la capacidad que estos muestran para discriminar la variable que se estudia. Existen dos tipos de análisis posibles: a. Análisis subjetivo: Realizado por un conjunto de expertos en la materia que el test va a evaluar, se trata de un proceso de eliminación de todos aquellos ítems que sean juzgados inconvenientes con base a una serie de criterios apa- rentes. Así, se descartarán mediante este proceso aquellos ítems que reflejen ambigüedad, constituyan una repetición innecesaria, guarden poca relación con el constructo a evaluar o una tengan una complejidad sintáctica excesiva. b. Análisis objetivo: Se realiza a partir del análisis estadístico de los ítems. Los criterios de selección varían en función de los supuestos del modelo a utilizar en su construcción. Si la prueba se construye con base en la teoría clásica de los test, los criterios de selección a tener en cuenta serán los índices de ho- mogeneidad, validez y dificultad del ítem; su poder discriminativo; y el coefi- ciente de fiabilidad del test. Si por el contrario, la prueba se construye bajo los supuestos de la teoría clásica de los test, los criterios de selección, según Hambleton y Swaminathan (1985) serán la dificultad y discriminación del ítem, la bondad de ajuste del ítem al modelo, y el grado deseado de la función de información del test 17.

1.2 índice de dificultad (ID) Es la proporción de sujetos que aciertan en relación con los que intentan resolver- lo: ID = A / N

El valor del índice de dificultad está directamente relacionado con la media del test: la media del test es igual a la suma de los índices de dificultad de los ítems:

Formula N° 4 n

i=1

Interpretación: a medida que el ID aumenta, el ítem es más fácil (en propiedad habría que llamarlo índice de facilidad); además, en muchos test no tiene sentido de hablar de ID, ej., los cuestionarios de personalidad, que no tienen respuestas acertadas o erróneas.

Limitaciones: el ID no es una propiedad intrínseca del ítem, su valor depende de la muestra de sujetos a la que se aplique (la solución la da la Teoría de Respuesta a los ítems)

17 Eduardo García Cueto. «La construcción de un test». Introducción a la psicometría. Madrid: Siglo XXI de España Editores. pp. 10-14. UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

edu.red

74 Donde: A: Número de sujetos que aciertan el ítem E: Número de sujetos que fallan el ítem K: Número de alternativas del ítem N: Número de sujetos que intentan resolver el ítem

La varianza de un ítem puede expresarse en términos de su ID: sj2 = PjQj, donde Pj sería la proporción de sujetos que aciertan el ítem (su ID) y Qj = (1 – Pj). (la dificultad media de los ítems maximiza su varianza)

1.3 índice de discriminación 18. Un ítem tiene poder discriminativo si distingue entre los sujetos que puntúan alto y los que puntúan bajo en el test (si permite distinguir entre sujetos eficaces frente a ineficaces).

índice de discriminación = correlación entre las puntuaciones de los sujetos en el ítem y sus puntuaciones en el test.

1.3.1 Cálculo • Correlación biserial-puntual (Pbp) (aplicación de la correlación de Pearson entre una variable dicotómica y otra cuantitativa; fórmula:

Fórmula N° 6 Donde: µp: media en el test de los sujetos que aciertan el ítem µx: media del test sx: desviación típica del test p: proporción de sujetos que aciertan el ítem q: (1 – p). Al calcular el índice de discriminación, a la puntuación total del test hay que descontarle el ítem cuyo índice de discriminación se pretende hallar (X – j); en caso contrario, se puede usar la siguiente corrección:

Formula N°7 A- E /(K -1) N ID = p q x µp -µx s 2 ?bp = 18 Ramos-álvarez, Manuel, (2005)Análisis de ítems de pruebas, tercera edición. j x ? jxs x -s j s 2 +s 2 -2? jxs js x ? j(x- j) = UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

En ítems de elección múltiple, para corregir los efectos del azar, se suele utilizar la siguiente fórmula:

Fórmula N° 5

edu.red

? – = j x j j x ) ( ? s s CONSTRUCCIÓN DE INSTRUMENTOS PSICOLÓGICOS MANUAL AUTOFORMATIVO 75 UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

Donde: ?j(x-j): Correlación entre el ítem j y el test tras descontar el ítem (x – j) ?jx: Correlación ítem-test cuando el ítem está incluido en el test sx: Desviación típica del test sj: Desviación típica del ítem

• Correlación biserial (?b): se usa cuando una variable no dicotómica se dicotomiza (se pierde información)

Fórmula N° 8

µ p -µx p ?b = s x y

Dónde: µp: media en el test de los sujetos que aciertan el ítem µx: media del test sx: desviación típica del test p: proporción de sujetos que aciertan el ítem y: ordenada correspondiente al valor de la puntuación típica en la curva normal que deja por debajo un área igual a p Notas: es una estimación de la correlación de Pearson, y puede dar valores superiores a 1 si alguna de las variables es platicúrtica o bimodal.

La relación entre ?bp y ?b viene dada por: • Coeficiente phi (f): es la correlación de Pearson para dos variables dico- tómicas • Correlación tetracórica: ambas variables dicotomizadas y se asumen distri- buidas normalmente • índice basado en las proporciones de aciertos:

Fórmula N° 8

d = Pc – Pi

dónde: Pc: proporcióndesujetoscompetentes(puntúan>Md)queaciertanelítem Pi: proporción de sujetos incompetentes que también aciertan el ítem

1.3.2 Relación con algunos parámetros del test 19 a) Variabilidad: la desviación típica del test está estrechamente relaciona- da con el índice de discriminación de los ítems

Fórmula N° 9 n

j=1

19 Ramos-álvarez, Manuel, (2005)Análisis de ítems de pruebas, tercera edición.

edu.red

s x =? PjQj? j(x- j) n ? n-1? ?s 2 j (?s j? j(x- j)) ? ? ? n ? n-1? ? ?P (1- P ) ? [?? ] Pj(1-Pj) ? ? 76 Sustituyendo: Donde Pj es la proporción de sujetos que aciertan el ítem (su ID)

b) Fiabilidad: la fiabilidad de un test puede expresarse en:

Fórmula N° 12 O en el caso de que los ítems sean dicotómicos:

Fórmula N° 13 2 En suma, los parámetros de los test, poder discriminativo (sx) y fiabilidad (a) pueden expresarse en términos del índice de dificultad de los ítems (Pj) y de su índice de discriminación (?jX).

FICHA TÉCNICA Es toda la información básica del test cuya estructura es la siguiente:

FICHA TECNICA • NOMBRE ORIGINAL: Nombre a partir del constructo • APARICIÓN: Origen • AUTORES: • OBJETIVO: responde el para qué o el propósito clínico, educativo u organiza- cional. • VALIDEZ DE CONTENIDO: • ADMINISTRACIÓN: Puede ser individual o colectivo. • DURACION: Es variable, de 15 a 20 minutos aproximadamente por ejemplo. • APLICACIÓN: Personas que pertenecen al ámbito laboral de los diferentes sec- tores (ambos sexos). • SIGNIFICACION: Apreciación de los indicadores y situaciones de medida. • TIPO DE ITEMS: ítems verbales distribuidos por cada uno de los indicadores. • PROCEDENCIA: • AREA DE APLICACIÓN: Por ejemplo Laboral, clínica o educativa Fórmula N° 10

s j = PjQj = Pj(1- Pj) Fórmula N° 11 n

j=1 ? 2 ?1- ? a = ?

? ? 2 ? 1- jX j j a = UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

dónde: sX: desviación típica del test sj: desviación típica del ítem j ?j(x-j): índice de discriminación del ítem j Si los ítems son dicotómicos, su desviación típica vendrá dada por:

edu.red

CONSTRUCCIÓN DE INSTRUMENTOS PSICOLÓGICOS MANUAL AUTOFORMATIVO 77 UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

TEMA N° 4: RESPUESTA A LOS ÍTEMS En Los modelos y procedimientos de medición encontramos dos teorías la denominada Teoría clásica del test y la Teoría de respuesta a los ítems (TRI). 1 TEORÍA CLÁSICA DE RESPUESTA A LOS ÍTEMS. Asumen que las diferencias en las respuestas de los individuos a un test se deben única y exclusivamente, a la variación en la “capacidad” ( actitud, percepción, opi- nión, disposición, etc. ) de los evaluados.

Por consiguiente, todas los demás factores de variación, como las diferencias en el grado de dificultad de las preguntas que forman el test, las condiciones externas o las circunstancias personales) se consideran constantes o, a lo mucho, un efecto aleatorio.

Esto es uno de los inconvenientes de la Teoría clásica del test, que fue iniciada con los estudios de Spearman (1904) y desarrollada con la formulación axiomática de Novick (1966).

Además, esta teoría define el concepto de capacidad en función de cada test par- ticular, de tal forma que cuando un test es “difícil” el individuo tendrá baja capaci- dad, mientras que cuando un test es “fácil” el individuo tendrá elevada capacidad. Esta teoría clásica define la dificultad de un ítem como “la proporción de indivi- duos del grupo que responde correctamente al ítem”. Es decir, la mayor o menor dificultad de un ítem depende de la capacidad de los individuos, dicho a la inversa, la capacidad de los individuos depende de si los ítems utilizados en el test son fáciles o difíciles.

La teoría clásica gira en torno al test en su conjunto, y no en torno a cada ítem particular que lo forma. Es decir, el valor alcanzado por el individuo en el test sólo permite valorar su capacidad global ante dicho test, pero impide llegar a un análisis individual de cada ítem. Por lo tanto, no es posible, realizar predicciones sobre el comportamiento delos individuos ante un ítem concreto o responder a la pregunta de cuál es la probabilidad de que un individuo responda de forma correcta a un ítem determinado.

Este cúmulo de inconvenientes de la teoría clásica del test recomienda la utiliza- ción de una metodología de medición alternativa que permita, entre otras cosas, lo siguiente: a. Que las características de los ítems no sean dependientes de los individuos que responden al test. b. Que los valores obtenidos por los individuos al realizar el test no sean depen- dientes de éste último. c. Que el análisis se realice a nivel de ítem, en lugar de hacerlo a nivel de test. d. Que no sean necesarios test paralelos para verificar la fiabilidad del test. Respondiendo a esta alternativa tenemos la Teoría de respuesta a los ítems.

2 LA TEORÍA DE RESPUESTA AL ÍTEM. Analiza el comportamiento de los test, no a un nivel del test en conjunto, sino al nivel de cada ítem. En el caso más simple, las respuestas a cada ítem se pueden codi- ficar como respuesta “correcta” o como respuesta “incorrecta”, de tal forma que si se asocia una variable Uij para representar la respuesta del individuo j al ítem i, esta variable tomará el valor1 si la respuesta es correcta, y 0 si la respuesta es incorrecta.

La probabilidad de responder correctamente al ítem i dependerá del parámetro ?, que es valor que toma la capacidad (latente) de cada individuo1. De esta forma, los individuos que posean escasa capacidad latente tendrán probabilidades más bajas de responder correctamente al ítem que aquellos otros individuos con una elevada capacidad latente. Por consiguiente, la probabilidad Pi (?) es una función monó-

edu.red

78 3 ESCALA LIKERT Y DIFERENCIAL SEMÁNTICO. 3.1 ESCALA DE LIKERT. La escala de tipo Likert (también denominada método de evaluaciones suma- rias) es una escala psicométrica comúnmente utilizada en cuestionarios, y es la escala de uso más amplio en encuestas para la investigación, principalmente en ciencias sociales. Al responder a una pregunta de un cuestionario elaborado con la técnica de Likert, se especifica el nivel de acuerdo o desacuerdo con una declaración (elemento, ítem o reactivo o pregunta). La escala se llama así por Rensis Likert, quien publicó en 1932 un informe donde describía su uso.

a. Elaboración de la escala: Preparación de los ítems iniciales; se elaboran una serie de enunciados afir- mativos y negativos sobre el tema o actitud que se pretende medir, el número de enunciados elaborados debe ser mayor al número final de enunciados incluidos en la versión final.

Administración de los ítems a una muestra representativa de la población cuya actitud deseamos medir. Se les solicita a los sujetos que expresen su acuerdo o desacuerdo frente a cada ítem mediante una escala.

Asignación de puntajes a los ítems; se le asigna un puntaje a cada ítem, a fin de clasificarlos según reflejen actitudes positivas o negativas.

Asignación de puntuaciones a los sujetos; la puntuación de cada sujeto se obtiene mediante la suma de las puntuaciones de los distintos ítems.

Análisis y selección de los ítems; mediante la aplicación de pruebas estadís- ticas se seleccionan los datos ajustados al momento de efectuar la discrimi- nación de la actitud en cuestión, y se rechazan los que no cumplan con este requisito.

b. Ejemplo de pregunta formulada con un elemento de tipo Likert de 5 puntos Hay que hacer una distinción importante entre escala de tipo Likert y ele- mento de tipo Likert. La escala es la suma de las respuestas de los elemen- tos del cuestionario. Los elementos de tipo Likert van acompañados por una escala visual análoga (por ejemplo, una línea horizontal, en la que el sujeto indica su respuesta eligiéndola con un círculo); a veces se llama escalas a los elementos mismos. ésta es la razón de muchas confusiones y es preferible, por tanto, reservar el nombre de escala de tipo Likert para aplicarlo a la suma UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

tonamente creciente del parámetro ?. Esta función es conocida con el nombre de función de respuesta al ítem o curva característica de ítem (CCI).

Además del parámetro ?, la probabilidad Pi (?) va a depender también, en fun- ción del modelo que se proponga para su estimación, de otros dos parámetros, ai? (-8;+8) y bi? (-8;+8) , conocidos con el nombre de parámetro de discriminación y parámetro de dificultad, respectivamente. El parámetro de dificultad es aquel punto de la escala latente de capacidad para el cual la probabilidad de responder correctamente al ítem es, exactamente, del 50 %. En realidad, este parámetro es un parámetro de localización, puesto que indica la posición de la CCI en la escala latente. Así, cuanto mayor sea el valor de bi, mayor será también la capacidad necesaria para que un individuo tenga una probabilidad de 0,5 de responder correctamente al ítem en cuestión, lo cual significa que los ítems “difíciles” tendrán una CCI situada en el extremo superior de la escala de capacidad, mientras que la CCI de los ítems “fáciles” se ubicará en el extremo in- ferior de dicha escala. Cuando los valores de capacidad se estandarizan, los valores de bi suelen variar de -2 a +2, de manera que valores de bi próximos a -2 indican una extrema facilidad del ítem, mientras que valores próximos a +2 denotan una elevada dificultad.

edu.red

CONSTRUCCIÓN DE INSTRUMENTOS PSICOLÓGICOS MANUAL AUTOFORMATIVO 79 UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

de toda la escala, y elemento de tipo Likert para referirse a cada elemento individualmente.

Un elemento de tipo Likert es una declaración que se le hace a los sujetos para que éstos lo evalúen en función de su criterio subjetivo; generalmente se pide a los sujetos que manifiesten su grado de acuerdo o desacuerdo. Normal- mente hay 5 posibles respuestas o niveles de acuerdo o desacuerdo, aunque algunos evaluadores prefieren utilizar 7 a 9 niveles; un estudio empírico re- ciente demostró que la información obtenida en escalas con 5, 7 y 10 niveles posibles de respuesta muestra las mismas características respecto a la media, varianza, asimetría y curtosis después de aplicar transformaciones simples.

El formato de un típico elemento de Likert con 5 niveles de respuesta sería:

• Me gusta el cine: Muy de acuerdo 5 Algo de acuerdo 4 Ni de acuerdo ni en desacuerdo 3 Algo en desacuerdo 2 Muy en desacuerdo 1

La escala de Likert es un método de escala bipolar que mide tanto el grado positivo como neutral y negativo de cada enunciado.

La escala de Likert, al ser una escala que mide actitudes, es importante que pueda aceptar que las personas tienen actitudes favorables, desfavorables o neutras a las cosas y situaciones lo cual es perfectamente normal en térmi- nos de información. Debido a ello es importante considerar siempre que una escala de actitud, que puede y debe estar abierta a la posibilidad de aceptar opciones de respuesta neutrales.

Ejemplo: "La política exterior de los Estados Unidos afecta a la política de Sudamérica."

Totalmente de acuerdo 5 De acuerdo 4 Ni de acuerdo ni en desacuerdo 3 En desacuerdo 2 Totalmente en desacuerdo 1

c. Puntuación y análisis Después de completar el cuestionario, cada elemento se puede analizar por separado o, en algunos casos, las respuestas a cada elemento se suman para obtener una puntuación total para un grupo de elementos. Por ello las escalas de tipo Likert son un tipo de escalas sumativas.

Se considera una escala de tipo ordinal, ya que no podemos asumir que los sujetos perciban las respuestas como equidistantes, aunque podría asumirse si cada elemento se acompaña de una escala visual horizontal en la cual deba marcar su respuesta, y en la que cada respuesta esté situada de forma equi- distante.

Cuando los datos se tratan como ordinales, es posible calcular la mediana y la moda (pero no la media). La dispersión se calcula por medio del intervalo entre cuartiles (no es posible calcular la desviación típica), o puede anali- zarse mediante técnicas no paramétricas, la prueba de Mann – Whitney. Las respuestas a los elementos se puede sumar, y hay que tener en cuenta que

edu.red

80 •

• Las escalas de Likert presentan un sesgo si observamos su distribución de frecuencias. Las aprobaciones siempre superan a las desaprobaciones, independientemente de las afirmaciones planteadas. Esto significa que las expresiones de (des) acuerdo no son equidistantes. También está comprobado empíricamente que declararse “de acuerdo” con cualquier frase de la batería Likert, implica un menor esfuerzo psí- quico por parte del entrevistado. La respuesta neutral “ni de acuerdo ni en desacuerdo”, que es la posición central de la escala, es asociada con el “acuerdo moderado”, y no con la respuesta “indeciso” (como muchos creen). Muchos entrevistados perci- ben que declararse “indeciso” es negativo y por ello tienden a desplazarse más cerca de las posiciones de acuerdo. Además los entrevistados perci- ben que entre las posiciones de acuerdo hay más distancia que entre las del desacuerdo (ver cuadro). Al tratarse de una escala ordinal, no permite conocer con precisión la “cantidad” de acuerdo o desacuerdo. Esto impide sumar sus valores in- ternamente, ya que no se pueden sumar los números ordinales (primero más segundo no es igual a tercero). Esto suele realizarse erróneamente, y provoca una distorsión porque se suman los números naturales a los que se le atribuyen cinco grados de acuerdo/desacuerdo, y se asigna al entre- vistado un puntaje total que expresa su (supuesto) estado (ver gráfico). La escala de Likert tiene un inconveniente relacionado con la compren- sión de las frases evaluadas por el entrevistado: una afirmación puede ser desaprobada por motivos diversos. Si no se incluye una pregunta de respuesta abierta para conocer cuáles son las causas – generalmente para reducir costos de la investigación – se corre el riesgo de asignar los mismos puntajes a dos opiniones diferentes (y que incluso pueden ser opuestas). Este es el denominado problema de la “curvinealidad”. Por lo general, los entrevistados al escuchar la afirmación leída por el entrevistado, tienden a reaccionar a un solo término de la frase: al objeto o al sujeto que ese término está designando. Este fenómeno ha sido de- nominado “Reacción al objeto”. (Ej: En la afirmación “El alcohol solo en mínimas cantidades es perjudicial para la salud”, se tenderá a relacionar los términos “El alcohol” y “es perjudicial para la salud”.) Por último, se suele reducir la fidelidad/confianza de las respuestas cuan- do se organizan las frases en largas baterías (por ejemplo, una debajo de la otra). Esto es aplicable no sólo a la escala de Likert sino también a otras técnicas. Para evitar este fenómeno llamado “Response Set” es con- veniente intercalar afirmaciones opuestas en la misma batería.

Los entrevistados perciben que declararse “indeciso” es negativo y por ello UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

todos los elementos deben medir lo mismo (por ejemplo, la actitud hacia los extranjeros). Podría aplicarse un análisis de varianza.

En la mayoría de las investigaciones, cuando se evalúan actitudes y opiniones, se suele utilizar la escala de Likert. Esta escala se difundió ampliamente por su rapidez y sencillez de aplicación, desde su desarrollo en 1932.

La escala de Likert es de nivel ordinal y se caracteriza por ubicar una serie de frases seleccionadas en una escala con grados de acuerdo/desacuerdo. Estas frases, a las que es sometido el entrevistado, están organizadas en baterías y tienen un mismo esquema de reacción, permitiendo que el entrevistado aprenda rápidamente el sistema de respuestas.

La principal ventaja que tiene es que todos los sujetos coinciden y comparten el orden de las expresiones.

d. ¿Cuáles son las desventajas de emplear la Escala de Likert?

edu.red

CONSTRUCCIÓN DE INSTRUMENTOS PSICOLÓGICOS MANUAL AUTOFORMATIVO 81 MUY DE ACUERDO ALGO DE ACUERDO NI DE ACUERDO NI EN DESACUERDO 5 4 3 _______________________________________________________ ALGO EN DESACUERDO MUY EN DESACUERDO 2 1 3.2 DIFERENCIAL SEMáNTICO. a. Antecedentes Teóricos. El método es descrito por los autores como un método para medir el signi- ficado que tiene un objeto para un individuo 20.

OSGOOD 21 supone que existe un espacio semántico de dimensionaldad desconocida y de naturaleza geométrica. El espacio está constituido de escalas semánticas. Cada escala consiste de un par de adjetivos que son bipolares.

Se supone que estas escalas forman una función lineal que pasa a través del origen, para estar en condiciones de definir el espacio adecuadamente, es necesario usar una gran cantidad de escalas que son una muestra represen- tativa extraída del universo de escalas.

Para diferenciar el significado de un objeto, el individuo hace una elección entre las alternativas dadas, la función de cada elección es localizar cada objeto en el espacio semántico, la validez de la localización de este punto en el espacio depende del número y representatividad de las escalas.

De este modo, la diferencia semántica significa la estabilización sucesiva de un objeto hasta un punto en el espacio multidimensional semántico, a través del puntaje de un número de alternativas semánticas dadas presen- tadas en forma de escalas. Una diferencia de significado entre dos objetos es simplemente una función de las diferencias de su ubicación en el mismo espacio, es decir, una función de la distancia multidimensional entre dos puntos.

b. Dimensiones en el Espacio Semántico. OSGOOD dio gran importancia al muestreo, el diferencial semántico está influido por tres fuentes de variación: el individuo, las escalas y los objetos.

OSGOOD llego a la conclusión de que la estructura del factor no depen- día de la elección de escalas, el seguir 3 factores de hecho explico la mayor parte de la varianza total, mientras otras dimensiones solo explicaban una pequeña parte de ellas.

• Dimensiones – La evaluación que hace el individuo del objeto o concepto que se está POSITIVO NEGATIVO clasificando.

20 URBAN FERNANDEZ, Francisco. Un método de investigación de origen psicolingüístico. 21OSGOOD, C E. "Semantic differential technique in the comparative study of cultures", en. American Anthro- pologist, n. 66, 1964, pp. 171-200 UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

tienden a desplazarse más cerca de las posiciones de acuerdo.

NEWSLETTER No es conveniente sumar o contar con un promedio de respuesta

edu.red

82 –

– La percepción del individuo, de la potencia o poder del objeto o con- cepto. Ejemplo escalas: grande – chico; fuerte – débil; pesado – liviano. La percepción del individuo de la actividad del objeto o concepto. Ejemplo escalas: activo – pasivo; rápido – lento; frio – caliente.

c. Construcción. El método para el diferencial semántico debe ser visto como un método para reunir cierto tipo de información (un método que pude ser generali- zado), el cual tiene que constituirse por las demandas que presenta cierto problema de investigación. • selección del objeto (concepto): “objeto” se usa para determinar que significa el “estimulo” que da ”reacción” (respuesta) en el individuo a través de su indicación en las escalas de adjetivos. El objeto puede ser verbal; puede consistir de solo una palabra o de varias palabras. Objetos no – verbales pueden ser diferenciados (cuadros u otros estí- mulos estéticos). El investigador deberá pensar en elegir objetos que se supone darán: –

– Diferencias individuales (para poder estudiar la variación en el ma- terial) Que tengan un solo significado (de otra manera hay riesgo de vaci- lación en la elección). Se supone que todos los individuos lo conozcan bien (de otro modo habrá regresión al medio de la escala).

d. Selección de escalas. Al seleccionar las escalas debe estar seguro de tener los tres factores: eva- luación, potencia y actividad representada.

Para cada factor uno puede seleccionar cierta cantidad de escalas correla- cionadas y a través de estas obtener el promedio de las escalas. Esto aumen- tara la representatividad y la confiabilidad.

Los promedios son llamados factor scores. El criterio más importante para la selección de escalas así es su patrón factorial (generalmente se seleccio- nan tres escalas para cada factor. Las escalas elegidas cargadas en ese factor son bajas en los otros).

Otro criterio es la relevancia de las escalas al objeto. Las escalas con com- posición factorial desconocida pueden ser usadas si se suponen ser muy relevantes para la investigación. En este caso uno puede incluir escalas con composición factorial conocida y usarlas como escalas de referencia y estudiar como las escalas “desconocidas” co varían con las escalas de re- ferencia.

e. El test de OSGOOD y la medición de actitudes. Tal como se ha hecho notar el test de OSGOOD no es una escala de acti- tudes en el sentido corriente, sino que las investigaciones han demostrado que los valores de escala pueden ser usados para la medición de actitudes. La actitud general se mide pero no el contenido de la actitud en el signi- ficado denotativo. UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

Ejemplo escalas bipolares: regular – irregular; limpio – sucio; bueno – malo; valioso – despreciable.

edu.red

Si considera que indica rigidez pero en menor grado, marcaria en: CONSTRUCCIÓN DE INSTRUMENTOS PSICOLÓGICOS MANUAL AUTOFORMATIVO 83 FLEXIBLE NEGATIVO DELICADO —; —; —; —; —; —; —; —; —; —; —; —; —; —; —; —; —; —; —; —; —; RIGIDO. POSITIVO. RUDO. FLEXIBLE —; —; —; —; —; X —; RIGIDO. Diagrama Objetivos Inicio Desarrollo de contenidos Actividades Autoevaluación LECTURA SELECCIONADAS N° 2 Lecturas Glosario Bibliografía seleccionadas

De Anastasi, A 24.

Recordatorio Anotaciones Constituye un nuevo enfoque en Psicometría que permite superar algunas de las limitaciones de la Teoría Clásica de los test (TC).

Su propósito es similar al de la Teoría clásica. Pretende obtener la puntuación que corresponde a una persona en una dimensión o rasgo, como su inteligencia, su nivel en un rasgo de personalidad, su dominio en una materia, etc.

La TRI debe su nombre a que se centra más en las propiedades de los ítems indivi- duales que en las propiedades globales del test, como hacía la TC.

Lo que vamos a aprender en esta lectura seleccionada sólo es aplicable a ítems que puedan cuantificarse como cero o uno. La TRI permite también el análisis de ítems con otros formatos de respuesta (por ejemplo, las categorías ordenadas), pero no son tratados en esta lectura.

Buena parte de la Psicometría actual está relacionada con la TRI para ampliar tus conocimientos, puedes consultar los libros de Muñiz (1997), Hambleton, Swami- nathan y Rogers (1991) y Hambleton y Swaminathan (1985).

Entre las principales limitaciones de la TC se pueden exponer las siguientes: a. La principal limitación consiste en que las características del test y las puntua- ciones delas personas no pueden ser separados: Se define la puntuación de una persona como el número de preguntas que acierta, y la dificultad de un ítem

22 OSGOOD, C E. "Semantic differential technique in the comparative study of cultures", en. American Anthro- pologist, n. 66, 1964, pp. 210-223. 23 OSGOOD, C E. "Semantic differential technique in the comparative study of cultures", en. American Anthro- pologist, n. 66, 1964, pp. 234-276. 24 ANASTASI, A, 1998. México, “Test Psicológicos” PRENTICE HALL, p.187 UNIDAD III: “CONOCIENDO LAS NORMAS DE PUNTUACIÓN”

OSGOOD 22 piensa que con la ayuda de los valores de escala es posible formar una escala universal que podría ser usada para medir la actitud hacia cualquier objeto. La ventaja seria: 1) económica (tiempo, dinero, trabajo).2) disponible y así hacer la medición de actitudes que no han sido previstas. 3) posibilidad para comparar entre diferentes investigaciones de actitud y actitud hacia diferentes objetos.

El procedimiento consiste en señalar con una x en la escala el lugar en el cual usted ubicaría su opinión acerca del texto. Por ejemplo: la palabra fanático podría ser evaluada en las siguientes es- calas 23:

edu.red

84 –

– Las características de los ítems dependen del grupo de personas en el que se han aplicado. La puntuación de una persona depende del conjunto particular de ítems administrados. La puntuación que una persona obtenga será diferente si le aplicamos dos test que midan la misma característica pero cuyo nivel de dificultad sea dife- rente. Esto hace muy difícil comparar dichas puntuaciones, que sólo podrán interpretarse en relación al test en el que fueron obtenidas. Frente a la TC, una de las propiedades de la TRI es su invarianza, en un doble sentido: invarianza de los ítems respecto a posibles diferentes distribuciones de la habilidad o del rasgo (en lo sucesivo nivel de habilidad y de rasgo serán sinó- nimos), e invarianza de la habilidad medida a partir de diferentes conjuntos de ítems. Haremos un breve comentario sobre cada tipo de invarianza.

Si las condiciones de aplicación de la TRI se cumplen, ha de ocurrir lo siguiente: –

– Sea cual sea la distribución de los niveles de rasgo obtendremos las mismas estimaciones

Partes: 1, 2, 3, 4, 5
 Página anterior Volver al principio del trabajoPágina siguiente