Manual de construcción de instrumentos psicológicos (página 2)

Partes: 1, 2, 3, 4, 5

24 2 LA MEDICIÓN EN PSICOLOGÍA, TEORÍAS E INSTRUMENTOS DE MEDICIÓN: RESEÑA HISTÓRICA La revisión de los antecedentes históricos y de la evolución de la medida en Psico- logía, ofrece una perspectiva útil para comprender la Psicometría actual. Para algu- nos autores, la historia de los tests mentales es tal vez uno de los mejores ejemplos de la existencia de una interacción entre las demandas sociales y la evolución de una disciplina científica. Salvando las distancias, la valoración es aplicable al con- junto de la historia de la medida en Psicología.

La historia de la medición psicológica ha estado marcada por la interrelación entre la evolución interna de la Psicometría y de la Psicología con el deseo de responder a las demandas sociales de cada momento histórico, reflejando un mayor acento en las aplicaciones prácticas que en el desarrollo teórico.

Este apartado pretende esbozar el entorno intelectual y social en el que nace la Psicología moderna y con ella la Psicometría. A continuación, sólo se aborda una de las dos líneas de trabajo que más trascendencia han tenido para la evolución de la Psicometría: el estudio de las diferencias individuales; para la otra línea: la Psico- física, se puede recurrir a la bibliografía complementaria del tema.

Para hablar del origen y desarrollo histórico de los instrumentos de evaluación psicológica tenemos que remontarnos a la época en que se constituye la Psicología como ciencia independiente; este hecho está muy ligado al nombre de Wilhelm Wundt (1832-1920), psicólogo alemán, al que algunos autores consideran el padre de la Psicología. Wundt, a finales del siglo XIX crea el primer laboratorio de psico- UNIDAD I: “EVALUACIÓN Y MEDICIÓN EN PSICOLOGÍA”

1.11.3 Producción del Lenguaje a. Planificación b. Formulación c. Articulación

1.12 ACTITUDES La actitud es una tendencia psicológica que se expresa mediante la evaluación de una entidad (u objeto) concreta, con cierto grado de favorabilidad o des favorabilidad. Se trata de un estado interno de la persona. No es una respuesta manifiesta y observable. Se concibe como algo que media entre los aspectos del ambiente externo (estímulos), y las reacciones de las personas (respuestas evaluativas manifiestas). (Eagly y Chaiken, 1989)

1.12.1 Características: a. La actitud apunta siempre "hacia algo". Según Eagly y Chaiken, cual- quier cosa que se pueda convertir en objeto de pensamiento, también es susceptible de convertirse en objeto de actitud. b. Por ser un estado interno, actúa como mediador entre las respuestas de la persona y su exposición a los estímulos del ambiente social. c. La actitud es una variable latente: a ella subyacen procesos psicológicos (proceso de categorización) y fisiológicos. Según Eagly y Chaiken, la actitud no es ese proceso de categorización, sino su resultado. Una vez llevado a término el proceso de categorización, lo que subsiste es un estado interno evaluativo, es decir la actitud.

1.13 IMITACIóN La imitación cumple un papel muy importante en el proceso de aprendizaje, habilidad que tenemos para guardar imágenes en nuestra mente y lenguaje, todo esto es de especial relevancia, tanto para analizar los efectos de los me- dios, como instrumentos observados, productores de imágenes ambientales, así como también conocer los mecanismos de modelado social a partir de los medios.

edu.red

CONSTRUCCIÓN DE INSTRUMENTOS PSICOLÓGICOS MANUAL AUTOFORMATIVO 25 UNIDAD I: “EVALUACIÓN Y MEDICIÓN EN PSICOLOGÍA”

logía experimental (1879); en ese laboratorio estudia las cualidades y los procesos psíquicos de forma aislada, mediante técnicas de laboratorio. Sin embargo, en ese mismo tiempo, y también anterior a Wundt, existían otras ideas acerca del estudio de los fenómenos psíquicos, pero desde una óptica diferente a lo que planteaba el psicólogo alemán; esas otras ideas referían que si bien todas las personas son muy parecidas en cuanto a sus procesos psíquicos – memoria, atención, inteligen- cia, emociones, etc. – también son diferentes en relación a esos mismos procesos psicológicos en los cuales son semejantes. Un grupo de psicólogos se interesó en el estudio de los procesos psicológicos como lo hiciera Wundt, y otros se inclinaron por el estudio de las diferencias observadas en esos mismos procesos psíquicos, de unas personas a otras. Es precisamente esta idea sobre las diferencias entre las personas, y el cómo medir dichas diferencias lo que da origen al surgimiento de los instrumentos de evaluación psicológica.

Acerca de esta idea sobre las diferencias entre las personas hay material escrito, mucho tiempo anterior a Wundt. Citamos, por ejemplo, entre los trabajos de mayor importancia que antecedieron al estudio científico de las diferencias en evaluación psicológica Examen de ingenios para las ciencias, de Juan Huarte de San Juan, en España, 1575. Este examen establece la diferencia entre las personas en cuanto a talentos, lo que permite clasificar a cada sujeto en una categoría básica para prede- cir su comportamiento y capacidad para el aprendizaje y de ese modo adecuar las características de las personas a las distintas clases de ocupación. Como se aprecia, tales ideas han estado presentes desde tiempos muy antiguos, pero la evaluación psicológica no se constituye en saber y disciplina independiente hasta el siglo pa- sado.

(….al hablar de la historia del Psicodiagnóstico, diferencia las fuentes del mismo de su constitución como disciplina científica. Distingue la prehistoria de la historia, de acuerdo a determinados ejes de referencia: en la primera sobresalen los grandes paradigmas del conocimiento humano (mítico, racional-especulativo y científico), y en la segunda, los grandes modelos psicológicos (experimental, correlacional y aplicado). 5

2.1 Estudio de las diferencias individuales Debemos advertir de una doble simplificación. Primera, dejar a un lado, por razones de tiempo, la Psicofísica impide lograr una visión comprehensiva de la historia de la medición en Psicología; segunda, la que vamos a cometer en este apartado, reducir la historia del estudio de las diferencias individuales a la historia de los test psicológicos y presentarla recurriendo a las aportaciones de algunas figuras clave. La última es reduccionista pero difícil de evitar: gran parte de la Psicometría actual no se puede comprender sin atender a los antecedentes y orígenes históricos de los test psicológicos y de la medida de la inteligencia.

El rápido progreso económico y social en la Europa de finales del siglo XIX planteó la necesidad de evaluar las capacidades y conocimientos de los indivi- duos en contextos educativos, laborales, etc. Si la Filosofía y la Fisiología fueron las disciplinas que más influyeron en el trabajo de los primeros psicofísicos, el impacto más dramático sobre el estudio de las diferencias individuales vino de la Biología. Al tiempo que Fechnner presentaba sus trabajos, Darwin (1809-1882) presentó su teoría en La Evolución de las Especies (1859) y su aplicación al estudio del hombre en El origen del hombre y la selección en relación al sexo (1871). Darwin defendió que la inteligencia y el sentido moral también se ha- bían ido perfeccionando de manera gradual a través de la selección natural. Al defender esta idea Darwin no hacía sino reflejar la visión científica y la opinión popular dominante en la Inglaterra del siglo XIX, que justificaba el colonialismo y el sistema de clases bajo la creencia de que el hombre de letras inglés de clase media era el pico de la evolución humana (Rusty Golombok, 1989).

No es exagerado afirmar que las necesidades de la evaluación educativa fueron

5 Fernández Ballesteros (1993)

edu.red

26 UNIDAD I: “EVALUACIÓN Y MEDICIÓN EN PSICOLOGÍA”

las primeras demandas sociales con un impacto significativo y duradero en la evolución del estudio de las diferencias individuales y, por ende, de la Psico- metría. Los intentos por medir la inteligencia como respuesta a esas demandas caminan de la mano de los desarrollos metodológicos durante este periodo.

Thorndike (1937) señala al movimiento hacia la educación obligatoria en Fran- cia, Inglaterra y Estados Unidos a finales del siglo XIX, como uno de los desarro- llos críticos que propiciaron la medida de la inteligencia. La llegada por primera vez a las escuelas de niños cuyos padres no había recibido una educación o, como en el caso americano, cuya lengua materna no era el inglés, generó una heterogeneidad en la población de alumnos como antes no se había conocido. La exposición de estos niños a un currículo antiguo, diseñado para un grupo selecto de estudiantes, trajo como resultado niveles dramáticos de fracaso esco- lar próximos al 50%. Este fracaso fue visto como una pérdida de recursos en un tiempo en que eran limitados, de forma que se planteó la necesidad de destinar los recursos a quienes más se pudieran beneficiar, el medio: la evaluación de la inteligencia. Este es el contexto en el que se debe situar la obra de Binet.

Los pioneros de la Psicología llevaban años intentando una formulación acep- table de la inteligencia. Según Rust y Golombok (1989) los primeros autores tenían unas definiciones de la inteligencia que no iban más allá de lo que podría ser la psicología popular del maestro común de escuela. Se reconocía la dife- rencia entre una persona educada y una persona inteligente, entendiendo esta última como una persona "educable", con un origen esencialmente genético y receptora ideal de los recursos educativos, frente a los "torpes" incapaces de beneficiarse de la educación normal.

Entre los pioneros en el estudio de las diferencias individuales destaca el consi- derado por muchos autores, como el fundador de la Psicometría: Francis Galton. Primo de Darwin, inició sus investigaciones llevado por el objetivo de mostrar el componente hereditario del "genio". Para ello reunió el primer banco con los datos de personas relacionadas y no relacionadas. Influido por el asociacionismo de Locke y llevado por sus observaciones de que las personas con deficiencias mentales presentaban una peor ejecución a la hora de discriminar sensaciones de frío, calor, dolor, etc., pensó que la discriminación sensorial podía ser el me- dio para cuantificar el intelecto de una persona. Sus aportaciones propiamente metodológicas abarcan la formulación de las bases de procedimientos estadís- ticos, como el "coeficiente de correlación" desarrollado por K. Pearson (1857- 1936}, las intuiciones sobre la forma de "campana", como imagen para describir la distribución de puntuaciones en un test, así como las primeras aplicaciones de las escalas de "rating" y los métodos de cuestionario (Anastasi y Urbina, 1997).

J. M. Catell (1860-1944} trabajo con Wundt, con quien compartió el interés por los fenómenos perceptivos y sensomotores, y el rigor en el control de las condi- ciones en que se realizaban las observaciones, pero de quién se distanció ante el despreció del experimentalista alemán por las diferencias individuales. Más tarde trabajo con Galton e inició en Estados Unidos el estudio de las diferencias individuales. Acuñó el término "test mental" en un artículo publicado en 1890 en la revista Mind bajo el título "Mental test and measurements". Asumió la idea de Galton sobre la posibilidad de medir las funciones intelectuales por medio de test de discriminación sensorial y tiempo de reacción. Sin embargo. Los prime- ros estudios que se realizaron para evaluar este tipo de test ofrecieron resultados desalentadores: el "rendimiento intelectual" mostraba poca correspondencia de unos test a otros y prácticamente ninguna relación con estimaciones indepen- dientes del nivel intelectual realizadas por los profesores. Por el contrario, Eb- binghaus, apuntando ya un cambio de enfoque, había obtenido con un test de terminación de frases una correspondencia clara con el rendimiento académico de los niños.

Pero sin duda, la consolidación social de la medición psicológica vino de la obra del francés Alfred Binet (1857 -1911) cuya influencia en el desarrollo de la teoría de los test perdura en la actualidad. Binet ya a finales de los años noventa del

edu.red

CONSTRUCCIÓN DE INSTRUMENTOS PSICOLÓGICOS MANUAL AUTOFORMATIVO 27 UNIDAD I: “EVALUACIÓN Y MEDICIÓN EN PSICOLOGÍA”

siglo XIX criticó la aproximación de Galton y Catell con el argumento de que para medir procesos mentales complejos era necesario observar la ejecución de los individuos en actos mentales complejos, rechazando la idea de que fuese necesaria una mayor precisión para la que no había instrumentos disponibles.

Binet recibió en 1904 el encargo del ministerio francés de instrucción pública de elaborar un instrumento de medida capaz de diferenciar entre los niños "edu- cables" y los que no podrían beneficiarse de la educación normal. Junto con su colaborador Simón presentó en 19051a primera versión del test Binet-Simón. El test estaba formado por 30 problemas o tareas dispuestos en orden de dificultad creciente, que median la capacidad de juicio, razonamiento y comprensión. Para determinar el nivel de dificultad, los problemas habían sido administrados a 50 niños de entre 3 y 11 años más a algún niño retrasado. La segunda versión del test editada en 1908, incluía un número mayor de ítems junto con la eliminación de algunos que se habían considerado podían reflejar diferencias en función de la extracción social de los niños, además aparecían ya agrupados por niveles de edad. Binet prefirió el término "nivel mental" al de "edad mental" popularizado por las sucesivas traducciones de la escala, ya que el primer término estaba exen- to de las connotaciones evolutivas del segundo. Al poco tiempo de su presenta- ción, el test de Binet y Simón fue traducido a diferentes idiomas y aplicado en diversos países, lo que prueba la favorable acogida social que recibió.

El interés por la obra de Binet se ha mantenido a lo largo del tiempo. Van der Linden (1986) ha resaltado las contribuciones estrictamente metodológicas de la aproximación de Binet a la medida de la inteligencia. Primero, frente a los experimentos antropométricos y psicofísicos que planteaban una única tarea, Binet decidió alargar la longitud del test por dos motivos: a) el conjunto de ítems debía ser una representación adecuada de la gran variedad de tareas a las que se debe enfrentar una persona en su vida diaria: y b) conocedor de las teorías de Spearman entendió que cada ítem en sí mismo era una media imprecisa, por lo que era necesario combinar observaciones de un buen número de ítems para ob- tener una medida fiable. Segundo, la insistencia de Binet en la estandarización de la aplicación del test, reflejada en la extrema precisión de las guías sobre el material, la administración, la puntuación y la interpretación de las mediciones. Por último, la práctica de "normativizar" el test para iniciar una interpretación relativa de la ejecución de las personas.

Tras las aportaciones de Binet, los mayores desarrollos en la medición de las diferencias individuales hay que buscarlos en un área y lugar diferente. El test de Binet fue introducido en Estados Unidos por H. H. Goddard, cuya traducción y adaptación recibieron el beneplácito de la audiencia médica, al venir a cubrir la necesidad de una medida estandarizada y objetiva para el diagnóstico de la sub- normalidad. Sin embargo, fue rápidamente desplazada por la revisión y adapta- ción psicométricamente más sólida, realizada por L. M. Terman en 1916 en la Universidad de Stanford. Al entrar Estados Unidos en la Primera Guerra Mun- dial, un comité encabezado por R. M. Yerkes detecta la necesidad de clasificar de forma rápida al millón y medio de reclutas con respecto a su nivel intelectual. De nuevo, una demanda social provoca un avance metodológico: los primeros test de inteligencia de administración grupal y no verbales, para evaluar a los reclutas analfabetos o que no tengan como lengua materna el inglés. En este contexto hay que situar las contribuciones de A. S. Otis, por la introducción del formato de elección múltiple y otros formatos de puntuación objetiva. Impulsado por las necesidades militares aparece también el primer test estandarizado para la evaluación de variables de personalidad: el "Personal Data Sheet" de R. S. Wood- worth, un instrumento pensado para la detección de personas con inestabilidad emocional.

edu.red

UNIDAD I: “EVALUACIÓN Y MEDICIÓN EN PSICOLOGÍA” 28 Diagrama Objetivos Inicio Desarrollo de contenidos Actividades Autoevaluación LECTURA SELECCIONADAS N° 1 Lecturas Glosario Bibliografía seleccionadas 1. Definición: Una de las definiciones más aceptadas es la de Pichot (Bonboir,1974: 91) que indica Recordatorio Anotaciones portamiento. Tal comportamiento se evalúa por una comparación estadística con el de otros individuos colocados en la misma situación, lo que permite clasificar al sujeto examinado, ya sea cuantitativa, ya sea tipológicamente. Esta definición implica: a. La situación estandarizada (es decir, los elementos siguientes: medio en que se desarrolla la experiencia, material de las pruebas, actitudes e instrucción dadas por el experimentador para la utilización del material) sea perfectamente defi- nida y reproducida de modo idéntico en todos los casos. b. El registro del comportamiento provocado en el sujeto debe ser lo más preciso y objetivo posible. Este comportamiento es muy diferente según los casos: para determinado sujeto consiste en escribir las respuestas, ejecutar una determina- da tarea manual, dibujar, hablar. En todo caso las condiciones de registro deben ser definidas y observadas rigurosamente. c. El comportamiento registrado debe ser evaluado estadísticamente en relación con el de un grupo de individuos. Esta comparación es indispensable y una prueba que no recurra a ella no es una prueba. d. La clasificación del sujeto examinado en relación al grupo de referencia es el objetivo final de la prueba.

2. Características de las pruebas psicológicas 2.1 La objetividad. Las pruebas industriales tienden a ser, en su mayoría, de naturaleza objetiva. La calificación que obtiene el candidato en estas pruebas no tienen relación con los cambios de humor y las opiniones personales de la persona que califica. Otra ventaja de las pruebas objetivas es que pueden ser calificadas fácil y rápidamente por auxiliares con un entrenamiento mínimo. (Lawrence,1972 p.130)

2.2 Confiablidad Es la cualidad, la que hace que una misma prueba aplicada dos veces a la misma persona en circunstancias idénticas, proporcione similares resultados; en otras palabras, la confiabilidad indica si la prueba es constante en las mediciones que obtiene de una misma persona, registrando únicamente fluctuaciones de menor importancia ocasionadas por la adquisición de nuevos conocimientos u olvidos durante los intervalos que transcurren entre una y otra aplicación de las pruebas.

2.3 Validez Una prueba válida es aquella que mide lo que se quiera que mida, permitién- donos así pronosticar lo que queremos pronosticar. Por lo tanto, para que una prueba administrada a los candidatos tenga validez de pronóstico en la selección de personal, debe tener correlación con algún índice de la eficiencia del emplea- do obtenido posteriormente.

Es perfectamente factible que una prueba sea confiable sin ser válida. Por ejem- plo, una regla es un instrumento de medición confiable en alto grado. Si se apli- ca varias veces al mismo objeto rendirá, aproximadamente, la misma calificación o lectura en centímetros. Sin embargo, no tiene validez alguna como medida de la eficiencia de un empleado. Para la mayoría de los trabajo, no hay ninguna relación entre la estatura y el éxito del empleado.

2.3 Estandarización Es evidente que siempre que se desee comparar a cierto número de personas con respecto a las calificaciones de una prueba, es necesario que se les adminis-

edu.red

CONSTRUCCIÓN DE INSTRUMENTOS PSICOLÓGICOS MANUAL AUTOFORMATIVO 29 3. Clasificación de las pruebas psicológicas. Debido a que las pruebas psicológicas son muy variadas en cuanto a su extensión, calificación, tiempo empleado en aplicarlas, etc., se hace necesario emplear más de un criterio para clasificarlas. A continuación se mencionan los principales de ellos:

3.1 En relación al tiempo de aplicación. a. Prueba de velocidad: es aquella que tiene un límite determinado de tiempo por más allá del cual no se les permite a los participantes trabajar, aun cuando no hayan contestado a todos los puntos. La administración de este tipo de pruebas facilita en cierto grado la realización de un programa de pruebas en gran escala. Todos los documentos deben ser entregados dentro de un pe- ríodo determinado, lo cual hace posible calificar y estudiar simultáneamente todas las contestaciones. (Lawrence, 1972, p.157) b. Prueba de capacidad: una de las desventajas de las pruebas de velocidad es que no todos los sujetos responden fácilmente, por lo que sus resultados en este tipo de prueba son más bajos que los sujetos que si responden rápida- mente. para evitar esto, se han desarrollados pruebas que no tienen límite de tiempo, pues el número de respuestas correctas no depende del tiempo sino de la habilidad que posea la persona. (Arias,1994, p.434)

3.2 En cuanto a la forma de administrarlas. a. Pruebas de grupos: estas se pueden suministrar simultáneamente a un nú- mero considerable de personas, su administración resulta infinitamente más económica, con tal de que se disponga de facilidades adecuadas de asientos y de supervisión de los grupos que concurren a la prueba. b. Pruebas individuales: son aquellas donde se requiere que esté presente un administrador por cada individuo que se somete a ellas. Durante una prue- ba individual es más fácil establecer una atmósfera de bienestar y observar el comportamiento del sujeto. Solamente en la prueba individual se puede hacer la clase de pregunta exploratoria necesaria durante cierta clase de apre- ciación de la personalidad.

3.3 En cuanto a la forma de realizarlas: a. De papel y lápiz: son aquellas donde el sujeto se ve obligado a responder mar- cando o formulando una respuesta a preguntas escritas. b. Orales: en estas la persona responde, asocia una palabra a otra.

3.4 En relación a las características medidas. a. Pruebas de inteligencia: la definición de la inteligencia resulta complicada por la diversidad de factores incluidos en esta clasificación tan amplia. La in- teligencia se considera como una especie general de agilidad mental. Puede ser que esto implique la capacidad de aprender rápidamente, de resolver pro- blemas que no se han encontrado anteriormente y de recordar informaciones obtenidas algún tiempo atrás. Implica, sin lugar a dudas, la capacidad de pen- sar en términos abstractos lo mismo que concretos y de manipular símbolos tales como los conceptos matemáticos y verbales. El rasgo más destacado de cualquier definición de inteligencia es que implica la capacidad general de aprender y resolver problemas. (Lawrence,1972, p.159) b. Pruebas de interés: las pruebas de interés requieren esencialmente que los individuos sometidos a ellas manifiesten el grado de afición que sienten por actividades distintas, como empleos, pasatiempos, recreación y diversiones. c. Pruebas de personalidad: estas pruebas están diseñadas para medir caracterís- ticas como el equilibrio emocional, la perseverancia, la confianza en sí mismo UNIDAD I: “EVALUACIÓN Y MEDICIÓN EN PSICOLOGÍA”

tre la misma prueba o distintas formas de la misma. Por ejemplo, no se puede esperar comparar las calificaciones de una prueba aritmética de dos solicitantes, uno de los cuales ha pasado una prueba para la que no se necesita estar familia– rizado con operaciones más complicadas que la división de varias cifras, mientras que la que ha pasado el otro necesita del dominio de las fracciones y los decima- les. (Lawrence,1972, p.130)

edu.red

TEMA N° 3: IDENTIFICANDO EL CONSTRUCTO EN PSICOLOGÍA 30 Diagrama Objetivos Inicio Desarrollo de contenidos

Lecturas seleccionadas

Recordatorio ACTIVIDAD N° 1: Actividades Autoevaluación Esta actividad puede consultarla en su aula virtual.

Glosario Bibliografía 1 LOS CONSTRUCTOS EN PSICOLOGÍA. ¿Alguna vez usted ha visto a la inteligencia caminar?, ¿cree usted que la memoria lo saludará?, ó ¿acaso usted ha probado el sabor de los trastornos?, pues creo que Anotaciones ninguna persona en este mundo lo haya podido hacer y quizás algunos ya se estén preguntando ¿quién define a la inteligencia, memoria, trastornos, etc.? Pues es ahí donde los constructos empiezan aparecer, y algunas veces llega a ser difícil y contro- vertidos, ya que todavía no se alcanza un nivel de pureza, y es por ello que la psico- logía no es una ciencia exacta. Podemos explicarlo mediante el siguiente diagrama:

Diagrama N° 06 Constructos. Fuente: Rodríguez. F.

Entonces se deduce que un constructo son aquellos conceptos inferibles a partir de la conducta del ser humano, lo cual, el análisis de la conducta es propio de la psi- cología, por lo tanto es difícil de entender ya que en todas las personas son iguales, pero si pueden mostrar ciertos rasgos. UNIDAD I: “EVALUACIÓN Y MEDICIÓN EN PSICOLOGÍA”

y muchas otras. Muchos jefes de personal consideran la personalidad como el factor decisivo del éxito o fracaso en el empleo. Es una opinión bastante generalizada que para ciertos tipos de cargos, las características personales pueden tener mayor importancia que la habilidad o el conocimiento del em- pleo. (Lawrence, 1972, p. 164) d. Pruebas de rendimiento: tienen por objeto valorar el grado de adelanto de los individuos en cualquiera actividad laboral que se les confíe. En la vida de los negocios y de la industria se utilizan principalmente estas pruebas para la aceptación de individuos para empleos en que hacen falta trabajadores con experiencia.

Las pruebas de rendimiento en el trabajo pueden constar de diversos puntos, como por ejemplo, preguntas verbales, ejercicios escritos en contestación a pre- guntas objetivas y exámenes prácticos del trabajo en cuestión.

La prueba de ensayo es un ejemplo de este tipo, consiste en colocar al individuo ante un simulacro operativo en que se reproducen todas las manipulaciones que exige el trabajo, o las más importantes. Generalmente en dichas pruebas se utili- za un equipo análogo al que hace falta para el trabajo verdadero.

e. Pruebas de aptitud: las pruebas que se utilizan para calcular el resultado posible que va a dar un individuo en un oficio determinado miden o calibran las características humanas fundamentales para desarrollar determinada actividad o desempeñar determinados empleos. Estas características fundamentales pueden llamarse aptitudes.(Lawrence,1972:170)

edu.red

CONSTRUCCIÓN DE INSTRUMENTOS PSICOLÓGICOS MANUAL AUTOFORMATIVO 31 UNIDAD I: “EVALUACIÓN Y MEDICIÓN EN PSICOLOGÍA”

Los constructos no tienen referentes empíricos inmediatos. Nadie ha visto ni ha tocado la inteligencia de alguien, pero sí la puede inferir de la manera en que una persona es capaz de resolver ciertos problemas en relación con la manera en que otros los resuelven. Los constructos tienen como referentes relaciones lógicas entre conceptos. Por ejemplo, se puede decir que la ansiedad se caracteriza por períodos alternativos de miedo y esperanza (Cortada de Kohan, 2001).

Es decir, para que un test se pueda realizar de manera correcta y adecuada el cons- tructo no puede ser manejado a la ligera, se debe tener un buen fundamento teó- rico para la creación y uso del test. Podemos decir en pocas palabras que un cons- tructo es un concepto hipotético que forma parte de las teorías de observación empírica.

1.1 Definición de constructo: Un constructo es una construcción teórica que se desarrolla para resolver un cierto problema científico. Para la epistemología, se trata de un objeto concep- tual o ideal que implica una clase de equivalencia con procesos cerebrales.

Bunge lo define como un concepto no observacional por el contrario de los conceptos observacionales o empíricos, ya que los constructos son no empíricos, es decir, no se pueden demostrar. Estos conceptos no son directamente mani- pulables, al igual que lo físico, pero sí son inferibles a través de la conducta. Un constructo es un fenómeno no tangible que a través de un determinado proceso de categorización se convierte en una variable que puede ser medida y estudia- da. Cada disciplina científica desarrolla un sistema de conceptos propios de su actividad. Cuanto más perfecta es una ciencia, puede definir mejor sus concep- tos de manera más precisa y unívoca.

En psicología los constructos son definidos en función a las diferentes escuelas.

1.2 Tipos de definición: a. Teórica: Es la que se basa en el marco teórico o se desprende de una Corrien- te psicológica y sale de los libros, diccionario, revistas, etc b. Operacional: El concepto de definición operacional fue adaptado por los psi- cólogos al darse cuenta de la importancia que tenía en las ciencias físicas, biológicas y químicas. Los conceptos como: comportamiento, inteligencia, personalidad; fueron convertidos a constructos y sirvieron de mucho para las investigaciones referentes a esos conceptos. Era el comienzo de la precisión y claridad en los conceptos de la psicología, que pasaba de los estudios de la mente a los del comportamiento y ahora a los de procesos psíquicos (zinser, 1987). Para Conesa (2000) una definición operacional, indica las actividades u operaciones necesarias para medir o manipular una variable.

Ejemplo: Asertividad: Es una forma de comportamiento donde la persona de- fiende sus derechos, reclamando oportunamente, respetando los puntos de vis- ta de los demás y no dejándose llevar por la emoción

Al tener claro la definición de constructo, pues debemos mencionar, que para realizar el constructo de nuestro instrumento psicológico debemos tener dos tipos de definición: definición teórica y definición operacional.

edu.red

32 Fuente: Rodríguez. F.

En este diagrama podemos apreciar los dos tipos de definición, a la definición teó- rica también se le conoce como definición constitutivas. Cuanto más perfecta es una ciencia puede definir mejor sus conceptos de manera más precisas y unívoca. La psicología todavía no ha alcanzado en este sentido el nivel de otras ciencias por cuanto sus conceptos a veces son definidos de manera diferente por representantes de diversas escuelas. La definición delimita los conceptos, es decir caracteriza lo esencial de un concepto. Las definiciones de los conceptos científicos difieren algo de las definiciones del diccionario pues siempre se dan en un contexto especial. Así en física “fuerza es el producto de masa por aceleración” en cambio en los diccio- narios “fuerza es la capacidad necesaria para mover algo pesado”. Una definición desarrolla y explica el contenido de un concepto. Kerlinger (1988,3aedic.) dice que los constructos pueden ser definidos usando otros constructos. Por ejemplo, al de- finir inteligencia como la aptitud para pensar en forma abstracta” o como “agudez mental”. Una definición es constitutiva cuando define un constructo por medio de otro constructo. Por ejemplo, definir “ansiedad como miedo subjetivo”. (Cortada de Kohan, 2001)

Existen otro tipo de definiciones que son las definiciones operacionales. Una defi- nición operacional de un constructo se refiere a las operaciones mediante las cuales un investigador determina la presencia o ausencia (o la magnitud) de un fenóme- no. (Cortada de Kohan, 2001) UNIDAD I: “EVALUACIÓN Y MEDICIÓN EN PSICOLOGÍA”

Diagrama N° 07 Secuencia para definir el constructo.

edu.red

CONSTRUCCIÓN DE INSTRUMENTOS PSICOLÓGICOS MANUAL AUTOFORMATIVO 33 2 ORGANIZACIÓN DE UNA PRUEBA PSICOLÓGICA 2.1 Estructura y coherencia interna: El test psicológico, también denominado como prueba psicológica, es un instru- mento de tipo experimental que se utiliza para medir o evaluar una caracterís- tica psicológica específica o aquellos rasgos esenciales y generales que marcan y distinguen la personalidad de una persona.

El comportamiento individual que los reactivos del test provocan serán valo- rados comparándolos, ya sea estadística o cualitativamente con el de otros indivi- duos que son sometidos al mismo test, pudiéndose llegar a través de este método experimental a una determinada clasificación del sujeto o sujetos en cuestión. Y asimismo, ese comportamiento específico que observe el individuo ante un de- terminado reactivo debe representar lo más fielmente posible el funcionamien- to que tendría ese sujeto en determinadas situaciones cotidianas en las cuales la capacidad que se le está evaluando se ponga en ejecución real.

2.1.1 Características de las Pruebas Psicológicas a. Objetividad: Las pruebas industriales tienden a ser, en su mayoría, de naturaleza objetiva. La calificación que obtiene el candidato en estas pruebas no tiene relación con los cambios de humor y las opiniones personales de la persona que califica. Otra ventaja de las pruebas objeti- vas es que pueden ser calificadas fácil y rápidamente por auxiliares con un entrenamiento mínimo. Este factor reduce materialmente el costo de administración del pro- grama, comparado con lo que costaría si se usaran pruebas subjetivas. (Lawrence,1972: 130) b. Confiabilidad: Es la cualidad, la que hace que una misma prueba aplica- da dos veces a la misma persona en circunstancias idénticas, proporcio- nesimilaresresultados.(veremosconmayordetenimientomásadelante) c. Validez: Una prueba válida es aquella que mide lo que se supone dice medir, permitiéndonos así pronosticar lo que queremos pronosticar. (veremos con mayor detenimiento más adelante) d. Estandarización: Es evidente que siempre que se desee comparar a cier- to número de personas con respecto a las calificaciones de una prueba, es necesario que se les administre la misma prueba o distintas formas de la misma.

2.1.2 Partes de un test psicométrico Un test psicométrico tiene generalmente las siguientes secciones o partes: a. El test propiamente dicho. b. El manual del test. Documento que contiene los siguientes capítulos o partes: Exposición de los objetivos de la prueba (qué mide). Generalmente empieza con un resumen mostrado en la FICHATéCNICA. a) Marco Teórico de la Prueba b) Matriz Organizativa c) Descripción de las características estructurales del test (sus partes y componentes). d) Información acerca del proceso de estandarización o tipificación. e) Instrucciones generales sobre la manera de aplicar o administrar la prueba y del tipo de población en la cual es aplicable. f) Descripción del material de examen propiamente dicho a las instruccio- nes detalladas para la aplicación del test o de cada uno de los sub-test. g) Instrucciones para las valoraciones (calificación) de las respuestas obte- nidas en cada uno de los sub test. h) Información estadística y psicométrica acerca de las propiedades de la prueba como instrumento de medida, vale decir, confiabilidad y validez. UNIDAD I: “EVALUACIÓN Y MEDICIÓN EN PSICOLOGÍA”

edu.red

34 Fuente: Rodríguez F.

Enesteejemplopodemosapreciarqueexisten3situacionesdemedidacomoyafueron mencionadas anteriormente, se puede apreciar también uno de los indicadores.

El número de ítems se identifica con alguna letra, lo más usual es la letra X, al cos- tado de esta X esta un número, esos son los números de ítems que hay en este indi- UNIDAD I: “EVALUACIÓN Y MEDICIÓN EN PSICOLOGÍA”

i) Tablas de normas o baremos con los puntajes directos y convertidos para los diferentes grupos de edades y poblaciones (poblaciones de re- ferencia y grupos normativos adecuadamente descritos). j) Los puntajes convertidos son, usualmente, los percentiles y los puntajes estándar (Cronbach, 1972).

2.2 MATRIZ ORGANIZATIVA Es la estructura interna de la prueba (como un plano de la casa) que conjuga 2 elementos: Indicadores y las situaciones de medida.

2.2.1 Funciones: Permite: a. Ver el grado de complejidad o simplicidad del constructo. según los indicadores, se analizará cuan entendible es nuestro test, mientras se mantenga un buen constructo y mejor redactado sea, pues el test será más simple de explicar y entenderlo. b. Ver la extensión de la prueba. No importa cuántos indicadores tenga la prueba, pero debe tener un número mínimo de ítems, para este caso se ha de trabajar como mínimo 3 ítems para cada indicador. c. Ver la complejidad de la prueba. Cada indicador debe tener un sustento y debe ser definida gracias a nuestro constructo. d. Visualizar la naturaleza de los ítems a elaborar

2.2.2 Partes: a. Indicadores: Referentes conductuales donde se manifiesta el construc- to que se desea medir y están definidos a partir del marco teórico pre- viamente establecido. b. Situaciones de Medida: Son los diferentes contextos donde se pondrán a prueba los indicadores : Personas, lugares, situaciones, etc.

A continuación se mostrará un ejemplo sobre una matriz organizativa, en esta matriz el constructo es sobre las ideas irracionales dirigidas a la violencia femeni- na, y se toma tres situaciones de medida: a. Hogar b. Trabajo c. Pareja

Y se tiene como indicador: a. Debo estar siempre con mi pareja

Cuadro: N° 03 matriz organizativa A.

edu.red

CONSTRUCCIÓN DE INSTRUMENTOS PSICOLÓGICOS MANUAL AUTOFORMATIVO 35 Fuente: Rodríguez, Félix.

En este siguiente cuadro podemos apreciar que el número de ítems existentes no ha cambiado, simplemente cambió en número que adoptaron; esto es lo que su- cedió: El ítem Nro. 1 después de un proceso de sorteo se convirtió en el número 4 El ítem Nro. 2 después de un proceso de sorteo se convirtió en el número 10.

En este ejemplo no mostramos más indicadores, pero damos a entender que puede haber muchos más, ya que se muestra en número 24, dando a conocer que tiene 24 ítems, pero los test no tienen número máximo de ítems.

TEMA N° 4: ATRIBUTOS ESCENCIALES DEL TEST. 1 CONFIABILIDAD DE UNA PRUEBA PSICOLÓGICA La confiabilidad (o consistencia)de un testes la precisión con que el test mide lo que mide, en una población determinada y en las condiciones normales de aplica- ción.(Las condiciones normales de aplicación se refieren a las condiciones especificadas en el manual del test). 6

La falta de confiabilidad de un test psicométrico esta en relación con la interven- ción del error. Se considera que el error es cualquier efecto irrelevante para los fines o resultados de la medición que influye sobre la falta de confiabilidad de tal medición. El error es de dos tipos: a) Error constante (sistemático), que se produce cuando las mediciones que se obtienen con una escala son sistemáticamente ma- yores o menores que lo que realmente deben ser. b) Error causal, que se produce cuando las medidas son alternativamente mayores o menores de lo que realmente deben ser. Este último tipo de error interviene cuando se afecta la confiabilidad de un test psicométrico. Este error tiene que ver con la salud, fatiga, motivación, ten- sión emocional, fluctuaciones de la memoria, condiciones externas de luz, hume- dad, ventilación, calor, distracción por problemas del momento, familiaridad con la prueba, que presenta el examinado al momento de dar el test (Rey,1972;Brown, 1982).

6 Anastasi,1982;Aiken,1995 UNIDAD I: “EVALUACIÓN Y MEDICIÓN EN PSICOLOGÍA”

cador y situación de medida, por ejemplo en el indicador “Debo estar con mi pareja para siempre” y la situación de media “Pareja” hay 3 ítems y son los números 6, 7 y 8.

Ahora, después de elaborar todos los ítems se debe pasar a realizar un sorteo en el cual los ítems seguirán estando en el mismo indicador y situación de medida, pero solo han de cambiar de número de posición, este procedimiento es obligatorio ya que la persona a la cual le aplicamos el test podría darse cuenta fácilmente que trata- mos de decir con todas las preguntas parecidas o relacionadas, una detrás de la otra.

Después de un proceso de elaboración en número de los ítems puede cambiar, pero no su rubro por ejemplo.

Cuadro: N° 04 matriz organizativa A.

edu.red

36 s = Desviación estándar de los puntajes de la distribución. rxx = Coeficiente de confiabilidad del test. 1 = Constante. UNIDAD I: “EVALUACIÓN Y MEDICIÓN EN PSICOLOGÍA”

1.1 ¿Cómo se presenta la confiabilidad de un test psicométrico? La confiabilidad se presenta por medio del coeficiente de confiabilidad (rxx) y del error están dar de medida (EEM).

1.1.1 Coeficiente de confiabilidad Es un coeficiente de correlación entre dos grupos de puntajes e indica el grado en que los individuos mantienen sus posiciones dentro de un grupo. Abarca valores desde 0 a 1.Cuanto más se acerque el coeficiente a 1, más confiable será la prueba. El coeficiente de confiabilidad señala la cuantía en que las medidas del test están libres de error es casuales o sistemáticos. Por ejemplo, un coeficiente de 0.95 quiere decir que en la muestra y condiciones fijadas de aplicación del test el 95% de la varianza de los puntajes directos se debe a la auténtica medida, y sólo el5%,a error es aleatorios.

Existen cuatro métodos básicos para obtener el coeficiente de confiabi- lidad (rxx): Método de las formas equivalentes; método del test-re test; método de la división por mitades empareja da so" splithalf method"; y método de la equivalencia racional o de Kuder- Richardson: a) Método de las formas equivalentes: Se aplican dos formas equivalentes o paralelas del test al mismo grupo de individuos, y las dos series de puntajes resultantes se correlacionan con el coeficiente producto de los momentos de Pearson(r). b) Método del test-re test: Se aplicados veces el mismo test (el lapso entre las aplicaciones se determina previamente),a una misma muestra de in- dividuos. Las dos series de puntajes resultantes se correlacionan con el coeficiente de correlación "r" de Pearson. c) Método de la división por mitad es emparejadas o "splithalfmethod": Se aplica el test una sola vez a una muestra. Luego, se califica por sepa- rado los ítems pares(2,4,6,…,n)y los ítem es impares(1,3,5,…,n).A con- tinuación, las dos series de puntajes resultantes se correlacionan con el coeficiente "r" de Pearson, pero por haberse dividido el test en dos partes(ítem es pares e ítems impares),el "r" resultante debe ser "corregi- do" para arrojar el "r" para todo el test. Esta corrección se efectúa con la fórmula de profecía de Spearman-Brown: d) Método de la equivalencia racional: En este método se considera que si un test está formado por un conjunto de ítems estos pueden ser con- siderados como un conjunto de test paralelos (tantos como ítems tenga el test).Luego se deriva una ecuación para computar el coeficiente de confiabilidad. Kuder y Richardson derivaron varias fórmulas para el cálculo del coeficiente de confiabilidad, son las más conocidas la KR20 y la KR21. Actualmente, un coeficiente más utilizado es el coeficiente alfa de Cronbach (1972; Anastasi, 1982; Aiken, 1995).

1.1.2 Error estándar de medida Por medio de este error estándar de medida se estima el intervalo proba- ble de puntajes en el cual se encontrará el puntaje verdadero de un sujeto examinado con un test psicométrico. El error estándar de medida (EEM) se obtiene a través de la siguiente fórmula:

Donde:

edu.red

CONSTRUCCIÓN DE INSTRUMENTOS PSICOLÓGICOS MANUAL AUTOFORMATIVO 37 2 VALIDEZ Si tenemos una prueba “X” nos equivocaríamos al creer que su título nos dice lo que la prueba mide, pues cualquier persona puede reunir un conjunto de reactivos y esperar a obtener una medida, por ejemplo, de razonamiento numérico o de las estrategias de aprendizaje. La averiguación de lo que la prueba mide no responde a la pregunta ¿cómo llama el autora la prueba?, sino más bien ¿a qué hacen refe- rencia los puntajes obtenidos en esta?, ¿es válido el uso o la interpretación de las puntuaciones de este test?, qué generalizaciones se pueden hacer apropiadamente a partir de la puntuación en esta prueba?(Thorndike,1989). En esencia, el trasfon- do de estas preguntas es determinar cuáles son los procesos mentales que pone en juego el test. Ahora bien, el responderá las citadas interrogantes necesita de una in- dagación larga y compleja que en psicometría se denomina proceso de validación.

1.1 Distinción entre la validez y la confiabilidad según el error. La distinción entre confiabilidad y validez se basa en lo que consideramos como error. En la validez interesan los errores constantes o sistemáticos y en la confia- bilidad los errores aleatorios o no sistemáticos. El siguiente ejemplo nos permiti- rá precisar la diferencia entre ambos tipos de error: Supongamos que un reloj es adelantado 20 minutos. Si se trata de un buen cronometro el tiempo que marca será confiable (es decir consecuente), pero no será válido en comparación con el tiempo estándar (hora GMT).

1.2 Definición de validez. En términos estadísticos la validez se define como la proporción de la varianza ver- dadera que es relevante para los fines del examen. Con el término relevante nos referimos a lo que es atribuible a la variable, características o dimensión que mide la prueba.

En este sentido, generalmente la validez de un test se define y asea por medio de (1) la relación entre sus puntuaciones con alguna medida de criterio externo, o bien (2) la extensión con la que la prueba mide un rasgo subyacente es- pecífico hipotético o “constructo”.

En términos psicométricos, la validez es un concepto que ha pasado por un largo proceso evolutivo, desde aquella posición que sostenía que “un test es válido para aquello con lo que correlaciona” (Guilford,1946,citado en Muñiz,1996,p. 52), hasta la más reciente que la entiende como un juicio evaluativo global en que la evidencia empírica y los supuestos teóricos respaldan la suficiencia y lo apropiado de las interpretaciones y acciones en base a los puntajes de las prue- bas, que son función no sólo de los ítems sino también de la forma de responder de las personas así como del contexto de la evaluación.

Es decir, lo que se valida no es la prueba sino las inferencias hechas a partir de la misma, lo que tiene dos importantes consecuencias: a)el responsable de la validez de una prueba ya no es solo su constructor si no también el usuario, y b)la validez de una prueba no se establece de una vez por todas si no que es re- UNIDAD I: “EVALUACIÓN Y MEDICIÓN EN PSICOLOGÍA”

Obtenido el EEM, debemos escoger el nivel de confianza: – Niveldeconfianzadel68%=PD±1EEM. – Niveldeconfianzadel95%=PD±2EEM.

Paraelniveldeconfianzadel68%lainterpretacióneslasiguiente: "Podemos concluir, con un 68% de confianza, que el puntaje verdadero d e un sujeto está en la zona o intervalo comprendido entre su puntaje directo u obtenido (PD) y±1EEM".

Elniveldeconfianzamásusadoenpsicometríaeseldel95%: "el puntaje verda- dero de un sujeto se encontrara en el intervalo comprendido entre su puntaje obtenido o directo (PD)y±2EEM".

edu.red

38 Si tenemos en cuenta que lo que se valida no es el test sino las inferencias hechas a partir del mismo, cada tipo de inferencia requerirá una estrategia dis- tinta.(Vidal,1996,enMuñiz,1996).

1.3.1 Validez de Contenido (evidencia del contenido) ¿Los ítems que constituyen el test son realmente una muestra repre- sentativa del dominio de contenido o dominio conductual que nos inte- resa? Es conveniente precisar que un dominio o campo conductual es una agrupación hipotética de todos los reactivos posibles que cubren un área psicológica particular. Al hablar de este conjunto de reactivos posibles, se emplean los términos de dominio, universo o población conductual como sinónimos. Por ejemplo: Un test de vocabulario debe ser una muestra ade- cuada del dominio o universo de ítems posibles en esta área.

La validez de contenido consiste en determinar lo adecuado del mues- treo de reactivos del universo de reactivos posibles; en este sentido, es una “medida” de lo adecuado del muestreo. Ponemos “medida” entre comillas debido a que este tipo de validez consiste en una serie de estimaciones u opiniones, que no proporcionan un índice cuantitativo de validez (para su obtención no se utiliza procedimientos estadísticos). Este tipo de validez se asocia fundamentalmente a los test de aprovechamiento o rendimiento (test de matemática, historia, etcétera); aunque no existen razones para que no pueda aplicarse a los otros tipos de pruebas psicológicas (pruebas de aptitudes, habilidades, etcétera).

1.3.2 Validez Predictiva (evidencia externa) ¿Predicen las puntuaciones del test un rendimiento o conducta futura? (Junto con la validez concurrente se le denomina también validez empíri- ca del test).

Un uso común de los testes predecir la conducta futura; utilizamos el test para ayudarnos a tomar alguna decisión práctica (selección, clasificación, etc.). En cada una de estas situaciones, cuanto mayores la exactitud de predicción del resultado(es decir del criterio externo), tanto más útil será la prueba. Por ejemplo, el test será un componente aceptable de un pro- ceso de selección de personal, si sus calificaciones o puntuaciones predi- cen la ejecución de algún componente importante del trabajo (criterio externo);en otras palabras, para que el test se pueda utilizar como parte de un proceso de selección es preciso demostrar la validez de la prueba rela- cionándola con los criterios pertinentes. En este sentido, el contenido de la prueba pasa a tener un lugar secundario, siendo el interés fundamental del psicólogo el averiguar si el test predice un criterio determinado

1.3.3 Validez Concurrente. ¿Permiten las puntuaciones del test la valoración de ciertos hechos pre- sentes? Para estimarla se administra el test y se le correlaciona con el cri- terio. La diferencia con la validez predictiva se da en dos aspectos: a) las UNIDAD I: “EVALUACIÓN Y MEDICIÓN EN PSICOLOGÍA”

sultado del acopio de evidencias y supuestos teóricos que se dan en un proceso evolutivo y continuo que comprende todas las cuestiones experimentales, estadísticas y filosóficas por medio de las cuales se evalúan las hipótesis y teorías científicas(Messick,1995).

1.3 Categorías de la validez. La validez empieza a considerarse como el grado en que cada test refleja el constructo que dice medir y que las relaciones entre test que miden distintos constructos reflejan las relaciones hipotetizadas entre ellos. En este sentido, al estimarse que la validez de un test es la validez de constructo la que ha de ha- cer se en un marco teórico, ya no se tiende a hablar de tipos de validez sino de categorías o estrategias de validación comprendiendo éstas a los tipos tradicio- nales de validez: validez de contenido, validez empírica y validez de constructo.

edu.red

CONSTRUCCIÓN DE INSTRUMENTOS PSICOLÓGICOS MANUAL AUTOFORMATIVO 39 UNIDAD I: “EVALUACIÓN Y MEDICIÓN EN PSICOLOGÍA”

medidas del test y del criterio son obtenidas contemporáneamente, y b) en su uso principal. Respecto a esto último, se utiliza principalmente para obtener test como sustitutos de otros procedimientos menos convenientes por diversas razones. Ejemplos: un test de inteligencia colectiva se compa- ra con uno de inteligencia individual. Los diagnósticos de lesiones cerebra- les basados en el test de diseños de bloques (cubos de wpsi) se comparan con síntomas neurológicos.

El problema principal de este tipo de validez es encontrar test que sirvan como criterios válidos y confiables. Análogamente a la validez predictiva requiere un amplio domino de las técnicas de correlación y de los proce- dimientos estadísticos que se utilizan en su obtención. Junto con la validez predictiva es importante en ciertos problemas de psicología aplicada como en psicología clínica, psicología educacional, psicología industrial y en ge- neral, en la toma de decisiones que debe hacer el psicólogo en situaciones de selección, clasificación, hospitalización, etc.

1.3.4 Validez de Constructo.- El constructo viene a ser un concepto hipotético que forma parte de las teorías que intentan explicar la conducta humana: inteligencia, creati- vidad, dependencia de campo, etc. La validez de constructo es la obten- ción de evidencias que apoyan que las conductas observadas en un test son(algunos) indicadores del constructo. Este tipo de validez responde a la pregunta" ¿cómo se puede explicar psicológicamente la puntuación del test?". La respuesta a esta pregunta puede verse como la elabora- ción de una “mini teoría” acerca de una prueba psicológica. La lógica de la validez de constructo en muchos aspectos así como en sus métodos, es esencialmente la del método científico. El proceso de validación de constructo implica a partir del establecimien- to de deducciones de la teoría: a. Formular hipótesis y relaciones entre elementos del constructo, de éste con otros constructos de la teoría y con otros constructos externos a. Seleccionar ítems o test (indicadores) que representen manifestaciones concretas del constructo. b. Recogida de datos. c. Establecer consistencia entre datos e hipótesis, y examinar el grado en que los datos podrían explicarse mediante hipótesis alternativas.

Hay diversos procedimientos para establecer la validez de constructo. Si elaboramos una “mini teoría” esta tendrá tres pasos:(1) en base a la teoría sostenida en ese momento respecto del test, el psicólogo deduce ciertas hipótesis sobre la conducta esperada de las personas que obtienen punta- jes diferentes en el test,(2) se reúne datos que confirman o no esas hipó- tesis,(3) en base a los datos a cumulados, se toma la decisión relativa así la teoría explica adecuadamente los datos. Si no es así se tiene que revisar la teoría y repetir el proceso hasta lograr una explicación más adecuada. El proceso de validación, en ese sentido, es de continua reformulación y refinamiento.

1.4 MéTODOS EMPLEADOS PARA ESTIMAR LA VALIDEZ DE CONSTRUCCIóN 1.4.1 Métodos intrapruebas, Cuyas fuentes de evidencia más usadas son: la validez de contenido de la prueba, el análisis de los procesos psicológicos empleados al responderla (por ejemplo, pidiendo que los sujetos “razonen” en voz alta sus respues- tas). Otras técnicas estudian la estructura interna de la prueba, mediante el análisis de los ítems y las correlaciones entre los diferentes sub test; así mismo, también mediante el establecimiento de la homogeneidad a través del coeficiente alfa de Cronbach o los coeficientes de Kuder-Richard son ( que contribuyen a evaluarla unidimensionalidad del test).

edu.red

40 Diagrama Objetivos plia gama de dimensiones o en condiciones diferentes de administración (por ejemplo la matriz multirasgo – multimétodo propuesta por Campbell y Fiske). (Morales, M.1996, p. 345) Inicio Desarrollo de contenidos Actividades Autoevaluación Recordatorio Anotaciones LECTURA SELECCIONADAS N° 2 Lecturas Glosario Bibliografía seleccionadas De Anastasi, A.

Confiabilidad Como ya mencionamos, toda medición tiende a presentar errores, de manera que el valor observado en la medición, está formado por el valor verdadero y por el error de medición. Si se pudiera llegar a una medición que, en un sentido ideal no tuviera márgenes de error, el valor observado y el valor verdadero (que se correspondería con la variable a medir), coincidirían. Pero esto es algo ideal, ya que las medidas incluyen error. Obviamente, cuanto más error incluya la medición, más contaminada quedaría la variable de interés y más imprecisa sería la técnica que intenta medirla. Por ejemplo: si aplicamos un test que mide la variable de personalidad Neuroticismo y obtenemos un puntaje de 15 (valor observado) y el valor real de la persona fuera de 14 puntos (valor verdadero), tendríamos un margen de error de 1 punto; en otro caso, si el valor real fuera también de 14 puntos y hubiéramos obtenido en la aplicación del instrumento un puntaje de 10, el error de medida sería de 4 puntos. De manera que al aumentar el error de medida, el puntaje que obtenemos al aplicar el test se encuentra más alejado de la medida que sería la verdadera, o sea, que sería más impreciso.

Podemos entonces vincular la confiabilidad con los errores de medición de la siguiente manera: si en toda medida el valor obtenido, está compuesto por el valor verdadero y los errores de medición, un instrumento será más confiable, en la medida que maxi- mice el valor verdadero. Con maximizar el valor verdadero, nos referimos a que éste aproxime lo más posible al valor observado u obtenido. Al reducir el error de medición, incrementamos la similitud entre el valor verdadero y el obtenido. De manera que al maximizar el valor verdadero, minimizamos el error de medición, con el consecuente incremento de la confiabilidad.

Es importante tener en cuenta, que la confiabilidad se refiere, específicamente a los errores aleatorios, tal cual menciona Martínez Arias (1996). Podemos hablar de dos ti- UNIDAD I: “EVALUACIÓN Y MEDICIÓN EN PSICOLOGÍA”

1.4.2 Métodos interpruebas: Utilizan las técnicas del análisis factorial (para evaluar los factores que sub- yacen en las inter correlaciones de las pruebas estudiadas), la validez con- gruente (en tanto correlaciona los puntajes de la prueba con los puntajes obtenidos en otra prueba de validez ya establecida), los estudios de validez convergente y divergente- discriminante (propuestos por Campbell).

1.4.3 El método de los estudios relacionados con los criterios: Que implican la diferenciación de grupos (evaluando la capacidad de la prueba para poder diferenciar dos o más grupos naturalmente separados o diseñados experimentalmente) y los coeficientes de validez (cuando la prueba es aplicada a un grupo de sujetos en los que se estudian criterios relacionados con el constructo teórico estudiado).

1.4.4 El método de la manipulación experimental: Se manipula experimentalmente una variable y se observa sus efectos so- bre los puntajes de una prueba psicológica o la relación de estos puntajes con algún criterio.

1.4.5 El método de los estudios de la capacidad de generalización: Estos estudios analizan sistemáticamente la prueba psicológica en una am-

edu.red

CONSTRUCCIÓN DE INSTRUMENTOS PSICOLÓGICOS MANUAL AUTOFORMATIVO 41 UNIDAD I: “EVALUACIÓN Y MEDICIÓN EN PSICOLOGÍA”

pos de errores: los errores aleatorios que, como tales, no pueden ser controlados y no se pueden predecir y los errores sistemáticos que son controlables y pueden ser explicados por alguna fuente de variación sistemática. De ambos errores los únicos que interesan a la teoría de la fiabilidad son los errores aleatorios.

Para Martínez Arias (1996), la confiabilidad es la consistencia en un conjunto de medi- das de un atributo. Podríamos también definir la confiabilidad como la proporción de la variabilidad verdadera respecto de la variabilidad obtenida. En el análisis de la confiabilidad tenemos que considerar tres aspectos: • Su congruencia o consistencia interna. • La estabilidad del instrumento. • La equivalencia

VALIDEZ Habíamos comentado que los instrumentos tenían como propósito operacionalizar constructos, o sea, medir determinados atributos. La validez tiene que ver con poder determinar si el instrumento está midiendo realmente el atributo que dice medir.

Determinar la validez de un instrumento es mucho más difícil que establecer su con- fiabilidad. Como dicen Polit y Hungler (1995/1997), “no es común encontrar pruebas sólidas que sustenten la validez de la mayor parte de las mediciones de carácter psico- lógico”. Esto se debe a que mientras la confiabilidad sería esencialmente una cuestión empírica; la validez incluye más elementos teóricos, ya que la validación persigue la explicación, con todas las complicaciones que esto implica.

Dentro de los distintos tipos de validez, encontramos como las más importantes, las si- guientes: validez de constructo, validez de criterio y validez de contenido. Es importante tener en cuenta que distintas formas de validez, pueden ser adecuadas para propósitos diferentesyquecadaunapermiteinferenciasdistintas,quenopuedencambiarseentresí.

Validez de contenido Al construir un test, elegimos determinados ítems de un conjunto de conductas que tienen un interés específico, por suponer que remiten al atributo a ser evaluado por el test. En el instrumento no colocamos todas las conductas posibles, elegimos algunas de ellas, o sea, que hacemos una muestra de conductas. Al analizar la validez de conteni- do, lo que hacemos es evaluar si los ítems que hemos usado para construir el test, son relevantes para el uso que se le va a dar al test, es decir, si todos los ítems están dentro del dominio de interés. Una vez establecida la relevancia, lo que importa es saber si los ítems constituyen una muestra representativa del universo de conductas que podrían haberse elegido como indicadores del atributo en cuestión. La validez de contenido se centra en establecer de la mejor manera lo anterior

Validez de criterio Podemos decir que en el caso de la validez de criterio, lo que se persigue, es un fin más práctico, no se trata únicamente de establecer que se mida adecuadamente un cons- tructo, sino fundamentalmente relacionar las puntuaciones del instrumento con otras variables a las que llamaremos criterio.

La validez de criterio nos es útil especialmente cuando deseamos hacer inferencias a partir de los puntajes que se obtienen en el test respecto de alguna otra variable de in- terés. Por ejemplo, si nos interesara establecer en qué medida los puntajes obtenidos en la variable de personalidad Neuroticismo, nos permiten inferir la predisposición para adquirir determinadas conductas con características psicopatológicas, o en qué medida pueden servirnos para predecir una mejor evolución terapéutica, o menores recaídas; relacionaríamos dicha variable de personalidad con los distintos criterios mencionados. Si lo que quisiéramos fuera establecer la validez de criterio de un test de inteligencia, podríamos usar algún indicador de rendimiento académico (por ejemplo notas escola- res), como criterio, para relacionar con el test de inteligencia.

edu.red

CONTROL DE LECTURA Nº 1 42 Diagrama Objetivos Inicio Desarrollo de contenidos

Lecturas seleccionadas

Recordatorio ACTIVIDAD N° 1: Actividades Autoevaluación Esta actividad puede consultarla en su aula virtual.s:

Glosario Bibliografía Instrucción: A continuación te presento las siguientes preguntas, respóndelas a partir del análisis de las lecturas dos lecturas anteriores y envía tus respuestas al profesor para ser calificadas. Anotaciones 1. Utilizando sus propio lenguaje, explique el proceso seguido para elaborar: 1.1 La definición teórica de tu constructo: —————————————————————————————————————————————————– —————————————————————————————————————————————————– —————————————————————————————————————————————————– —————————————————————————————————————————————————– —————————————————————————————————————————————————– 1.2 La definición operacional de tu constructo: —————————————————————————————————————————————————– —————————————————————————————————————————————————– —————————————————————————————————————————————————– —————————————————————————————————————————————————– —————————————————————————————————————————————————–

2. Compare utilizando el siguiente cuadro con tres de las características principales que usted considere de la confiabilidad y validez. UNIDAD I: “EVALUACIÓN Y MEDICIÓN EN PSICOLOGÍA”

Dentro de la validez de criterio se habla de validez concurrente y validez predictiva. La diferencia entre ambas formas de validez, radica en la temporalidad del criterio.

Validez de constructo Gran parte de las variables psicológicas, no son observables directamente, o sea, que constituyen constructos hipotéticos, que forman parte de las diversas teorías que tratan de explicar la conducta humana. Estas variables al no poder ser observadas directa- mente, para toda investigación, deben ser operacionalizadas, o sea, indicarse los pro- cedimientos de medida para observar la variable, hacerla empírica. Los instrumentos psicométricos se refieren a constructos hipotéticos, siendo el instrumento una forma de operacionalizar los mismos. De esta manera la validez de constructo, consiste en tratar de probar que las conductas que registra el test, pueden ser consideradas indicadores válidos del constructo al cual refieren.

edu.red

luego marque la alternativa que estime correcta. CONSTRUCCIÓN DE INSTRUMENTOS PSICOLÓGICOS MANUAL AUTOFORMATIVO 43 Objetivos Inicio s Actividades s Glosario Bibliografía o Anotaciones AUTOEVALUACIÓN DE LA UNIDAD N° I Autoevaluación Resuelva el siguiente cuestionario, marcando la respuesta correcta en cada caso, para fijar los conceptos e ideas fundamentales tratados en la Unidad: 1. Anote en espacio en blanco la expresión que mejor complete la idea inconclusa, “Al igual que todas las ciencias, la psicología tiene sus objetivos a los que pretende acoplarse para desenvolverse como ciencia experimental y ciencia aplicada. Los psi- cólogos estudian a las personas usando métodos científicos y pretenden _________, __________, _______________, _____________ los procesos mentales y el compor- tamiento”. A) Describir, Entender, Predecir, cambiar B) Describir, explicar, Predecir, modificar C) Conocer, explicar, Predecir, Influir D) Describir, Entender, explicar, Influir E) Describir, Entender, Predecir, modificar.

2. En cuanto a los niveles de medición identifique la relación correcta con los respec- tivas proposiciones: A) Id – IIb – IIIa – IVc B) Ic – IIa – IIIb – IVd C) Ia – IIb – IIIc – IVd D) Ib – IIc – IIId – IVa E) Id – IIc – IIIb – IVa UNIDAD I: “EVALUACIÓN Y MEDICIÓN EN PSICOLOGÍA”

3. Identifica los métodos para estimar la confiabilidad de un test y describe brevemente: —————————————————————————————————————————————————– —————————————————————————————————————————————————– —————————————————————————————————————————————————– —————————————————————————————————————————————————– —————————————————————————————————————————————————– 4. Identifica los tipos de validez y describe brevemente: —————————————————————————————————————————————————– —————————————————————————————————————————————————– —————————————————————————————————————————————————– —————————————————————————————————————————————————– —————————————————————————————————————————————————–

edu.red

44 “El sistema de conceptos propios de cada disciplina científica, se denomina __________________”. A) Teoría B) Tema. C) Variable D) Indicador E) Constructo

5. Marquelarespuestacorrecta,queexpreselaestructurainternadeunapruebapsicológica: A) Situación de Medida B) Indicadores C) Matriz Organizativa D) Tabla de especificaciones E) Plano de la prueba

6. Lea con atención y marque la respuesta correcta a la que pertenece el enunciado “es un instrumento de medición utilizada para cuantificar el comportamiento y ayudar a entender o predecir la conducta”: A) Ficha de observación. B) Entrevista. C) Prueba. D) Cuestionario. E) Lista de cotejo.

7. En cuanto a los fenómenos psicológicos, anote en el espacio en blanco con la expre- sión que mejor complete la idea inconclusa, luego marque la respuesta correcta: “Los Procesos Psicológicos Superiores (PPS), se caracterizan por ser específica- mente humanos y se desarrollan en los niños a partir de la incorporación de la __________”. A) Familia. B) Escuela. C) Cultura. D) Información. E) Lengua.

8. Anote en el espacio en blanco, la expresión que mejor complete la idea inconclusa, luego marque la alternativa que estime correcta. “Si se da un resultado teniendo como base solo los tests, estamos hablando de_______________”. A) Evaluación B) Resultados C) Medición D) Informe E) Psicometría UNIDAD I: “EVALUACIÓN Y MEDICIÓN EN PSICOLOGÍA”

3. Lea con atención y marque la respuesta a la que pertenece el siguiente enunciado “es la asignación de números para la representación de propiedades de los sistemas materiales, que pueden ser variables u objetos”. A) Evaluación B) Medición C) Evaluación y medición D) Cuantificación E) Medición y cuantificación

4. Anote en el espacio en blanco, la expresión que mejor complete la idea inconclusa, luego marque la alternativa que estime correcta.

edu.red

C) Solo en tercera persona CONSTRUCCIÓN DE INSTRUMENTOS PSICOLÓGICOS MANUAL AUTOFORMATIVO 45 Diagrama Objetivos Inicio D) En primera y en segunda persona E) Iniciar con tercera persona y finalizar en primera persona. Desarrollo de contenidos Actividades Anotaciones Autoevaluación

GLOSARIO DE LA UNIDAD Lecturas seleccionadas

Recordatorio

Objetivos Glosario Bibliografía 1. Test: Instrumento de medición diseñado especialmente para estudiar de un modo objetivo o sistemático el nivel de los sujetos respecto a algún atributo o característica 2. Cociente intelectual: Norma cronológica consistente en la razón entre la EDAD MENTAL y la EDAD CRONOLóGICA x 100 3. Coeficiente de correlación: Medida de la relación conjunta entre dos variables que indica hasta qué punto la variación de una de ellas conduce a la obtención de valo- res más altos (o más bajos) en la otra. 4. .Error de medida: Diferencia entre la puntuación verdadera de un sujeto y la pun- tuación verdadera estimada mediante el modelo de regresión. 5. Fiabilidad: Criterio métrico de la calidad de un test (o un ítem) que informa acerca de la precisión de las medidas obtenidas y del error aleatorio que las afecta. 6. Fiabilidad (Coeficiente de): Correlación entre las puntuaciones empíricas obteni- das por una muestra de sujetos en dos test paralelos. Se expresa como el cociente entre la varianza de las puntuaciones verdaderas y la varianza de las puntuaciones empíricas obtenidas en un test. 7. Validación: Proceso mediante el cual se recoge toda la información posible y nece- saria para poder hacer inferencias adecuadas a partir de las puntuaciones obtenidas Inicio en los test. 8. Nivel de confianza: Probabilidad de que el parámetro se encuentre dentro del inter- valo cuyos límites están definidos por el valor del estadístico (más/menos) el error máximo de estimación. os Actividades Autoevaluación s Glosario o Anotaciones BIBLIOGRAFIA DE LA UNIDAD: Bibliografía 1. ANASTASI, Anne. Test Psicológicos, méxico 1998. 2. ARAGóN, Laura Edna L., Silva, A. Fundamentos teóricos de la evaluación psicológi- ca. México D.F. 2002 3. Casal, Buela. Sierra, J. C. (1997) Manual de Evaluación Psicológica: Fundamentos, Técnicas y Aplicaciones. Madrid: Siglo Veintiuno Editores S.A. 4. Cordero, A. La Evaluación Psicológica en El Año 2000. Madrid: TEA Ediciones S.A. 1997. 5. http://www.ula.ve/personal/cargos_unicos/psicologo.htm 6. http://glosarios.servidor-alicante.com/psicometria UNIDAD I: “EVALUACIÓN Y MEDICIÓN EN PSICOLOGÍA”

9. En relación a los indicadores lea la siguiente afirmación “los indicadores son refe- rentes conductuales donde se manifiesta el constructo que se desea medir y están definidos a partir ___________________l”, luego marque la respuesta correcta: A) Del marco Teórico B) De la población C) De las situaciones de medida D) De las Hipótesis E) De las Escala

10. En cuanto a los ítems, deben ser redactados en: A) Solo en Primera persona B) Primera o Tercera persona

edu.red

DIAGRAMA DE PRESENTACIÓN DE LA UNIDAD CONTENIDO CONSTRUCCIÓN DE INSTRUMENTOS PSICOLÓGICOS MANUAL AUTOFORMATIVO 47 BIBLIOGRAFÍA EJEMPLOS AUTOEVALUACIÓN ACTIVIDADES Diagrama Objetivos Inicio Desarrollo de contenidos

Lecturas seleccionadas Diagrama UNIDAD II: LOS ÍTEMS EN LOS INSTRUMENTOS PSICOLÓGICOS Actividades Autoevaluación

Glosario Bibliografía Objetivos Inicio Recordatorio Anotaciones Desarrollo Actividades Autoevaluación de contenidos Lecturas seleccionadas Glosario Bibliografía

edu.red

48 1 PAUTAS PARA LA ELABORACIÓN DE ÍTEMS Un ítem es cada una de las partes o unidades de que se compone: Una prueba, un test o un cuestionario. 7

Según lo afirman Tornimbeni, Silvia. (2004) existen pautas convencionales para la redacción de ítems de prueba. Estas incluyen recomendaciones tales como: redac- tar ítems congruentes con el objetivo de medición y evitar los ítems demasiado lar- gos (de más de 20 vocablos), las oraciones complejas con ambigüedades de sentido, las frases con dobles negaciones, el uso de expresiones extremas (nunca, siempre, todos) y utilizar el lenguaje más apropiado al nivel de maduración y educativo de la población (Osterlind, 1990).

Para Nunnally (1991) los dos errores más comunes en la redacción de ítems son: a) ambigüedad (preguntas difusas que admiten varias respuestas) y b) trivialidad (centrarse en aspectos poco importantes del rasgo o dominio en cuestión) Existen formatos de selección de respuesta y de construcción de respuesta, los pri- meros facilitan la calificación automatizada y pueden aplicarse con facilidad a gran cantidad de evaluados. El formato de selección de respuesta en presentar una elec- ción de respuestas y requerir la selección de una alternativa. Existen tres tipos: los ítem de opción múltiple, los ítem de relación y los ítem de verdadero/falso.

1.1 REGLAS GENERALES a. Tener en cuenta que el ítem corresponda al constructo del instrumento, la es- tructura de la prueba y con las dimensiones disciplinares Todas las preguntas de una prueba deben ser independientes entre sí. b. La información de un ítem no debe servir de pauta para contestar otra, ni la respuesta a un ítem debe depender de haber encontrado primero la de otra anterior. c. Ningún ítems pueden contestarse por sentido común y aquellos cuya respues- ta dependa únicamente de recordar un término, un símbolo, un dato o la fecha en que ocurrió un evento. d. Evitar expresiones rebuscadas que puedan confundir, debe ser contextualiza- da. Se recomienda emplear un lenguaje directo, sencillo y comprensible. e. Los ítems no deben tener juicios de valor explícito o implícito.

1.2 REGLAS SOBRE LOS ENUNCIADOS a. Los enunciados deben ser afirmativos, en caso de ser necesaria la negación, se debe resaltar para llamar la atención hacia la formulación negativa. La doble negación afecta la comprensión (“No es cierto que no procedan los recursos”). b. Evitar enunciados demasiado extensos y poco atractivos ya que desmotivan la lectura, disminuyen el tiempo de respuesta y fatigan. c. Garantizar la coherencia interna del enunciado y de este con las opciones de respuesta.

1.3 REGLAS SOBRE LAS OPCIONES a. Las opciones de respuesta deben pertenecer al mismo campo semántico. b. Las opciones de un ítem no deben dar indicaciones sobre la clave por ofrecer un cierto contraste evidente de: • • • longitud precisión / imprecisión uso común / técnico generalización/particularización 7 www.rae.es/drae UNIDAD II: “LOS ÍTEMS EN LOS INSTRUMENTOS PSICOLÓGICOS”

TEMA N° 1: CONSTRUYENDO LOS ÍTEMS

edu.red

CONSTRUCCIÓN DE INSTRUMENTOS PSICOLÓGICOS MANUAL AUTOFORMATIVO 49 UNIDAD II: “LOS ÍTEMS EN LOS INSTRUMENTOS PSICOLÓGICOS”

c. No se deben repetir expresiones en las opciones de respuesta, si éstas se pue- den incluir en el enunciado del ítem. Repetir la misma palabra del enunciado en cualquiera de las opciones lleva a que sea elegida como respuesta, sin serlo necesariamente. d. Debe evitarse en las opciones las expresiones “todas o ninguna de las ante- riores”, en su lugar es necesario construir alternativas de respuesta plausibles para las personas que no tengan el dominio conceptual que exige el ítem. e. Realizar una revisión gramatical y ortográfica de cada uno de los ítems.

1.4 FUNDAMENTACIóN CONCEPTUAL Es la fase en la cual se aborda conceptualmente el objeto del instrumento de eva- luación y, en general, se desarrollan, desde una perspectiva teórica, los elemen- tos contextuales, legales, disciplinares, metodológicos, etc., que darán sustento y significado al proceso de evaluación. Entre los elementos que hacen parte de la elaboración conceptual están: • El propósito de la prueba psicológica (¿para qué la evaluación?) • El objeto de prueba psicológica (¿qué se evalúa?) • Las características de la población objetivo (¿a quién se evalúa?) • Los usuarios de la prueba psicológica (¿a quién le será útil la evaluación y de qué manera?)

1.5 PARTES DE UN íTEM DE SELECCIóN MÚLTIPLE CON ÚNICA RESPUESTA Las partes básicas de un ítem de selección múltiple son el contexto, el enunciado y las opciones de respuesta.

1.5.1 CONTEXTO Es la información que sitúa conceptualmente al evaluado. Provee elemen- tos necesarios y suficientes para focalizar la tarea de evaluación. La selec- ción o elaboración del contexto es una labor exigente en cuanto su propó- sito es justamente contextualizar y no confundir al evaluado.

1.5.2 ENUNCIADO Es el planteamiento, propiamente dicho, de la problemática que se espera sea resuelta por el evaluado, por tanto, dirige el esfuerzo del evaluado para generar o seleccionar una respuesta, por lo cual es fundamental que esté escrito en lenguaje claro y preciso. Recuerda que se redacta en primera o tercera persona, tiempo presente de modo afirmativo.

1.5.3 OPCIONES DE RESPUESTA Las opciones son posibles respuestas a la problemática planteada en el enunciado. En el formato de selección múltiple con única respuesta, como su nombre lo indica, sólo una de estas opciones es verdaderamente perti- nente para obtener el perfil.

Otros formatos de selección admiten más de una opción como respuesta válida. En la actualidad, cada vez con más frecuencia, los instrumentos de evaluación psicológica incorporan formatos de ítems en los cuales cada opción de respuesta es ponderada de acuerdo con su grado de validez o pertinencia.

1.6 REGLAS PARA LA ELABORACIóN DE íTEMS DE SELECCIóN MÚLTIPLE CON ÚNICA RESPUESTA a. Haga una programación juiciosa de todas las fases del diseño del instrumento y, particularmente, de la fase de elaboración de ítems contemplando tiempos de revisión, ajustes y edición. b. El dominio en la disciplina o campo que se evaluará debe combinarse con el

edu.red

50 • • • • • Contenido trivial Presencia de información irrelevante Presentación ambigua de las opciones de respuesta Discriminación muy fina –difícil de percibir entre las opciones de respuesta Presentación de información en modo distinto a como ha sido aprendida 2 por la población evaluada, dentro de su proceso educativo. b. Cada ítem debe corresponder a una tarea de evaluación definida en la estruc- tura de prueba. c. Evite evaluar el mismo aspecto específico con varios ítems. Aproveche cada ítem para hacer cada vez más completa la evaluación. d. Plantee una sola problemática en cada ítem. e. Evite ítems que incluyan posiciones ideológicas o prejuicios. f. El vocabulario utilizado debe ser adecuado para la población objetivo. g. Cada ítem debe ser independiente y no proveer información para responder a otros. h. No utilice ítems que aparezcan en libros, revistas u otros documentos, como base para sus ítems. Elabore ítems originales. i. Evite plantear ítems cuya respuesta válida se determine según la opinión de quien la elabora.

OPERACIONALIZACIÓN DE VARIABLES Citando a Jacobs y Razavieh, 1982 el término variable se define como las caracterís- ticas o atributos que admiten diferentes valores como por ejemplo, la estatura, la edad, el cociente intelectual, la temperatura, el clima, etc. Existen muchas formas de clasificación de las variables.

De acuerdo con el sujeto de investigación las variables se clasifican en categóri- cas y continuas. Las variables categóricas clasifican a los sujetos distribuyéndolos en grupos, de acuerdo a algún atributo previamente establecido, por ejemplo, el idioma, la ocupación, etc. Este tipo de variables se subdividen a su vez en dos: varia- bles dicotómicas que poseen dos categorías por ejemplo hombre-mujer, y variables policotómicas que establecen tres o más categorías, por ejemplo estado civil, nivel académico, etc. Son variables continuas cuando se miden atributos que toman un número infinito de valores, como por ejemplo, el peso, la talla, la estatura, etc.

2.1 LA OPERACIONALIZACIóN DE LAS VARIABLES Es un proceso que se inicia con la definición de las variables en función de facto- res estrictamente medibles a los que se les llama indicadores. UNIDAD II: “LOS ÍTEMS EN LOS INSTRUMENTOS PSICOLÓGICOS”

conocimiento en medición y evaluación. En lo posible, cuente con el apoyo de alguien con experiencia en el tema. c. Un buen ítem, por lo general, ha experimentado toda una metamorfosis des- de su versión original, realice sesiones de socialización o análisis conjunto de los ítems elaborados con el fin de que cada uno tenga oportunidad de hacer aportes a la cualificación de todos los ítems (tanto en lo que refiere a la forma como al contenido). d. Use un lenguaje directo, sin sacrificar el nivel técnico y académico del pro- ceso. La claridad y concreción en el lenguaje debe ser una consideración permanente. e. Asegúrese de que en ninguna parte del instrumento (portada, textos, instruc- ciones, ítems, etc.) haya errores de ortografía, de gramática o de puntuación, que no se incluya incorrectamente abreviaciones, citas, nombres, cifras, fe- chas, etc.

1.7 REGLAS SOBRE EL CONTENIDO DE LOS íTEMS a. Evite elaborar ítems que confunden al evaluado. Diferentes estudios han es- tablecido cuáles son algunas de las situaciones que llevan a percibir los ítems como confusos; entre éstas están:

edu.red

CONSTRUCCIÓN DE INSTRUMENTOS PSICOLÓGICOS MANUAL AUTOFORMATIVO 51 3 TIPOS DE ESCALAS: Se entenderá por medición al proceso de asignar el valor a una variable de un elemento en observación. Este proceso utiliza diversas escalas: nominal,

Partes: 1, 2, 3, 4, 5

Página anterior

Volver al principio del trabajo

Página siguiente