Construcción de Pruebas (Brown)

11
  JU ~ ,. I J ~ \ d \ ~ . j L o s proced imient os utilizados p r construir pruebas psicologicas tienen  , , como fin asegurar que estas alcancensus finali dadys y metas deseadas. Esto ~ < se logra mediante laaplicaciondelosprincipiosdernedicionanalizadosen el  I., capftulo 11. Aun cuando el proceso exacto varfa.idependi endo de l tipo de  \ prueba  psicologi ca, se puede establecer una secuencia general en los pasos  ::de construcci6n de las pruebas psicologicas, qu e incluyen laespecificacicn de su fmalidad, la construccion y la cornprobacion de reactivos, el ensam blaje d e la forma final de la prueba, el analisis y estandarizacion de las ca li fi cacionesde la prueba psicologica. En la construccion de cualquier prueba 1  especff ica, se pueden omitir algunas de las etapas. Puede variar su orden 18 h 1 0  se  pueden llevar a cabo varias etapasde manera simultanea. Sin embargo,  ~ , , ; esp osible identificar un a frecuenc iageneral(ver la fi g. 2-1). , . En este capitulo se presentara una revision general del proceso de  :,: d e ~ o n o de pruebas psi col ogi cas , para mostrar en forma ampIia el modo , en que se ajustan las etapas, unas a otras, A continuation, en los capltulos que siguen, tomareinos en consideration las etapas individuales. Durante toda la exposicion, es preciso recordar qu e el proceso de desarrollo de J}r Uebaspsicologicases un a ciencia y un arte. Utiliza tanto el razonamiento  estadfstico como el logico y equilibra la s consideraciones practi ces con las teo ncas. La meta es la de desarrollar un instrumento tecnicamente apropia do,dentro de las limitaciones practicas.  ~ .  ~ ,, Antes de iniciar el analisis de la construccion de pruebas psicologicas, ~ f : - . ~ . , t . . ~ - = .. , es prec so hacer hincapie en dos puntos evidentes, que sepasan po r alto con ,I demasiadafrecuencia. Enprimer lugar, en muchas situaciones, unaprueba es s610 un o de entre varies metodos posibles de obtencion de la informacion deseada, Por ejemplo, si dcseamos medir los conocimientos de maternaticas if o de un estudi ante de secundaria Ie podemos aplicar un examen. Alternativa m e nt e , p od r fa m os utilizar sus calificaciones en los cursos de matematicas o pedirles a los maestros que califica ran sus conocimientos. Si hay algun  r-  otro metodo mas precis o 0 practico p r obtener  informacion deseada se , 1\:;.- de beIi utilizar de preferencia un examen 0 un a prueba.  l ; ; i l ~ 1  :e . , , ~ u n u ~  2 I Especiticaciones dela finalidad I I Traducclfm dela finalidad en terminos operacionales I I Delineacion del Definicion del Anilisis d8lu8stos contenldo y las I dentificaci ndelos habilidades rasgo critarios  10 rasgos componentes I Elaboracion delos reactivos Revi iones I i Comprobacion  delos reactivos D iscriminacibn Djficultad Alternativas apropiada s V~lidacion cruzada I I Estructuracibn delaforma final dela p r u e b ~ I standarizacion A p l i c ~ c i b n Lineamientos Limites de tiempo Calificacicnes I Anilisis tecnico dela prueba Confiabilioad Validez Normas ~ Prueba lista para utilizarse  on struccton de pru eba s psicologi cas Fig. 2-1. Etapasen laconstrucclondeuna prueba. En segundo lugar, existen pruebas publicadasdisponiblesen la mayorta de. ,lOS c a m p o ~ de la actividad psicologica (Buros, I 974a). Asi, podemos utihzar con trecuencia prueba e x i st e n te , en lugar de construir nue~a Por supue s t o, las ventajas de l us a de una ya existente es el ahorro de t l e m p ~ . y e s f u ~ r z o de construccionde la prueba y  disponibilidadde la informacion previa respecto a la eficacia de  prueba y el significado de 2 . . . CONSTRUCCION DE PRUE S P S ~ C O l O G I C A S : GENER ll ES  I , J Brown, F. (1980) Medición en Psicología y Educación. México: El Manual Moderno  Brown, F. (1980) Medición en Psicología y Educación. México: El Manual Moderno

description

Medición en Psicología y Educación (Brown, 1980), Cap. 2: Construcción de pruebas

Transcript of Construcción de Pruebas (Brown)

  • "JU ~ ,."I

    J ~,,, \

    .. '. d\'~'.jLos procedimientos utilizadospara construir pruebas psicologicas tienen"," , como fin asegurar que estas alcancen sus finalidadys y metas deseadas. Esto

    ~

  • 22 Construccion de pruebas psicol6giCtU [Capitulo 2) Construccton de pruebas pstcologicas 23

    .> JI

    sus calificaciones. EI mayor inconveniente es el de que puede no haberpruebas publicadas que sean optimas para la situacion dada.

    LO QUE REPRESENTAN LAS PRUEBASPSICOLOGICAS

    Las funciones de las pruebas psicologicas se pueden ver a partir dei diversas perspectivas. En el capitulo I, analizamos varias clasificaciones'posibles de las pruebas. Otro plan de clasificacion que nos ayudara a com-prender el proceso de su construccion establece una distincion entre 10 querepresentan y 10 que predicen las pruebas psicolegicas. Desde este punto devista una prueba psicol6gica es una representaci6n cuando sus reactivosson similares a las conductas que nos interesa medir y es predictor, cuandose enfoca en alguna conducta, no considerada en la prueba que deseemospredecir.

    Para ilustrar el concepto de la prueba psicologica como representacion,supongamos, por ejemplo, que deseamos medir la capacidad de un ninopara sumar numeros de tres dfgitos, Podriamos pedirle al nirto que resol-viera un gran numero de problemas de suma de dos numeros de tres dfgi-'tos; sin embargo, esto daria como resultado una prueba sumamente prolon-gada. En lugarde ello, podriamos escoger una muestra de problemas y

    .pedirle al nino que los resolviera. En base a su ejecuci6n en esos problemas,seria posible inferir hasta que punta podria obtener buenos resultadosen toda la gama de problemas posibles. La exactitud de nuestra inferenciadependerfa de 10 bien que hicieramos el muestreo de los reactivos incluidosen la prueba psicologica, a partir de todo el conjunto potencial de reactivos.Si por algiin error de muestreo escogieramos muchos reactivos faciles,sobreestimarfamos su capacidad; si los problemas dificiles estuvieran repre-sentados en exceso, su capacidad sesubestlmaria. No obstante, el metodode selecci6n de reactivos esta claro. Hacemos un muestreo sistematico dereactivos del conjunto total de reactivos potenciales. La muestra de reactivosincluida en la prueba representa, por 10 tanto, el dominio 0 universo dereacti\l'bs posibles.

    Aun cuand~ las pruebas de ejecuci6n tales como la aritrnetica y devocabulario, proporcionan los ejernplos mas claros de las pruebas comorepresentaci6n, este concepto se puede aplicar tambien a otros campos.Supongamos que deseamos medir la honestidad de los nines de la escuelaprirnaria. Uno de los modos posibles de hacerlo serfa escoger una muestrade situaciones en las que un nii'\o tenga oportunidad de demostrar su hones-'ti~iad, 0 su falta de ella, Y observar si, en esas situaciones, es realmentehonesto. Podrfamos dejar que el nino corrigiera su propia hoja de examenes,permitirle ver las respuestas para un examen inminente 0 darle Ia oportuni-dad de sacar a escondidas de la clase algun objeto valioso, AI observar su

    conducta en esta muestra de situaciones, podr iamcs hacer inferencias res-pecto a su honestidad.

    Goodenough (1949) hizo otra distinclon dentro de 13 c1ase de pruebasrepresentativas. Las clasific6 como muestras y como signos, La base primor-dial de su distinci6n es la claridad con la que se pucde definir el universomuestreado, En su clasificacion, una prueba es una muestra cuando losreactivos son obtenidos de un universo clararnente definido; es un signa.cuando el universo es abierto y no esta definido claramente. La irnplica-ci6n del termino "signo" es que la prueba indica 0 senala la naturalcza deluniverso, objeto del muestreo. As! pues, las pruebas que son muestra scconsidera que describen el universo, mientras que las de signos, 10 explican.

    La idea de una prueba como un signo se puede aclarar por medio dedos ejernplos, Tomemos en consideraci6n la creatividad , que es un conceptomuy utilizado; pero que se define raramente con c1aridad. Un buen metodopara abordar el estudio de la creatividad podria ser el desarrollo de unaprueba de aptitudes y de resolucion de problemas que parezcan medir lacapacidad creativa. A continuacion, relacionariamos las calificacionesobtenidas en esas medidas con otros indices de creatividad, tales como lasclasificaciones hechas por jueces expertos, La obtencion de premios porrealizaciones creativas 0 el exito en ocupaciones que requieren capacidadesde creacion. Si esos estudios dernuestran que las cahficaciones obtenidasen esa prueba se relacionan con esos resultados, habremos contribuido adefinir 10 que se entiende por creatividad. En esencia, nuestra prueba psico-logica habra servido como un "signo" que indique la presencia de capacida-des creativas.

    o bien, tomemos en consideracion la inteligcncia. Uno de los modosde definir la "inteligencia" es mediante los tipos de (areas incluidas en laspruebas de in teligencia. AI utilizar el concepto de pruebas psicologicascomo signos, la consabida frase de "inteligencia es 10 que mide una pruebade inteligencia", que', se cita con frecuencia, no es simplemente una defi-nicion circular.' Mas bien, indica que la buena ejecuci6n de las tareas inclui-das en una prueba de inteligencia es una indicacion de que la persona encuestion es .inteligente. ,

    En general, el concepto de muestreo es mas apropiado para las pruebasde rendimiento, en las que se especifican, por 10 comun con c1aridad, elcontenido y las habilidades que se deben medir. Sin embargo, al medirconstrucciones utilizadas en las teorias psicologicas, el universo se sueledefinir de modo incompleto. En este caso, es mucho mas apropiado cor.si-derarlas como pruebas de signos.

    PRUEBAS PSICOLOGICAS PREDICfIVAS

    En muchas situaciones, nos interesa una prueba debido a que suscalificaciones nos perrniten predecir el modo en que se desempefiara una

    Aysbel GonzlezUnderline

    Aysbel GonzlezUnderline

    Aysbel GonzlezUnderline

    Aysbel GonzlezUnderline

    Aysbel GonzlezUnderline

    Aysbel GonzlezUnderline

    Aysbel GonzlezUnderline

    Aysbel GonzlezUnderline

    Aysbel GonzlezUnderline

  • 24 Construccion de pruebas pstcolozicas [Capitulo 2) Construccion de pruebas psicologicas 25

    persona en una situacion cualitativamente diferente. Por ejernplo, aunque#t.~una 'prueba de adrnision a la universidad puede incluir muchos reactivos, ' 1 de:. vocabulario, no nos interesa en sf mismo el vocabulario del alumno;

    eri,'l~gar de ello, deseamos conocer la caIificaci6n obtenida por cad a estu-dianteen el vocabulario, debido a que predice su rendimiento en la univer-sidad. El interes se enfoca en 10 que se predice y no en el predictor. Nosinteresa el rendimiento de un alumno en la prueba tan solo porque predicealguna .otra conducta, 0 caracteristicas ,de interes, Asi, el hecho de si los

    1, readivos de una prueba son un muestreo adecuado de un universe dado 0:.;;~; rto,;tien:~, relativamente poca importancia. _l ." ....... '!.' -....., ..' ,

    ':".' ":'El'elemento esencial en' una prueba predictiva es que sus calificaciones.,' \ se relacionan con. el, comportamiento de interes (el criterio), Hasta dondeR,tr: s~iecCi6n, dereactlvos para esa prueba se base en la exactitud con la que~i.~~,p,~~tce:u~a conducta externa, se podran incluir en ella, reactivos que pa-", 'rezeanno .tener ninguna relaci6n 16gica con la conducta que se este tomando, em .consideracion. Por eiemplo, en un inventario de intereses se puede- , U;cl~. un reactivo en el que se Ie pregunte a la persona si Ie gusta [ugar al",' go'tr. L6gicamente, este reactive puede tener muy poca relacion con cual-

    quier elecci6n vocacional, con la excepcion posible de la de un golfistapm.f~si~;n.~l. "Sin embargo, si se puede demostrar q~e el agrado por ~l go~f

    II" est4relacionado con los intereses por otras ocupaciones, se podria incluir" estelieactivo en laprueba, ya que vaticinarfa los intereses en esas ocupa-

    ,j. I. J" _ ,clones,i f ~ .' .;,'~.': ::,'-vb:;',~""'0:'1\';.totE 1'~,: REPRESENTACION POR PREDICCIONICJI,kf.,:)i;(iUI ,:)~III "ril6bDU'~dlstfh'ci6n entre las pruebas representativas y las de prediccion se!1\\r reriere "a :$i los reactivos de la prueba y la conducta relevante, no contenidatp:;~lEit'elta,:lso'nsiJnilareso'diferentes.Si 13 prueba y laconducta no contenida!t:$>!I'~t\~lellil'so'n"esen'cialmentesimilares , se dice que la ptl1eba"rep'resenta la

    '1:~'-~oli(fJ'cta:' reievarife; slsondfferentes, la prueba es d~ 'pi'edicci6n.. Elpro--~8~E1aesihono'deia'pniebU'variar4 dependiendo de si 'fUrlCi.orlata como

    'ihhi'tnu'estn: un signo o unapredicclon. Cuando la pruebase construyepara muestra, se seleccionaran reactivos tornados slstematicamente de ununlverso definido y' la. evaluacion consistira en detenninar 10 adecuado delmuestreo. Por otra parte, cuando una prueba espredictora, la etapa crucial

    k;.'!iI. :seralla.de establecer, empfricamente, que existe una relaci6n entre el reactivet'-; ,y.::la -conducta que se intenta predecir.

    La distincion no es una dicotomia clara, ya que la misma pruebapuede ser de muestra y de predicci6n. Como ilustraci6n de esto, podemosdecir que se podrfa desarrollar una prueba mediante el muestreo de reactivosenseflados en los cursos de matematicas de secundaria. AI administrar esaprueba a los alumnos que ingresan a la preparatoria, se pod ria utilizar para

    predecir el exito academico en una carrera de ingenierfa. Asi, la misma prue-ba sirve 10 mismo como muestra (del rendimiento en matematicas de secun-daria) que como predictor (del exito en ingenierta); sir. embargo, el procesode construccion de pruebas variara, depeudiendo de las iunciones primor-diales de ellas, Si la meta principal es la de desarrollar una prueba que midael rendimiento en matematicas, el muestreo representative del universo delos problemas de maternaticas sera una condicion sine qua non para la selec-cion de reactivos; si la exactitud de la prediccion es 10 mas importante, larepresentatividad del muestreo ' se subordinara al poder predictive comobase para la seleccion de los reactivos. As! pues, aun cuando la pruebapuede servir para ambos fines, se resaltara uno u otro en el proceso de cons-truccion.

    FINALIDAD DE LA PRUEBA

    Desde un punta de vista pragmatico, el constructor de pruebas tieneque tomar dos decisiones irnportantes: determinar el contenido de la pruebay su formato. 0 sea que debe determinar las conductas, los conocimientoso las habilidades que cubrira esta y como se presentaran los reactivos. Sinembargo, antes de poder tomar esas decisiones, deberan hacerse dos pregun-tas previas: .. i,para que fines servira laprueba?" y "i,qu~ grupo de sujetosseran sometidos al examen?". Las respuestas a estas dos preguntas estable-ceran lfmites y sugeriran c6mo seguir adelante en el proceso de construcci6nde la prueba.

    La pregunta relativa a la finalidad es predorninante. Comunrnente, sedesarrolla una pruebq para alguna cornbinacion de usos y finalidades, masque para un solo proposito. Aun cuando este proposito se define por 10comun, al menos de m)lnera implicita, es muy conveniente una declaraci6nexplicita y completa de sus fines.Por ejemplo, la flnalidad de la CollegeEntrance Examination Board's Scholastic Aptitude Test (SAT) Prueba deAptitudes Escolares del Conse]o de Examenes de Admisi6n a la Universidadse describe como sigue:

    Puesto que las escuelas secundarias difieren muche en sus cursos, sus normasacademicas y sus practicas de calificacion, los funcionarios encargados de laadmision a la universidad necesitan contar con a1guna medida estandar decapacidad para comparar las solicitudes de los candidates procedentes dedistintas escuelas.

    I Una prueba utilizada como predictor es una muestra de conducta, en un sentidoamplio, puesto que los reactlvos que flguran en el son s610 una muestra de todeslos posibles en eJ universo.

    Aysbel GonzlezUnderline

    Aysbel GonzlezUnderline

    Aysbel GonzlezUnderline

    Aysbel GonzlezUnderline

    Aysbel GonzlezUnderline

    Aysbel GonzlezUnderline

  • 26 Construccion de pruebas psicologicas (Canitulo 2) Construccion de pruebas pslcologicas 27

    (,'

    >I!! , .EI SAT es una prueba objetiva con duracicn de tres horas, destinada" "",.a proporcionar una medida estandar de las capacidades verbales y materna-

    \ \,'> ~-ticas de los candidates a ingresar a la universidad. Lassecciones verbales del': "- r: )'.SAT pondran a prueba Ia capacidad para comprender las relaciones entre~~ ";IP.Wt1as paIabras y las ideas y entender 10que se lee. Las secciones maternatlcas',' 0: 'tryr;npoilen:aproeb'a Ia capacidad para comprender simbolos matematicos y utili-te \'\'0 o.zarlos en Ia resolucion de problemas (College Entrance Examination Board,"... 'J" [.,.1971. pags. 5,6). '., ", i ... -Observese que esta declaracion no s610 explica la finalidad de la prueba~~":~llit5:qtinubrayael contenido. " ."..,~tfo"'f;'~~)JJ':"rr'-",T I':""'!! .'-1" "OW::-; [I" ~~"r ,;!-:-:": :~:: . La otra consideraci6n primordial es la de la composiciony las caracte-."."" ~ ~ -;;r,t";"'. ',:100 (," '"

  • 28 Construccion de pruebas pslcologicas (Capttulo 2) Construcci6n de pruebaspsico/6gicas 29

    FORMATO DE LA PRUEBA

    E1 constructor de una prueba debe determiner tambien el mo~o.en quese presentaran los reactivos. ~Utilizara una prueba de papel y lapiz o serequerira algun tipo de aparato? ~Tendrlin que reconocer sim.~leme~t~ lossujetos la respuesta correcta, como en las preguntas de elec.clOn mu1t~ple,

    ~. deberan dar la respuesta correcta por si mismos? ~Que importancia seconcedera a la velocidad de respuesta? A continuaci6n se dan algunos de losformatos de pruebas mas comunes.

    lmportancia relativa que se atribuye a cada categoria de contenido delas habilidades. En 1a fig. 2-2 se da un ejernplo simple del plan de, una

    .. , ,proeba para una unidad de estadistica descriptiva. Observese que las are~sC:,h\;'~, d'e.'con'tenido que se cubren se indican en un eje, mientras que las c~p.acI-dades que se miden estan en el otro. Los porcentaies dentro de las ca~ll1a~indican la proporcion de reactlvos de la prueba psicologica qu.e se de~lcara

    ~ "cada tema. Esas proporciones deben refleiar la importancia r:lahva decada area. Por supuesto, el plan de una prueba para un examen mas prolon-gado 0 amplio tendda que ser mas extenso.

    , E1 plan de una prueba psicol6gica sirve .para dos ~ines. En la etapade' elaboracion de los reactivos, indica la cantidad y el tipo .de .ello~ ,que es

    I redactar A continuacion se puede comparar 1a distribucion realprecso., . dide los reactlvos en la forma final de la prueba con las proporciones 10 rca-da~e'n el plan, para determiner si los reactivos sirven de hecho para efectuarun muestreo adecuado del universe de que se trate.

    "" , 1'10.

    ,0 'f

  • ,3D Construccion de pruebas psicologtcas (Capitulo 2) Construccion de pruebas pslcologicas 31

    ;~l_

    Como en la mayoria de los casos, cualquier reactivo puede presentarse'en varios fonnatos; el problema es elegir el "meior", Hay dos considera-

    ci~nes que ayudan a tomar una decision entre fonnatos posibles: las caracte-risticas de sujetos que han de tomar la prueba y ciertos factores practices.

    , Elpapel de la composicion del grupo examinado se puede ilustrar medianteItI' " ja'practica deadrninistrar examenes orales a los niflos pequenos y las perso-

    nas' con capacidades limitadas para la lectura, y el uso de pruebas con uncontenido verbal minima para las personas con deficiencias de lenguaje, Las

    'consideraciones practicas se ilustran mediante el empleo de reactivos de,'efecci6n multiple en las pruebas a nivel nacional de adrnision a las universi-'aa'des'donde, debido al volumen de las priiebas aplicadas el unico rnetodo'facHble de calificarlas es el de utilizar maquinas electronicas de alta velo-cidad.

    desarrolladas por los editores de pruebas comerciales. Hay grupos de especia-listas, que trabajan a partir del plan de la prueba, para escribir reactivos quecubran las areas de contenido y habilidades que se requieren. Al principio,se escribcn muchos mas reactivos de los que se necesitaran, debido a queseran nurnerosos los que se eliminen mediante los analisis sucesivos. Acontinuacion, se revisan y corrigen las primeras redacciones de las preguntas,tanto POI parte de los escritores originales como por otras personas. Lacorreccion irnplica la elirninacion de la redaccion ambigua, el fortaleci-miento de las alternativas debiles y la exclusion de reactivos duplicados y,par ende, inutiles.

    ANALISIS Y COMPROBACION DE REACTIVOS

    Los reactivos que sobreviven a esta seleccion inicial se combinan, acontinuacion, en una 0 mas formas de prueba previa. Estas pruebas previasse aplican a una muestra de personas similares a las que se exarninara con laprueba terminada. Por ejernplo, para una prucba de rendimiento, las prue-bas previas se aplicaran a los alumnos del mismo nivel escolar y Que tenganlos mismos antecedentes de informacion que requiera la prueba. 1...:1 metade la comprobacion previa es obtener informacion sobre como reaccionanlos aJumnos ante los reactivos. Esta prueba consistira en comentarios cuali-tativos, tales como los de ambigl.iedades percibidas en los reactivos, e indicescuantitativos de la dificultad y el poder de discrirninacion de los reactivos .

    La dificultad de los reactivos es el porcentaje de personas que respon-den a elias correctamente. EI conocer la dificultad de ellos es importantepara que el constructor de la prueba pueda estructurar un examen de ciertonivel de dificuitad. Por ejernplo, se puede desear una prueba dificil si sedestina a seleccionar estudiantes para una educacion 0 un adiestramientoavanzado. Aunque-e] concepto de dificultad tiene sentido en el caso de quelos reactivos tenganrespuestas correctas (pruebas de ejecuci6n maxima), susignificado puede no ser tan claro en reactivos en que no haya respuestas"correctas", tales como en las pruebas de personalidad. Sin embargo, enel caso de los reactlvos de eiecucion tfpica, podemos desear cierto patronde respuesta (por ejernplo, el porcentaje de acuerdo con una afirmacion).

    EI Indice mas importante es el del poder discriminative de los reactivos,Este analisis estadistico indica la amplitud con la que el reactivo mide 10que debe medir. Idealmente debera disponerse de un criterio externo demedida, con el fin de que se pueda determinar empiricamente si las perso-nas que respondieron correctamente a un reactive obtuvieron tam biencalificaciones elevadas en el criterio. En la practica, esas medidas externasfrecuentemente no se encuentran djsponibles. Como substituto de ellas,se utiliza la calificacion total en la prueba como medida de criterio y secornparan las respuestas a los reactivos individuates con las caiificaciones

    ELABORACION DE LOS REACfIVOS

    CONSTRUCCION DE LA PRUEBA

    :s Aun cuando utilizaremos el t~rmino de "redaccion de reactivos" para referirnos aIproceso de construcclon de los reactivos de pruebas, algunos de estos (como losque se incluyen en las pruebas de ejecuci6n) pueden tener componentes no verba-les y, por ende, en terminos estrictos, no se escriben ni se redactan.

    1.'.. ;."

    L,

    "

    ,L Despues de tomar esas decisiones preliminares, quien desarrolla la prue:,.,:~:..f1.f" l-1?a:,e~lara:listo, para comenzar a redactar! los react~vos. ?6na Ivezrmas, tendra

    , "varias opciones para actuar. Tomemos en consideraci n as uentes que.L' \'podrian utilizarse para desarrollar reactivos individuales. "Para un examen

    'en ,~Iase, 1el maestro puede utilizar libros de texto, t~eas:de lectura, expo-':J$idoit'es f debates en clase, como fuentes para las preguntas, En contraste,

    ren las 'p'mehas de rendimiento desarrolladas para usarse en diversas escuelas,los redactores de los reactivos no toman solarnente en ,consideracion untexto sino varios utilizados ampliarnente; no emplean las opiniones de un

    , . ,.",

    iOl EI procesode desarrollo de buenosreactivos es la redacci6n, correcci6n,prueba y revision, A'continuacion, se repiten estas etapas hasta desarrollarreactivos satisfactorios. Por ejernplo, tomemos en consideracion las pruebas

    Aysbel GonzlezUnderline

    Aysbel GonzlezUnderline

    Aysbel GonzlezUnderline

    Aysbel GonzlezUnderline

    Aysbel GonzlezUnderline

    Aysbel GonzlezUnderline

    Aysbel GonzlezUnderline

    Aysbel GonzlezUnderline

    Aysbel GonzlezUnderline

  • 32 Construccian de pruebas psicologicas (Capitulo 2) Construccion de pruebas psicologicas 33

    ,qS}" -totales, con el ~in de detennin~ si las personas q~e obtuvieron caIificaciones~ ..;ele:vadas~ ell' la'[prueba respondleron a un reactive en forma correcta coni;'~\ ..mayor frecuencia que las que obtuvieron calificaciones mas baias, CuandolIl..1: ~;(' ~~s.toJocurre,.se dice que el reactivo discrimina. Observese que, en esta situa-'vi! .~i~nila discriminacion se refiere al hecho de efectuar distinciones entre

    : personas que tengan conocimientos 0 habilidades mayores 0 menores en el.,)

  • 34 Construccion de pruebas psicologicas (Capttuio 2) Construccion de pruebas psicologicas 35

    1. VOCABULARIO

    Fig. 2-3. Ejemplo de las direcciunes de prvebas.

    Dispondran de tres minutes para completar esta prueba,

    NO DEN VUELTA A LA PAGINA HASTA QUE SE LESINDIQUE QUE LO HAGAN

    EA B r: 0.. I .. ..

    Frecuente: A) siempre B) a menudoC) nunca D) muy E) pronto

    "A ~enudo" es 10 que mas se acerca en significado a "frecuente", por 10 que se trazouna linea continua entre las lineas de puntos de la derecha, bajo la B.

    Marquen una respuesta para cada palabra. Si no conccen el significado de una palabrahagan la mejor eleccion que puedan. '

    Cada palabra de prueba, en mayusculas, va seguids por cmco respuestas posibles,La respuesta correcta es la palabra que signlfique casi exactamente 10 mismo que lapalabra de.la prueba. Haga una linea Ilena con el lapiz en el espacio que queda entreel par de lineas de puntos, a la derecha, que corresponda a la respuesta correcta. Ejemplo:

    A. Indicaciones para un examen en el salonde clase (resctivos de elec-cion multiple).Seleccionen la alternativa correcta para cada reactivo y marquensu letra en el lugar apropiado de la hoja de respuestas.

    B. Direcciones para una prueba de aptitudes.

    La mayoria de':las medidas de eiecucion tfpica se administran sin limited.e tiempo; sin embargo, cuando se mide rendimiento 0 aptitudes, la velo-cldad. s~ele ser un fa~tor importante. Se puede establecer un continuo parad.e,scnblr las pruebas, b~sado en el papel que juega la velocidad en la ejecu-

    cl~n. Por un lado existen pruebas estrictamente depoder en los que alsujeto se Ie da tiempo ilimitado para responder a reactivos presentados enorden creciente de dificultad. Por consiguiente, las calificaciones indicanel nurnero de reactivos a las que se respondio de manera correcta 0 biendicho de otro modo, el nivel de dificultad alcanzado. Por otro lado 5~

    encuentr~n las prueba~ de limite de tiempo 0 velocidad. En las pruebasde velocidad, los reactivos son tan sencillos que cualquiera pueda respon-

    de, la exposicion anterior se ha centrado en el modo en que se desarrollaeste conjunto estandar de reactivos, no parece necesario hacer comentariosadicionales al respecto.

    Aplicaci6nAun cuando se aplicaron los mismos reactivos a todos los sujetos, las

    calificaciones no sedan comparables a men os que se aplicaran en las mismascondiciones. Por supuesto, la comparabilidad total es imposible, debidoa que una prueba se aplicara a diferentes personas, en diversos tiempos yJugares y por diferentes examinadores. Sil!. embargo, es posible eliminargran parte de la variabilidad extrana, utilizando instrucciones prescritaspara la aplicaci6n de las pruebas, limites de tiempo estandar y metodosobjetivos de calificacion.

    Por 10 comun se requieren dos conjuntos de instrucciones: uno paraquien se sornete a la prueba y otro para quien la aplica. En el primero se

    !kn" debeexplicar, en forma tan clara y simple como resulte posible, el modoeli que el sujeto debe responder a los reactivos. Esas instrucclones se irnpri-men at comienzo de la prueba," de preferencia en una pagina separada, Ypueden ir desde las instrucciones mas simples, de una sola frase para losexamenes en el salon de clase hasta las clausulas mas cornplejas sobre exarne-nes estandarizados (ver la fig. 2-3). Las indicaciones dadas a los sujetos

    I" deben indicar .el modo en que se elegira una respuesta, como marcarla(por ejernplo, en el librito de la prueba 0 en una hoja de respuestas porseparado) y los limites de tiempo. En muchas pruebas, las instruccioneslncluiran tarnbien una indicacion relativa a como responder cuando no se,.este~.seguro. Por 10 cornun, es conveniente tambien incluir varios reactivos

    '!-;>o ~. de muestra. La inclusi6n de estos ultlmos es esencial, cuando el formatosea desconocido para los suietos." Las indicaciones para quien aplica la prueba se imprimen en un manualpor separado. Estas direcciones incluyen las que se dan at sujeto, con unaexplicacion mas amplia sobre sus derivaciones. Estas instrucciones incluyentam bien detalles sobre aspectos tales como la disposici6n del salon de exa-menes, la distribucion de rnateriales, el registro del tiempo y de las califica-ciones. Tambien se deberan dar instrucciones sobre como manejar losproblemas y las preguntas que se presenten durante la sesi6n de examen.

    Uno de los aspectos preponderantes de cualquier procedimiento demedici6n es el de los lfrnites de tiempo. En muchos casos, dichos limites sedeb~n en parte a restricciones practices, tales como la duracion de los perfo-

    .n':H1,i ,aBS-de 'clase, No 'obstante, es preferible que los lfrnltes de tiempo esten:r' detenninados por consideraciones psicometricas y las finalidades de la~''''. ,'p'tiieba misma. .

    s 51 una prueba tiene varias s~cciones (subpruebas) que requieren diferentes indica-clones, se deberan incluir lineamientos separados at comienzo de cada secclon.

    De E. E. Cureton y sus colaboradores, The Multi-Aptitude Test, Nueva York: ThePsychological Corporation, 1955.

    Aysbel GonzlezUnderline

    Aysbel GonzlezUnderline

    Aysbel GonzlezUnderline

    Aysbel GonzlezUnderline

  • J6 Construccion de pruebas psicologtcas (Capttulo 2) Construccion de pruebas psicologicas 37" ;~\ ~~,rlps con facilidad, en el caso de que cuente con un tiempo suficiente. para ello; sin embargo, se establecen lfmites de tiempo para que sean pocas

    personas, las que puedan concluir la prueba, en el caso de que haya alguna.En ese caso, las calificaciones reflejan diferencias en la velocidad de res-puestas y no en la dificultad.

    La mayoria de las pruebas caen entre esos dos extremos. Una buena.regia practica, que se utiliza con frecuencia en las pruebas de rendimiento yaptitudes, es establecer limites de tiempo que permitan que aproximada-mente 90% de los sujetos concluyan en el tiernpo permitido. Adernas, si

    'isei,disponen .105 reactivos en orden de dificultad creciente, la mayor ia de!~~.,Jlers6nas podran completar todos aquellos a los que puedan responder de~d a,Pl"(\anera:.correcta. Las ventajas administrativas de este procedimiento son

    evidentes.

    Cali1icaciones. EI tercer elernento de la estandarizacion es el de las calificaciones

    objetivas. La objetivldad implica un acuerdo entre dos 0 mas calificadoresat { .competentes (preparados), De modo ideal, el acuerdo entre diferentes

    callflcadores tiene que ser perfecto. En la practica, sobre todo en el casode-reactivos de respuestas libres, dicho acuerdo sera mucho menos completo.Una regia empirica consiste en considerar la calificaci6n como objetiva

    ,: ~'" slel acuerdo promedio entre pares de calificadores competentes es de 90%'~nlo(mas, S610 en el caso de que la calificacion sea objetiva se podran atribuir

    -:.~ ... [as, diferencias entre las calificaciones a las diferencias existentes entre lostlr5l\t.sujetos exarninados,' '.' z ': ',. ,.

    c. ,. " ,j_..~*I'..l'..!..-L~Un: cuando se dispone de una gran cantidad de tecnicas de cali fica-~~tr'Ci6t\;lde'sdemanualeshasta las que utilizan maquinas califlcadoras electro-1.'::1.'" nieas de alta velocldad, los requerimientos de la ::calificici6n objetiva se, , pueden reducir a tres etapas baslcas. La primera es la del registro inmediato

    ycarente de arnbiguedades de la respuesta. Tanto si el sujeto efectua unamlirCa en tina hoia de respuesta IBM, como si escribe una letra, una palabra,un numero, una frase 0 un ensayo, 0 responde en forma oral, su respuestase ;registrara de manera inmediata y completa. Este registro perrnanenteevita las distorsiones posibles debidas a perdldas de la memoria y propor-

    .;

  • 38 Construccion de pruebas pstcologicas (Capitulo 2) Construccton de pruebas psicologtcas 39

    3. Las-respuestas con una gran pobreza de contenido 0 que seanmuy vagas, incluso despues de hacer preguntas al respecto.

    Para los reactivos especfficos, se muestra un criterio general de califica-ci6n para cada palabra, al nivel de 2 puntos, dando a continuaci6n variosejemplos de respuestas. En algunos casos, se da un criterio general para lascalificaciones de I punto y 0 puntos, con varios ejernplos. Para otros reacti-vos no hay una generalizaci6n apropiada a los niveles de credito que van masal!Ade los proporcionados por los criterios generales de calificaci6n y s610

    n:o

    ' sei dan ejernplos de respuestas, Por supuestoj- esaslistas contienen s610 unascuantas de las numerosas respuestas que son posibles 0 que puedan dar lossujetos. No obstante, tienen como finalidad complementar las definicionesdadas en los diccionarios y los principios generales de calificaci6n, de talmodo que se facilite la tarea de calificar la prueba con exactitud.

    EJEMPLOS DE RESPUESTAS; VOCABULARIO*

    1. Silla.?puntas - un mueble para sentarse: asientosentarse... scntarse para comer1punta - mueble hecho de maderaopuntas - asentarse... objeto suave... estar en una reuni6n

    2. Enero2 puntas - primer mes del anoun meso .. el primer meso .. un mes de invierno frio1 punta - despues de diciembre... comienza el afio... Afio Nuevoes el 1 de eneroopuntos - un dios romano

    3. Construcci6n2 puntos - edificar 0 constituir algo; algo edificado sistematica-mente construir... erigir algo.. unir mediante un plan1 punto - construir un edificio... hacer... procesar una casaopuntos - dividir... apretar, reunir... utll

    Fig. 2-4. Ejemplo de un manual de calificaciones: Escala de inteligencia de Wechslerpara adultos (WAIS) (cont.l.

    Para preservar la seguridad del WAIS, no se utilizaron los reactivos reales. Los vocabloshipoteticos ernpleados son similares a los reales de la subprueba de vocabulario y elfonnato del manual de calificaclones es identico aI del manual del WAIS. Reproducidacon autorizacion, Copyright 1955 by the Psychological Corporation, Nueva York,N.Y. Derechos reservados,

    puestas diferentes reciben pesos diferentes, estos pesos deberan indicarseen la clave.

    EI tercer requisito es un procedimiento para comparar las respuestasdadas por el sujeto con las que figuran en la clave esto es, un procedimientopara c1asificar objetivamente las respuestas. En los reactivos de elecci6nalternativa, tales como los de elecciones multiples, este procedimiento esdirecto y evidente, Cuando el buen juicio del calificador puede ser uno delos factores irnportantes, como sucede al calificar exarnenes de ensayos,es preciso desarroIIar indicaciones detalladas para la asignacion de las califi-caciones. En el manual de (WAIS) Escala de Inteligcncia Wechsler paraAdultos (ver la fig. 2-4), se da un ejernplo excelente de especificacionespara la calificacion. Este manual de calificaciones proporciona ilustra-ciones de las respuestas aceptables y las variaciones permitidas. EI califi-cador cornpara las respuestas dadas por un individuo con los ejernplosproporcionados en el manual de calificaciones y, a continuaclon, asignaa cada respuesta la calificacion de la respuesra muestra que mas se acerque.Aun cuanJo este procedimiento no asegura un acuerdo perfecto en tre loscalificadores, logra que la calificaci6n sea objetiva .

    ANA.L1SIS PSICOMETRICO

    La apucacion de los procedirnientos analiz ados antes, solo asegurarauna cosa: que la calificacion dada a un individuo rcfleje sus capacidadeso sus caractcr isticas de pel sonalidad , y no las peculiaridades 0 las vicisitudcsde la situacion de prueba. No proporcionan Una respuesta para las preguntasirnportantes como: i.hasta que punta son consistentes las calificaciones dela prueba? ;,Que es 10 que rnide la prueba? i.Que inf'erencia se puedc sacarde las calificaciones de la prueba? i.Como se pueden interpretar las califica-ciones de la prueba? A estas preguntas sole se pucde dar una respuestamediante un analisis adicional, del que nos ocuparernos brevemente a conti-nuacion, Sin embargo, la importancia se indica por el espacio que sc II.:dcdica en cap itulos posteriores de este libro, y no por el enfasis que hacernosaqui.

    ConfiabilidadA menos que una prucba proporcione medidas consistentes, se podra

    tener muy poca fe en la exactitud de sus calificaciones Es decir un indivi-duo debera obtener, aproxirnadamente, las misrnas calificaciones en cadaaplicacion de una prueba. Sin consistencia, estas mcdiciones Son analogaa la medicion de distancias con una regla de caucho. Se obtendrian resulta-dos difercntes en cada ocasi6n (medtclon). depcnd ier.do de 10que se estirnrula regia. .

    Aysbel GonzlezUnderline

  • 40 Construccion de pruebas psicologicas , (Capttulo 2) Construccion de pruebas psicologicas 41

    Hemos indicado ya que para que la prueba se pueda aplicar a mas deun grupo se necesitaran datos normativos para cada g~po, puesto que

    , ., . A' . m es precise obrener datostodos tendran vartaciones entre S1. SI mlS 0., . : .adicionales de validez y confiabilidad, puesto que una prueba que es valida(0 confiable) en una situacion , no 10 sera necesari~~ente en otra: aun~luesea muy similar. Por ende, la reunion de [nformacion ~~bre u~la prueba esun proceso continue, que se debe seguir en tanto se utilice el ll1strumento.

    "

    La estimacion del grado de consistencia de una medicion, 10 que seconoce como confiabilidad de la prueba, requiere ya sea la aplicacion dela prueba dos veces, la aplicaci6n de formas equivalentes de la prueba 0 elanalisis de su estructura interna. En la practica, esto significa que el cons-tructor debe obtener una muestra representativa de sujetos, aplicar uno delos procedimientos mencionados y calcular un coeficiente de confiabiIidad.Puesto que hay diferentes tipos de confiabilidad, apropiados en situacionesdiferentes, el constructor de la prueba debera reunir varios tipos de pruebasde confiabilidad en diversas muestras (ver los capftulos 5 y 6).

    ValidezLa caracteristica mas importante de una prueba es su validez -0 sea,

    la extension con la que la prueba debe medir. Sin pruebas de la validezde una prueba no sabremos 10 que mide en realidad; asi, no sera posibleinterpretar 0 dar un significado a las calificaciones.

    Puesto que los reactivos que constituyen la prueba se seleccionaronparcialmente sobre la base de su poder discriminative, tendrernos la segur i-dad de que las calificaciones tendran cierta validez. Sin embargo, puestoque la prueba como un total puede ser algo mas que una suma de sus partes(los reactivos), es necesario reunir datos de validez, utilizando la pruebaen su forma final. Esto significa que es preciso utilizar la prueba en variassituaciones, en una gran variedad de grupos y determinando su eficacia(ver los capitulos 7 y 8). Puesto que la validez es una situacion especifica,la recopilacion de los datos de validez es esencialmente un proceso inter-minable. La obligaci6n del constructor de la prueba es la de proporcionardatos suficientes para saber que caracteristicas mide y que criterios predice

    Datos normativosLos resultados de las pruebas tienen por si mismos poco significado.

    S610 alcanzan un significado cuando se compara una calificaci6n individualcon los resultados obtenidos por otras personas en la misrna prueba, Alcomparar las calificaciones de un individuo con las de otras personas en una

    . poblaci6n especificada (que se llama grupo normative), obtenemos unaindicaci6n de su desernpefio relativo en cornparacion al de otros de la mismapoblaci6n. Asi, el constructor de la prueba puede reunir datos que muestranel desempeno de un grupo pertinente de personas. Puesto que, en la mayorfade los casas, deseamos cornparar las calificaciones de los individuos con lasde varies grupos diferentes, el que desarrolla la prueba debe proporcionardatos utiles para varios grupos normativos. Por otra parte, puesto que lascalificaciones en las pruebas psicologicas se expresan por 10 cornun en escalasque no son de calificaciones brutas, el constructor de la prueba debe desarro-lIar tam bien escalas apropiadas para cxpresar las calificaciones (ver los capf-tulos 10 y 1I).

    o

    Aysbel GonzlezUnderline

    Aysbel GonzlezUnderline

    Aysbel GonzlezUnderline

    Button7: