Validez, estandarizacion, fiabilidad

ValidezEn el campo de la metrologa, psicometra y estadstica, la validez es un concepto que hace referencia a la capacidad de un instrumento de medicin para cuantificar de forma significativa y adecuada el rasgo para cuya medicin ha sido diseado. De esta forma, un instrumento de medida es vlido en la medida en que las evidencias empricas legitiman la interpretacin de las puntuaciones arrojadas por el test.Pero en el caso de variables psicolgicas es necesario probar de forma emprica que el instrumento es vlido para aquello que dice evaluar. No obstante, ms que el test en s mismo, lo que se somete a validacin son las posibles inferencias que se vayan a realizar a partir de los resultados obtenidos. La validez, pues, no debe ser una caracterstica propia del test, sino de las generalizaciones y usos especficos de las medidas que el test proporciona. Es importante sealar que un instrumento de medicin no tiene un coeficiente fijo de validez que vaya a servir para cualquier propsito o para cualquier grupo de individuos, sino que siempre depender de la correcta eleccin del criterio a valorar (variable criterio) y la muestra seleccionada.La validez es el resultado de un proceso de recopilacin de evidencias empricas sustentado en supuestos tericos que, en suma, permiten emitir un juicio valorativo que afirme la pertinencia y la suficiencia de las interpretaciones basadas en los resultados de una prueba. Este juicio no depende nicamente de los tems de la prueba, sino tambin de la muestra sobre la que se efecte el test, y del contexto de aplicacin.Validez de contenidoLa validez de contenido es esencial a la hora de realizar inferencias o generalizaciones a partir de los resultados del test. Un caso particular de la validez de contenido es la denominada validez aparente. Una prueba posee una validez aparente adecuada cuando produce en los sujetos a los que se aplica la impresin de que efectivamente es una prueba adecuada. Es un tipo peculiar de validez de contenido, pero que tiene su parte de importancia al poder influir sobre la motivacin de los participantes, que pueden mostrar una actitud negativa ante la prueba si no perciben que sta tenga el sentido que se le supone.Validez predictivaTambin conocida como validez criterio, validez relativa al criterio o validez de pronstico, se refiere al grado de eficacia con que se puede predecir o pronosticar una variable de inters (criterio) a partir de las puntuaciones en un test. Es frecuente que en los procesos de seleccin de personal se utilicen instrumentos que pretendan determinar o predecir el rendimiento futuro de los candidatos al puesto de trabajo basndose en las respuestas obtenidas. Para ello es necesario que se haya obtenido una evidencia emprica de que los resultados obtenidos en la prueba correlacionen efectivamente con el rendimiento futuro en el puesto de trabajo.Validez concurrente o simultnea El test y el criterio se miden al mismo tiempo (concurrentemente). Puede utilizarse para validar un nuevo test por comparacin con otro ya validado previamente.Validez de pronsticoEl criterio se mide pasado un periodo de tiempo tras la aplicacin del test. Es el tipo ms habitual en los procesos de seleccin de personal, en los que se pretende predecir el rendimiento futuro de los sujetos.Validez retrospectivaEl test se aplica un tiempo despus del criterio que se pretende evaluar. til cuando se pretende dilucidar mediante una prueba algn aspecto del pasado que actualmente no es accesible.

Validez de constructoLa validez de constructo, pues, hace referencia a la recogida de evidencias empricas que garanticen la existencia de un constructo psicolgico en las condiciones exigibles a cualquier otro modelo o teora cientfica.3 Por todo ello, la validez de constructo se presenta como una condicin indispensable a la hora de valorar la eficacia de un instrumento de evaluacin sobre una variable psicolgica determinada.Validez factorialSe trata de una tcnica de reduccin de datos que permite encontrar grupos homogneos de variables a partir de un grupo de variables mucho ms numeroso. Los criterios de formacin de grupos se basan en la necesidad de que las variables a agrupar correlacionen entre s, y cumplan el requisito de ser independientes. Es decir, formarn un grupo aquellas variables que, siendo independientes entre s, muestren un ndice de correlacin elevado. Validez convergente-discriminanteEste tipo de validez se determina a partir de los resultados arrojados por la matriz multirrasgo - multimtodo (diseo MRMM, sistematizado por Campbell y Fiske en 1959). El sistema consiste en realizar mediciones de varios rasgos con distintos mtodos de medicin. De este modo podemos encontrarnos con varios resultados.Validez convergenteExiste validez convergente cuando las mediciones del mismo rasgo realizadas con distintos mtodos correlacionan entre s. El hecho de que un mismo rasgo sea detectado por igual con varias metodologas diferentes, es un indicador fiable de la existencia real de ese rasgo. Se dice que en este caso, las medidas convergen.Validez discriminanteSe refiere al grado de diferenciacin entre distintos constructos a partir de un nico sistema de medicin. FiabilidadEn el campo de la psicologa, la educacin y la investigacin social, la fiabilidad (tambin llamada tcnicamente confiabilidad) es una propiedad psicomtrica que hace referencia a la ausencia de errores de medida, o lo que es lo mismo, al grado de consistencia y estabilidad de las puntuaciones obtenidas a lo largo de sucesivos procesos de medicin con un mismo instrumento.Es necesario aclarar que la fiabilidad no es una propiedad de los test en s mismos, sino de las interpretaciones, inferencias o usos especficos que se hagan a partir de los datos y medidas que estos proporcionan. Asimismo, no puede hablarse de la fiabilidad en trminos absolutos; s cabra hablar del grado de fiabilidad que puedan presentar los instrumentos de medida en un contexto de aplicacin determinado.A partir de la variabilidad en las puntuaciones encontradas tras una serie de mediciones repetidas puede determinarse el ndice de precisin, consistencia y estabilidad de un instrumento. En el supuesto de que el resto de condiciones se mantengan inalteradas, puede concluirse que, a mayor variabilidad de resultados, menor fiabilidad del instrumento de medicin.No obstante, uno de los principales problemas que se presentan en el campo de la investigacin en ciencias sociales tiene que ver con la dificultad de conseguir que las distintas medidas se realicen exactamente en las mismas condiciones. La fiabilidad hace referencia a la estabilidad y consistencia de las mediciones en aquellos casos en los que no existen razones tericas o empricas que nos hagan suponer que la variable que se mide se haya visto modificada de forma significativa por los sujetos, por lo que se asume su estabilidad.Coeficiente de fiabilidadEl coeficiente de fiabilidad ({\rho_{xx'}}) es la correlacin entre las puntuaciones obtenidas por los sujetos en dos formas paralelas de un test (X y X'). Suponiendo que las dos formas del test sean realmente paralelas (es decir, midan realmente lo mismo), las puntuaciones de los sujetos deberan ser iguales en ambas aplicaciones. As, cuando la correlacin es igual a 1, la fiabilidad es mxima. El grado en que el coeficiente de fiabilidad se aleje de 1 ser un indicador del grado de error aleatorio de medida que estaremos cometiendo en la aplicacin de las pruebas. Estimacin emprica del coeficiente de fiabilidadDesde la Teora Clsica de los Test (TCT) se han propuesto diferentes procedimientos para calcular la fiabilidad. Algunos de ellos son los siguientes:Formas paralelasEste procedimiento es el que se deriva naturalmente del modelo. Requiere que se utilicen dos pruebas o instrumentos paralelos, esto es, que midan lo mismo de forma diferente (por ejemplo, dos test que con diferentes preguntas midan un determinado rasgo). Despus se comparan los dos test, calculando el coeficiente de correlacin de Pearson. Esta correlacin ser, como hemos visto en el apartado anterior, el coeficiente de fiabilidad. Si la correlacin es alta, se considera que hay una buena fiabilidad. Test-retestCon este mtodo el coeficiente de fiabilidad se calcula pasando mismo test dos veces a los mismos sujetos. Se pueden pasar inmediatamente, o dejando un intervalo de tiempo entre el test y el retest. Despus se calcula la correlacin de Pearson entre las puntuaciones de ambas aplicaciones, y el resultado obtenido ser el coeficiente de fiabilidad. Se considera un caso especfico de formas paralelas, dado que evidentemente un test es paralelo a s mismo. Al resultado obtenido se le denomina coeficiente de estabilidad, al servir de indicador de hasta qu punto son estables las mediciones realizadas durante la primera aplicacin del test. Las diferencias en los resultados se atribuyen al grado de consistencia interna o muestreo de los tems de la prueba en el caso de pasar el retest de forma inmediata, y se le suman las fluctuaciones en el tiempo en el caso del intervalo temporal.Dos mitadesA diferencia de los anteriores, este mtodo slo requiere una aplicacin del test. Tras obtener las puntuaciones obtenidas por los sujetos en cada una de las dos mitades en que se habr dividido, se procede a calcular la correlacin entre las dos puntuaciones. El resultado obtenido ser un indicador de la covariacin entre ambas mitades, es decir, de la consistencia interna del test. La principal dificultad de este sistema es asegurarse de que ambas mitades sean efectivamente paralelas. Un sistema habitual es dividir el test entre los tems pares y los impares; no es recomendable dividirlo sin ms por la mitad, dado que muchos test muestran un incremento gradual de la dificultad de sus tems.Relaciones entre fiabilidad y otros factoresHay dos factores que afectan al grado de fiabilidad de un test: la variabilidad y la longitud.Fiabilidad y variabilidadEl tipo de muestra de sujetos que se haya escogido para calcular la fiabilidad de un test puede influir en el resultado obtenido. Esto significa que la fiabilidad ya no depende nicamente de las caractersticas del test, sino tambin de la muestra de sujetos a los que se aplique, por lo que no se puede decir que un mismo test tenga un coeficiente de fiabilidad fijo. Fiabilidad y longitudEn trminos generales, puede decirse que la fiabilidad de un test aumenta a medida que aumenta su longitud, es decir, su nmero de tems. Ello no significa que resulte recomendable alargar innecesariamente un test en pro de aumentar su fiabilidad, ni que cualquier test pueda convertirse en un instrumento fiable por el nico medio de aumentar indefinidamente su longitud. ESTANDARIZACIONSe conoce como estandarizacin al proceso mediante el cual se realiza una actividad de manera standard o previamente establecida. El trmino estandarizacin proviene del trmino standard, aquel que refiere a un modo o mtodo establecido, aceptado y normalmente seguido para realizar determinado tipo de actividades o funciones. Un estndar es un parmetro ms o menos esperable para ciertas circunstancias o espacios y es aquello que debe ser seguido en caso de recurrir a algunos tipos de accin.El trmino de estandarizacin tiene como connotacin principal la idea de seguir entonces el proceso standard a travs del cual se tiene que actuar o proceder. Al mismo tiempo, esta idea supone la de cumplir con reglas que, si bien en ciertos casos pueden estar implcitas, en la mayora de las oportunidades son reglas explcitas y de importante cumplimiento a fin de que se obtengan los resultados esperados y aprobados para la actividad en cuestin. Esto es especialmente as en el caso de procedimientos de estandarizacin que se utilizan para corroborar el apropiado funcionamiento de maquinarias, equipos o empresas de acuerdo a los parmetros y standard establecidos.Sin embargo, estandarizacin tambin puede hacer referencia a la idea de que un elemento, producto, conocimiento o forma de pensar se iguala a los dems. Aqu entra en juego la idea de globalizacin y mundializacin, que supone que un producto o bien de consumo es fabricado de acuerdo a determinadas reglas de estandarizacin y por tanto se realiza de igual manera en Japn, en Brasil o en la India. La estandarizacin, entonces, es en este sentido el fenmeno mediante el cual los diferentes procesos de fabricacin globales convergen hacia un nico estilo que predomina a nivel mundial y que busca establecer similitudes entre cada tem sin importar de dnde provengan estos o hacia donde vayan. Esta visin del trmino estandarizacin ha recibido importantes crticas por representar la anulacin de la diversidad a nivel global.

Validez, estandarizacion, fiabilidad

Documents

Transcript of Validez, estandarizacion, fiabilidad