ESCUELA DE POSGRADO
MAESTRIA EN INGENIERIA CIVIL MENCION
EN RECURSOS HIDRICOS Y MEDIO
AMBIENTE
Curso: METODOLOGIA DE LA INVESTIGACION.
Tema: CONFIABILIDAD Y VALIDE EN UNA
INVESTIGACION CUANTITATIVA.
Grupo: Nº02
Integrantes:
Javier Ignacio Alarcón Ruiz
Carmen Rosa Carrasco Venegas.
Marisol Gumersinda León Silvera.
Iveth Cayo Núñez
Franz Renzo Núñez vega.
Indira Vivanco Campana.
AGOSTO 2015
INTRODUCCION
En la práctica es casi imposible que una medición sea perfecta. Generalmente se tiene un grado de
error. Desde luego, se trata de que ese error sea el mínimo posible, por lo cual la medición de
cualquier fenómeno se conceptualiza con la siguiente fórmula básica:
X = t + e
Donde X representa los valores observados (resultados disponibles); t, los valores verdaderos, y el
grado de error en la medición. Si no hay un error en la medición (e es igual a cero), el valor
observado y el verdadero son equivalentes. Esto puede verse claramente así:
X = t + 0
X = t
Esta situación representa el ideal de la medición. Cuanto mayor sea el error al medir, el
valor que observamos (en la cual nos basamos) se aleja más del valor real o verdadero. Por
ejemplo si medimos la motivación de un individuo y la medición está contaminada por un grado de
error considerable, la motivación registrada por el instrumento será bastante diferente de la
motivación real de ese individuo. Por ello es importante que el error se reduzca lo más posible.
Pero ¿cómo sabemos el grado de error que tenemos en una medición? Al calcular la confiabilidad
y la validez.
SOLUCION
1. En que consiste la confiabilidad en una investigación cuantitativa
CONFIABILIDAD
La concepción de confiabilidad de la evaluación del aprendizaje, bajo el enfoque cuantitativo, hace
referencia a la estabilidad o consistencia interna en las técnicas e instrumentos; y reside en
establecer la medida en que se puede replicar la evaluación: una exigencia al evaluador para que,
utilizando otros métodos y estrategias, llegue a idénticos resultados. La prueba y el test alcanzan
un elevado coeficiente de confiabilidad si los errores de medida se minimizan; es decir, cuando
toda medida de confiabilidad indica qué proporción de la varianza total de las puntuaciones es
varianza de error.
Existen tres tipos de confiabilidad en la evaluación cuantitativa: (a) la repetición de la prueba con
tiempo suficiente para que el evaluado olvide los ítemes, calculando el coeficiente de correlación
que permite conocer el grado de confiabilidad de dicha prueba; (b) las formas paralelas, técnica
similar a la anterior pero con pruebas no idénticas sino con ítemes equivalentes; y (c) división en
mitades, con el cual se calcula un coeficiente de consistencia interna, mediante la correlación
entre las puntuaciones de ambas mitades.
Este término hace alusión al grado en el que un instrumento produce resultados consistentes y
coherentes. Es decir, si el instrumento tiene aplicación repetida al mismo sujeto u objeto produce
resultados iguales. El cálculo de la confiabilidad está sustentado en fórmulas que producen
coeficiente de confiabilidad, oscilando entre 0 (nula confiabilidad) y 100 % (confiabilidad total).
Cuánto más se acerque el coeficiente a cero (0), mayor error habrá en la medición. La
determinación de la confiabilidad se realiza de la manera siguiente:
Aplicación de un instrumento de medición dos o más veces a grupo de personas u
objetos en cierto periodo. Si la correlación entre los resultados de las diferentes
aplicaciones es altamente positiva, el instrumento se considera confiable.
Al administrar dos o más versiones equivalentes al instrumento de medición
ocupado (en nuestro caso el método Vítora, y luego su semejante el método
Lugones). Las versiones son similares en contenido, instrucciones, duración y otras
características.
El instrumento es confiable si la correlación entre los resultados de ambas
administraciones es positiva de manera significativa.
Aplicación de un conjunto total de Item, las cuales se divide en dos mitades
equivalente y se comparan las puntuaciones, o los resultados de ambas. Si el
instrumento es confiable, las puntuaciones de las dos mitades deben estar muy
correlacionadas. Un individuo de baja puntuación en una mitad tenderá a mostrar
también una baja puntuación en la otra mitad.
Finalmente, a través del cálculo de coeficiente de confiabilidad, como por
ejemplo, a) el alfa de Cronbach (desarrollado por J. L. Cronbach) y b) el coeficiente
KR-20 y KR-21 de Kuder y Richardson (1937)
Concíbase como Instrumento de medición aquel recurso que registra información o datos sobre
las variables que tiene en mente. En términos cuantitativo: capturar verdaderamente la realidad
que se desea capturar. La función de la medición es establecer una correspondencia entre el
mundo real y el mundo conceptual. El primero provee evidencia empírica, el segundo proporciona
modelos teóricos para encontrar sentido a ese segmento del mundo real que estamos tratando de
describir.
2. En que consiste la validez en una investigación cuantitativa
VALIDEZ
La validez cuantitativa, bajo la perspectiva de la teoría positivista, se orienta fundamentalmente
hacia las técnicas e instrumentos de medición elaborados por el evaluador, supuestos
desarrollados a partir de las teorías planteadas por el filósofo francés Auguste Comte (1798-1857).
En esa perspectiva, la validez asociada a la evaluación del aprendizaje se concibe en términos de:
(a) precisar el rasgo del aprendizaje del evaluado que se pretende medir, como aprendizaje a
través de pruebas o tests, (b) predecir algún rasgo del aprendizaje adicional a lo que se pretende
medir, y (c) medir lo que se dice medir de cierto rasgo (Comte, 1896).
La palabra engloba el grado en el que un instrumento en verdad mide la variable que se busca. El
cálculo de la validez se realiza de la manera siguiente:
Revisión de cómo ha sido medida la variable por otros investigadores, de los cuales
resultarán ítems para medir las variables y sus dimensiones.
Consulta a investigadores familiarizados con la variable para ver si el conjunto de ítem es
verdaderamente exhaustivo.
Se administra los ítems, se correlacionan las puntuaciones de éstos entre sí (tienen que
haber correlaciones altas, en especial entre ítems que miden una misma dimensión).
VALIDEZ DE CONTENIDO. La validez de contenido está determinada por el grado en que un
instrumento refleja el dominio específico de lo que se mide. Este tipo de validez es de gran
importancia en pruebas de rendimiento. Para que un instrumento de medición tenga validez de
contenido, debe contener, representados, a todos los ítems del dominio de contenido de las
variables que se van a medir. Esto es, los ítems seleccionados, para incluir en la prueba, deben ser
una muestra representativa del universo de ítems asociados a la variable que se desea medir.
Evaluación de la validez de contenido. La validez de contenido de un instrumento se
determina mediante un detenido examen de los ítems. Cada ítem se juzga de acuerdo a si
representa o no el campo específico correspondiente. Generalmente se realiza por
evaluación de expertos; aun cuando también pueden usarse métodos similares a los
utilizados para evaluar confiabilidad.
VALIDEZ DE CRITERIO Se estima al correlacionar la medición con el criterio externo (puntuaciones
de un instrumento frente a las puntuaciones en el criterio), y este coeficiente se toma como
coeficiente de validez. Concíbase la Validez de Criterio como validar un instrumento de medición al
compararlo con algún criterio externo que pretende medir lo mismo.
Tipos de validez de criterio
Validez concurrente. El criterio se fija en el presente. Los resultados del instrumento se
correlacionan con el criterio en el mismo momento del tiempo.
Validez predictiva. Los resultados del instrumento se correlacionan con un criterio fijado en
el futuro. Por ejemplo, una prueba de admisión a la universidad debe reflejar el
comportamiento del estudiante a lo largo de la carrera.
Características de la evaluación de criterio
Debe ser relevante. Debe reflejar los aspectos más relevantes del criterio conceptual.
Debe ser confiable. La confiabilidad del criterio afecta a la validez de criterio en la misma
medida que la confiabilidad del predictor. Debe ser libre de predisposición o contaminación
VALIDEZ DE CONSTRUCTO Suele determinarse mediante procedimiento de análisis estadísticos
multivariados (“análisis de factores”, “análisis discriminantes”, “regresiones múltiples”). Concíbase
la Validez de Constructo como explicar el modelo teórico-empírico que subyace a la variable de
interés.
El proceso de validación de un constructo está vinculado con la teoría. No es posible llevar a cabo
la validación de constructo, a menos que exista un marco teórico que soporte a la variable en
relación con otras variables.
Etapas de la validez de concepto.
Para establecer la validez de concepto o de constructo, se deben seguir las siguientes
etapas:
• Se establece y especifica la relación teórica entre los conceptos.
• Se correlacionan ambos conceptos y se analiza cuidadosamente la
correlación.
• Se interpreta la evidencia empírica de acuerdo a qué tanto clarifica la
validez de constructo de una medición en particular.
Validez total. La validez total de una prueba es la suma de la validez de contenido, la validez
de criterio y la validez de concepto.
Entre mayor evidencia de validez de contenido, validez de criterio y validez de concepto
tenga un instrumento de medición; éste se acerca más a representar la variable o variables
que pretende medir.
El fondo del asunto es que los que validan tienen la obligación de revisar cuándo una práctica
tiene consecuencias apropiadas para los individuos y las instituciones, y especialmente prevenir
las consecuencias adversas.
MÉTODOS PARA EXPRESAR LA VALIDEZ.
Para expresar la validez de una prueba se utilizan métodos estadísticos, entre los cuales se pueden
destacar los siguientes:
• Coeficiente de correlación de Pearson.
• Coeficiente de determinación.
• Error estándar de la estimación.
• Tablas de expectación.
• Estadística discriminativa.
RELACIÓN ENTRE LA CONFIABILIDAD Y LA VALIDEZ.
Un instrumento de medición puede ser confiable, pero no necesariamente válido. De no ser así,
los resultados de la investigación no deben tomarse en serio. Supongamos que vamos a probar un
arma con tres tiradores. Cada uno debe realizar tres disparos, entonces:
El tirador 1. Sus disparos no impactan en el centro del blanco y se encuentran diseminados por
todo el blanco.
El tirador 2. Tampoco impacta en el centro del blanco, aunque sus disparos se encuentran
cercanos entre sí, fue consistente, mantuvo un patrón.
El tirador 3. Los disparos se encuentran cercanos entre sí e impactaron en el centro del blanco.
FACTORES QUE PUEDEN AFECTAR LA CONFIABILIDAD Y LA VALIDEZ.
Hay diversos factores que llegan a afectar la Confiabilidad y la Validez del instrumento de
medición e introducen errores a la medición. Muchos de los errores se pueden evitar mediante
una adecuada revisión de la literatura, que nos permite seleccionar las dimensiones apropiadas
para las variables del estudio, criterios para comparar los resultados de nuestro instrumento,
teorías de respaldo, instrumento de dónde elegir, y otros. A continuación mencionaremos los
errores más comunes:
Improvisación. La selección del instrumento o confección de uno no se toma a la ligera, solicita
suficiente tiempo y conocer muy bien las variables que se pretende medir, así como la teoría que
la sustenta. De igual manera, requiere amplios conocimientos en la materia, estar actualizados al
respecto y revisar con cuidado la literatura correspondiente.
Cultura y tiempo. Se debe considerar al aplicar un instrumento de medición el lenguaje y
contexto. A sí mismo, la cultura, los grupos y las personas cambian, y esto debemos tomarlo en
cuenta al elegir o desarrollar un instrumento de medición.
La no empatía. El instrumento resulta inadecuado para las personas a quienes se aplica. Utilizar un
lenguaje considerando conocimientos, memoria, nivel educativo, capacidades de
conceptualización y otros puede interferir en la confiabilidad y validez del instrumento.
Estilos personales de sujetos participantes. Por ejemplo, la deseabilidad social (tratar de dar una
impresión muy favorable a través de la respuesta), tendencia a sentir con respecto a todo lo que
se pregunta, dar respuesta inusuales o contestar siempre negativamente.
Condiciones de aplicabilidad. Se refiere a las condiciones reinante naturales, el tiempo o al diseño
operativo del instrumento de medición.
Falta de estandarización. Por ejemplo, que las instrucciones no sean las mismas para todo los
participante. O bien, que los instrumentos de observación no sean equivalentes. Este elemento se
vincula con la objetividad. La objetividad se refiere al grado en que el instrumento es permeable a
la influencia de los sesgos y tendencias de los investigadores que lo administran, califican e
interpretan. Los aparatos y sistemas calibrados son más objetivos que otros sistemas que solicitan
cierta interpretación y éstos, a su vez, más objetivos que las pruebas estandarizadas, las cuales son
menos subjetivas que las pruebas proyectivas.
La objetividad aumenta, al reducirse la incertidumbre. Desde luego, la certidumbre total no existe;
el comportamiento es aceptado como verdadero, hasta que nueva evidencia demuestra lo
contrario. La objetividad se refuerza mediante la estandarización en la aplicación del instrumento
(mismas instrucciones y condiciones para todos los participantes) y en la evaluación de los
resultados.
Aspectos mecánicos. Por ejemplo, la legibilidad del instrumento, incomprensión de las
instrucciones, y otros.
3. Como se determina la confiabilidad en una investigación cuantitativa
Formas de determinación de la confiabilidad
Prueba (Test – Retest). Con aplicación de un coeficiente de correlación.
Características:
El investigador debe aplicar el mismo instrumento dos veces al mismo
grupo después de cierto período.
Debe calcular la confiabilidad del instrumento ANTES de la aplicación
definitiva del mismo.
Coeficiente de Correlación de Pearson altamente positivo = Instrumento
confiable.
Debilidades:
El periodo de tiempo (corto – largo) entre las mediciones puede confundir
el coeficiente de confiabilidad.
Formas paralelas o equivalentes con aplicación de un coeficiente de correlación.
Características:
Se administran dos o más versiones equivalentes de un mismo instrumento.
Deben ser similares en contenido, instrucciones, tipos de preguntas y
dificultad.
Son administradas al mismo grupo en un período relativamente corto.
Los patrones de respuestas deben variar POCO entre las aplicaciones.
Coeficiente de Confiabilidad = Fórmula de Correlación de Pearson.
Debilidades:
Dificultad para obtener dos pruebas realmente paralelas
Implica doble trabajo
Confiable solo si la correlación entre los resultados de ambas aplicaciones
es positiva.
Método de mitades partidas (split-halves). Los procedimientos anteriores
(medida de estabilidad y método de formas alternas), requieren cuando menos
dos administraciones de la medición en el mismo grupo de individuos. En cambio,
el método de mitades-partidas requiere sólo una aplicación de la medición.
Específicamente, el conjunto total de ítems (o componentes) es dividido en dos
mitades y las puntuaciones o resultados de ambas son comparados. Si el
instrumento es confiable, las puntuaciones de ambas mitades deben estar
fuertemente correlacionadas. Un individuo con baja puntuación en una mitad,
tenderá a tener también una baja puntuación en la otra mitad. El procedimiento
se diagrama en la figura 9.5.
Kr21. (Procedimiento estadístico que utiliza resultados arrojados por el mismo
instrumento).
COEFICIENTE KR-20
Coeficiente KR-20. Kuder y Richardson (1937) desarrollaron un coeficiente para
estimar la confiabilidad de una medición, su interpretación es la misma que la del
coeficiente alfa.
Permite obtener la confiabilidad a partir de los datos obtenidos en una sola
aplicación del test. Coeficiente de consistencia interna. Puede ser usada en
cuestionarios de ítemes dicotómicos y cuando existen alternativas dicotómicas con
respuestas correctas e incorrectas.
Dónde:
n: número total de ítems
S²t: varianza de las puntuaciones totales
p: proporción de sujetos que pasaron un ítem sobre el total de sujetos
q = 1- p
COEFICIENTE KR-21
Permite obtener la confiabilidad a partir de los datos obtenidos en una sola
aplicación del test. La suposición básica es considerar que todos los ítems
presentan igual varianza. Coeficiente de consistencia interna.
Donde: n: número total de ítemes M: media aritmética de las puntuaciones obtenidas por los individuos s2t: varianza de las puntuaciones totales
𝐾𝑅20 =𝑛
𝑛−1 𝑆⬚2 𝑡 − 𝑝𝑞
𝑠⬚2 𝑡
Alfa de Cronbach. (Procedimiento estadístico que utiliza resultados arrojados
por el mismo instrumento). Este coeficiente desarrollado por J. L. Cronbach
requiere una sola administración del instrumento de medición y produce valores
que oscilan entre O y 1. Su ventaja reside en que no es necesario dividir en dos
mitades a los ítems del instrumento de medición, simplemente se aplica la
medición y se calcula el coeficiente.
Características:
Requiere sólo una aplicación del instrumento de medición. Produce valores que oscilan entre cero (0) y uno (1). No es necesario dividir en mitades los ítems del instrumento. Se aplica la medición y se calcula el coeficiente.
4. Como se determina la validez en una investigación cuantitativa Juicio experto.
1. Se seleccionan dos jueces o expertos, por lo menos, a los fines de juzgar, de
manera independiente, la “bondad” de los ítemes del instrumento, en términos de
la relevancia o congruencia de los reactivos con el universo de contenido, la
claridad en la redacción y la tendenciosidad o sesgo en la formulación de los
ítemes.
2. Cada experto recibe suficiente información escrita acerca de: (a) el propósito
de la prueba; (b) conceptualización del universo de contenido; (c) plan de
operacionalización o tabla de especificaciones (en el caso de las pruebas de
rendimiento académico).
3. Cada juez recibe un instrumento de validación en el cual se recoge la
información de cada experto. Dicho instrumento normalmente contiene las
siguientes categorías de información por cada ítem: congruencia ítem-dominio,
claridad, tendenciosidad y observaciones.
4. Se recogen y analizan los instrumentos de validación y se toman las decisiones
siguientes: (a) los ítemes donde hay un 100 por ciento de coincidencia favorable
entre los jueces (los ítemes son congruentes, están escritos claramente y no son
tendenciosos) quedan incluido en el instrumento; (b) los ítemes donde hay un 100
por ciento de coincidencia desfavorable entre los jueces, quedan excluidos del
instrumento; y (c) los ítemes donde sólo hay coincidencia parcial entre los jueces
deben ser revisados, reformulados, si es necesario, y nuevamente validados
Análisis estadísticos.
1. MEDIDAS DE TENDENCIA CENTRAL
a. MEDIA: Es la sumatoria de un conjunto de puntajes dividida por el
número total de los mismos.
b. MODA: Es el puntaje que ocurre con mayor frecuencia en una
distribución de datos
c. MEDIANA: Es el valor que divide a una distribución de frecuencias por
la unidad, una vez ordenados los datos de manera ascendente o
descendente.
2. MEDIDAS DE TENDENCIA CENTRAL
a) VARIANZA: es la suma de las desviaciones de la media elevadas al
cuadrado, dividida entre el número de observaciones menos uno.
b) DESVIACION ESTANDAR: Es la cantidad promedio en que cada uno de
los puntajes individuales varia respecto a la media del conjunto de
puntajes.
3. PRUEBAS ESTADISTICAS
a. PRUEBA T DE STUDENT: Es el estadístico de prueba que se utiliza cuando
las poblaciones son pequeñas (menos de 30)
b. PRUEBA Z: Es una prueba de distribución Normal, que tienen que ver con
la probabilidad de que un puntaje dado de una medición aparezca en una
distribución.
c. ANALISIS DE VARIANZA: Es una prueba estadística que se utiliza para
analizar si más de dos grupos difieren significativamente entre sí, en
cuanto a su medida y varianza.
d. ANALISIS DE COVARIANZA: Es una prueba que se usa para analizar la
existencia o no de relación entre una dependiente y dos o más
independientes
e. CHI CUADRADO: Es una prueba estadística que permite probar si más de
dos proporciones de población pueden ser consideradas iguales o, en
otros palabras no permiten probar si dichas proporciones no presentan
diferentes significados.
f. ANALISIS DE REGRESION Y CORRELACION
g. ANALISIS DE REGRECION MULTIPLE
h. ANALISIS DE FACTORES
i. ANALISIS MULTIVARIADO DE VARIANZA
En la actualidad los análisis estadísticos se realizan mediante el uso de programas estadísticos por
computadora, como el STAPGRAPHIC o SPSS
5. Cuál es la fórmula o parámetros estadísticos para calcular la confiabilidad
y validez de una investigación cuantitativa
Algunas de las fórmulas utilizadas para los procesos estadísticos mencionados son los siguientes:
𝐾𝑅20 =𝑛
𝑛−1 𝑆⬚2 𝑡 − 𝑝𝑞
𝑠⬚2 𝑡
Importante: se sugiere repetir la validación del instrumento puesto que es recomendable que el
resultado sea mayor o igual a 0,81
FUENTE: RUIZ (2002).
Validez de Contenido: Juicio de expertos.
Validez de Criterio: Correlacionar la medición con el criterio para obtener el coeficiente de
validez.
Validez de Constructo: Suele determinarse un procedimiento estadístico denominado
“Análisis de Factores”´.
Sólidos Conocimientos Estadísticos.
Programas apropiados de Computadoras
Requiere de un solo instrumento, produciendo valores entre 0 y 1: -1 a 0: No es confiable 0,01 a 0,49: Baja Confiabilidad 0,50 a 0,75: Confiabilidad Moderada 0,76 a 0,89: Confiabilidad Fuerte 0,90 a 1,00: Confiabilidad Alta
• BIBLIOGRAFÍA
Obando, T. (2,009). Modelación geomecánica y temporal de la licuefacción en suelos de minas no
metálicas. Estudio Caso: Ciudad de Managua (Nicaragua). Tesis Doctoral. Editorial Universidad
Internacional de Andalucía UNÍA (Huelva, España). Huelva. 900pág.