Download - tercer trabajo.pdf

Transcript

ESCUELA DE POSGRADO

MAESTRIA EN INGENIERIA CIVIL MENCION

EN RECURSOS HIDRICOS Y MEDIO

AMBIENTE

Curso: METODOLOGIA DE LA INVESTIGACION.

Tema: CONFIABILIDAD Y VALIDE EN UNA

INVESTIGACION CUANTITATIVA.

Grupo: Nº02

Integrantes:

Javier Ignacio Alarcón Ruiz

Carmen Rosa Carrasco Venegas.

Marisol Gumersinda León Silvera.

Iveth Cayo Núñez

Franz Renzo Núñez vega.

Indira Vivanco Campana.

AGOSTO 2015

INTRODUCCION

En la práctica es casi imposible que una medición sea perfecta. Generalmente se tiene un grado de

error. Desde luego, se trata de que ese error sea el mínimo posible, por lo cual la medición de

cualquier fenómeno se conceptualiza con la siguiente fórmula básica:

X = t + e

Donde X representa los valores observados (resultados disponibles); t, los valores verdaderos, y el

grado de error en la medición. Si no hay un error en la medición (e es igual a cero), el valor

observado y el verdadero son equivalentes. Esto puede verse claramente así:

X = t + 0

X = t

Esta situación representa el ideal de la medición. Cuanto mayor sea el error al medir, el

valor que observamos (en la cual nos basamos) se aleja más del valor real o verdadero. Por

ejemplo si medimos la motivación de un individuo y la medición está contaminada por un grado de

error considerable, la motivación registrada por el instrumento será bastante diferente de la

motivación real de ese individuo. Por ello es importante que el error se reduzca lo más posible.

Pero ¿cómo sabemos el grado de error que tenemos en una medición? Al calcular la confiabilidad

y la validez.

SOLUCION

1. En que consiste la confiabilidad en una investigación cuantitativa

CONFIABILIDAD

La concepción de confiabilidad de la evaluación del aprendizaje, bajo el enfoque cuantitativo, hace

referencia a la estabilidad o consistencia interna en las técnicas e instrumentos; y reside en

establecer la medida en que se puede replicar la evaluación: una exigencia al evaluador para que,

utilizando otros métodos y estrategias, llegue a idénticos resultados. La prueba y el test alcanzan

un elevado coeficiente de confiabilidad si los errores de medida se minimizan; es decir, cuando

toda medida de confiabilidad indica qué proporción de la varianza total de las puntuaciones es

varianza de error.

Existen tres tipos de confiabilidad en la evaluación cuantitativa: (a) la repetición de la prueba con

tiempo suficiente para que el evaluado olvide los ítemes, calculando el coeficiente de correlación

que permite conocer el grado de confiabilidad de dicha prueba; (b) las formas paralelas, técnica

similar a la anterior pero con pruebas no idénticas sino con ítemes equivalentes; y (c) división en

mitades, con el cual se calcula un coeficiente de consistencia interna, mediante la correlación

entre las puntuaciones de ambas mitades.

Este término hace alusión al grado en el que un instrumento produce resultados consistentes y

coherentes. Es decir, si el instrumento tiene aplicación repetida al mismo sujeto u objeto produce

resultados iguales. El cálculo de la confiabilidad está sustentado en fórmulas que producen

coeficiente de confiabilidad, oscilando entre 0 (nula confiabilidad) y 100 % (confiabilidad total).

Cuánto más se acerque el coeficiente a cero (0), mayor error habrá en la medición. La

determinación de la confiabilidad se realiza de la manera siguiente:

Aplicación de un instrumento de medición dos o más veces a grupo de personas u

objetos en cierto periodo. Si la correlación entre los resultados de las diferentes

aplicaciones es altamente positiva, el instrumento se considera confiable.

Al administrar dos o más versiones equivalentes al instrumento de medición

ocupado (en nuestro caso el método Vítora, y luego su semejante el método

Lugones). Las versiones son similares en contenido, instrucciones, duración y otras

características.

El instrumento es confiable si la correlación entre los resultados de ambas

administraciones es positiva de manera significativa.

Aplicación de un conjunto total de Item, las cuales se divide en dos mitades

equivalente y se comparan las puntuaciones, o los resultados de ambas. Si el

instrumento es confiable, las puntuaciones de las dos mitades deben estar muy

correlacionadas. Un individuo de baja puntuación en una mitad tenderá a mostrar

también una baja puntuación en la otra mitad.

Finalmente, a través del cálculo de coeficiente de confiabilidad, como por

ejemplo, a) el alfa de Cronbach (desarrollado por J. L. Cronbach) y b) el coeficiente

KR-20 y KR-21 de Kuder y Richardson (1937)

Concíbase como Instrumento de medición aquel recurso que registra información o datos sobre

las variables que tiene en mente. En términos cuantitativo: capturar verdaderamente la realidad

que se desea capturar. La función de la medición es establecer una correspondencia entre el

mundo real y el mundo conceptual. El primero provee evidencia empírica, el segundo proporciona

modelos teóricos para encontrar sentido a ese segmento del mundo real que estamos tratando de

describir.

2. En que consiste la validez en una investigación cuantitativa

VALIDEZ

La validez cuantitativa, bajo la perspectiva de la teoría positivista, se orienta fundamentalmente

hacia las técnicas e instrumentos de medición elaborados por el evaluador, supuestos

desarrollados a partir de las teorías planteadas por el filósofo francés Auguste Comte (1798-1857).

En esa perspectiva, la validez asociada a la evaluación del aprendizaje se concibe en términos de:

(a) precisar el rasgo del aprendizaje del evaluado que se pretende medir, como aprendizaje a

través de pruebas o tests, (b) predecir algún rasgo del aprendizaje adicional a lo que se pretende

medir, y (c) medir lo que se dice medir de cierto rasgo (Comte, 1896).

La palabra engloba el grado en el que un instrumento en verdad mide la variable que se busca. El

cálculo de la validez se realiza de la manera siguiente:

Revisión de cómo ha sido medida la variable por otros investigadores, de los cuales

resultarán ítems para medir las variables y sus dimensiones.

Consulta a investigadores familiarizados con la variable para ver si el conjunto de ítem es

verdaderamente exhaustivo.

Se administra los ítems, se correlacionan las puntuaciones de éstos entre sí (tienen que

haber correlaciones altas, en especial entre ítems que miden una misma dimensión).

VALIDEZ DE CONTENIDO. La validez de contenido está determinada por el grado en que un

instrumento refleja el dominio específico de lo que se mide. Este tipo de validez es de gran

importancia en pruebas de rendimiento. Para que un instrumento de medición tenga validez de

contenido, debe contener, representados, a todos los ítems del dominio de contenido de las

variables que se van a medir. Esto es, los ítems seleccionados, para incluir en la prueba, deben ser

una muestra representativa del universo de ítems asociados a la variable que se desea medir.

Evaluación de la validez de contenido. La validez de contenido de un instrumento se

determina mediante un detenido examen de los ítems. Cada ítem se juzga de acuerdo a si

representa o no el campo específico correspondiente. Generalmente se realiza por

evaluación de expertos; aun cuando también pueden usarse métodos similares a los

utilizados para evaluar confiabilidad.

VALIDEZ DE CRITERIO Se estima al correlacionar la medición con el criterio externo (puntuaciones

de un instrumento frente a las puntuaciones en el criterio), y este coeficiente se toma como

coeficiente de validez. Concíbase la Validez de Criterio como validar un instrumento de medición al

compararlo con algún criterio externo que pretende medir lo mismo.

Tipos de validez de criterio

Validez concurrente. El criterio se fija en el presente. Los resultados del instrumento se

correlacionan con el criterio en el mismo momento del tiempo.

Validez predictiva. Los resultados del instrumento se correlacionan con un criterio fijado en

el futuro. Por ejemplo, una prueba de admisión a la universidad debe reflejar el

comportamiento del estudiante a lo largo de la carrera.

Características de la evaluación de criterio

Debe ser relevante. Debe reflejar los aspectos más relevantes del criterio conceptual.

Debe ser confiable. La confiabilidad del criterio afecta a la validez de criterio en la misma

medida que la confiabilidad del predictor. Debe ser libre de predisposición o contaminación

VALIDEZ DE CONSTRUCTO Suele determinarse mediante procedimiento de análisis estadísticos

multivariados (“análisis de factores”, “análisis discriminantes”, “regresiones múltiples”). Concíbase

la Validez de Constructo como explicar el modelo teórico-empírico que subyace a la variable de

interés.

El proceso de validación de un constructo está vinculado con la teoría. No es posible llevar a cabo

la validación de constructo, a menos que exista un marco teórico que soporte a la variable en

relación con otras variables.

Etapas de la validez de concepto.

Para establecer la validez de concepto o de constructo, se deben seguir las siguientes

etapas:

• Se establece y especifica la relación teórica entre los conceptos.

• Se correlacionan ambos conceptos y se analiza cuidadosamente la

correlación.

• Se interpreta la evidencia empírica de acuerdo a qué tanto clarifica la

validez de constructo de una medición en particular.

Validez total. La validez total de una prueba es la suma de la validez de contenido, la validez

de criterio y la validez de concepto.

Entre mayor evidencia de validez de contenido, validez de criterio y validez de concepto

tenga un instrumento de medición; éste se acerca más a representar la variable o variables

que pretende medir.

El fondo del asunto es que los que validan tienen la obligación de revisar cuándo una práctica

tiene consecuencias apropiadas para los individuos y las instituciones, y especialmente prevenir

las consecuencias adversas.

MÉTODOS PARA EXPRESAR LA VALIDEZ.

Para expresar la validez de una prueba se utilizan métodos estadísticos, entre los cuales se pueden

destacar los siguientes:

• Coeficiente de correlación de Pearson.

• Coeficiente de determinación.

• Error estándar de la estimación.

• Tablas de expectación.

• Estadística discriminativa.

RELACIÓN ENTRE LA CONFIABILIDAD Y LA VALIDEZ.

Un instrumento de medición puede ser confiable, pero no necesariamente válido. De no ser así,

los resultados de la investigación no deben tomarse en serio. Supongamos que vamos a probar un

arma con tres tiradores. Cada uno debe realizar tres disparos, entonces:

El tirador 1. Sus disparos no impactan en el centro del blanco y se encuentran diseminados por

todo el blanco.

El tirador 2. Tampoco impacta en el centro del blanco, aunque sus disparos se encuentran

cercanos entre sí, fue consistente, mantuvo un patrón.

El tirador 3. Los disparos se encuentran cercanos entre sí e impactaron en el centro del blanco.

FACTORES QUE PUEDEN AFECTAR LA CONFIABILIDAD Y LA VALIDEZ.

Hay diversos factores que llegan a afectar la Confiabilidad y la Validez del instrumento de

medición e introducen errores a la medición. Muchos de los errores se pueden evitar mediante

una adecuada revisión de la literatura, que nos permite seleccionar las dimensiones apropiadas

para las variables del estudio, criterios para comparar los resultados de nuestro instrumento,

teorías de respaldo, instrumento de dónde elegir, y otros. A continuación mencionaremos los

errores más comunes:

Improvisación. La selección del instrumento o confección de uno no se toma a la ligera, solicita

suficiente tiempo y conocer muy bien las variables que se pretende medir, así como la teoría que

la sustenta. De igual manera, requiere amplios conocimientos en la materia, estar actualizados al

respecto y revisar con cuidado la literatura correspondiente.

Cultura y tiempo. Se debe considerar al aplicar un instrumento de medición el lenguaje y

contexto. A sí mismo, la cultura, los grupos y las personas cambian, y esto debemos tomarlo en

cuenta al elegir o desarrollar un instrumento de medición.

La no empatía. El instrumento resulta inadecuado para las personas a quienes se aplica. Utilizar un

lenguaje considerando conocimientos, memoria, nivel educativo, capacidades de

conceptualización y otros puede interferir en la confiabilidad y validez del instrumento.

Estilos personales de sujetos participantes. Por ejemplo, la deseabilidad social (tratar de dar una

impresión muy favorable a través de la respuesta), tendencia a sentir con respecto a todo lo que

se pregunta, dar respuesta inusuales o contestar siempre negativamente.

Condiciones de aplicabilidad. Se refiere a las condiciones reinante naturales, el tiempo o al diseño

operativo del instrumento de medición.

Falta de estandarización. Por ejemplo, que las instrucciones no sean las mismas para todo los

participante. O bien, que los instrumentos de observación no sean equivalentes. Este elemento se

vincula con la objetividad. La objetividad se refiere al grado en que el instrumento es permeable a

la influencia de los sesgos y tendencias de los investigadores que lo administran, califican e

interpretan. Los aparatos y sistemas calibrados son más objetivos que otros sistemas que solicitan

cierta interpretación y éstos, a su vez, más objetivos que las pruebas estandarizadas, las cuales son

menos subjetivas que las pruebas proyectivas.

La objetividad aumenta, al reducirse la incertidumbre. Desde luego, la certidumbre total no existe;

el comportamiento es aceptado como verdadero, hasta que nueva evidencia demuestra lo

contrario. La objetividad se refuerza mediante la estandarización en la aplicación del instrumento

(mismas instrucciones y condiciones para todos los participantes) y en la evaluación de los

resultados.

Aspectos mecánicos. Por ejemplo, la legibilidad del instrumento, incomprensión de las

instrucciones, y otros.

3. Como se determina la confiabilidad en una investigación cuantitativa

Formas de determinación de la confiabilidad

Prueba (Test – Retest). Con aplicación de un coeficiente de correlación.

Características:

El investigador debe aplicar el mismo instrumento dos veces al mismo

grupo después de cierto período.

Debe calcular la confiabilidad del instrumento ANTES de la aplicación

definitiva del mismo.

Coeficiente de Correlación de Pearson altamente positivo = Instrumento

confiable.

Debilidades:

El periodo de tiempo (corto – largo) entre las mediciones puede confundir

el coeficiente de confiabilidad.

Formas paralelas o equivalentes con aplicación de un coeficiente de correlación.

Características:

Se administran dos o más versiones equivalentes de un mismo instrumento.

Deben ser similares en contenido, instrucciones, tipos de preguntas y

dificultad.

Son administradas al mismo grupo en un período relativamente corto.

Los patrones de respuestas deben variar POCO entre las aplicaciones.

Coeficiente de Confiabilidad = Fórmula de Correlación de Pearson.

Debilidades:

Dificultad para obtener dos pruebas realmente paralelas

Implica doble trabajo

Confiable solo si la correlación entre los resultados de ambas aplicaciones

es positiva.

Método de mitades partidas (split-halves). Los procedimientos anteriores

(medida de estabilidad y método de formas alternas), requieren cuando menos

dos administraciones de la medición en el mismo grupo de individuos. En cambio,

el método de mitades-partidas requiere sólo una aplicación de la medición.

Específicamente, el conjunto total de ítems (o componentes) es dividido en dos

mitades y las puntuaciones o resultados de ambas son comparados. Si el

instrumento es confiable, las puntuaciones de ambas mitades deben estar

fuertemente correlacionadas. Un individuo con baja puntuación en una mitad,

tenderá a tener también una baja puntuación en la otra mitad. El procedimiento

se diagrama en la figura 9.5.

Kr21. (Procedimiento estadístico que utiliza resultados arrojados por el mismo

instrumento).

COEFICIENTE KR-20

Coeficiente KR-20. Kuder y Richardson (1937) desarrollaron un coeficiente para

estimar la confiabilidad de una medición, su interpretación es la misma que la del

coeficiente alfa.

Permite obtener la confiabilidad a partir de los datos obtenidos en una sola

aplicación del test. Coeficiente de consistencia interna. Puede ser usada en

cuestionarios de ítemes dicotómicos y cuando existen alternativas dicotómicas con

respuestas correctas e incorrectas.

Dónde:

n: número total de ítems

S²t: varianza de las puntuaciones totales

p: proporción de sujetos que pasaron un ítem sobre el total de sujetos

q = 1- p

COEFICIENTE KR-21

Permite obtener la confiabilidad a partir de los datos obtenidos en una sola

aplicación del test. La suposición básica es considerar que todos los ítems

presentan igual varianza. Coeficiente de consistencia interna.

Donde: n: número total de ítemes M: media aritmética de las puntuaciones obtenidas por los individuos s2t: varianza de las puntuaciones totales

𝐾𝑅20 =𝑛

𝑛−1 𝑆⬚2 𝑡 − 𝑝𝑞

𝑠⬚2 𝑡

Alfa de Cronbach. (Procedimiento estadístico que utiliza resultados arrojados

por el mismo instrumento). Este coeficiente desarrollado por J. L. Cronbach

requiere una sola administración del instrumento de medición y produce valores

que oscilan entre O y 1. Su ventaja reside en que no es necesario dividir en dos

mitades a los ítems del instrumento de medición, simplemente se aplica la

medición y se calcula el coeficiente.

Características:

Requiere sólo una aplicación del instrumento de medición. Produce valores que oscilan entre cero (0) y uno (1). No es necesario dividir en mitades los ítems del instrumento. Se aplica la medición y se calcula el coeficiente.

4. Como se determina la validez en una investigación cuantitativa Juicio experto.

1. Se seleccionan dos jueces o expertos, por lo menos, a los fines de juzgar, de

manera independiente, la “bondad” de los ítemes del instrumento, en términos de

la relevancia o congruencia de los reactivos con el universo de contenido, la

claridad en la redacción y la tendenciosidad o sesgo en la formulación de los

ítemes.

2. Cada experto recibe suficiente información escrita acerca de: (a) el propósito

de la prueba; (b) conceptualización del universo de contenido; (c) plan de

operacionalización o tabla de especificaciones (en el caso de las pruebas de

rendimiento académico).

3. Cada juez recibe un instrumento de validación en el cual se recoge la

información de cada experto. Dicho instrumento normalmente contiene las

siguientes categorías de información por cada ítem: congruencia ítem-dominio,

claridad, tendenciosidad y observaciones.

4. Se recogen y analizan los instrumentos de validación y se toman las decisiones

siguientes: (a) los ítemes donde hay un 100 por ciento de coincidencia favorable

entre los jueces (los ítemes son congruentes, están escritos claramente y no son

tendenciosos) quedan incluido en el instrumento; (b) los ítemes donde hay un 100

por ciento de coincidencia desfavorable entre los jueces, quedan excluidos del

instrumento; y (c) los ítemes donde sólo hay coincidencia parcial entre los jueces

deben ser revisados, reformulados, si es necesario, y nuevamente validados

Análisis estadísticos.

1. MEDIDAS DE TENDENCIA CENTRAL

a. MEDIA: Es la sumatoria de un conjunto de puntajes dividida por el

número total de los mismos.

b. MODA: Es el puntaje que ocurre con mayor frecuencia en una

distribución de datos

c. MEDIANA: Es el valor que divide a una distribución de frecuencias por

la unidad, una vez ordenados los datos de manera ascendente o

descendente.

2. MEDIDAS DE TENDENCIA CENTRAL

a) VARIANZA: es la suma de las desviaciones de la media elevadas al

cuadrado, dividida entre el número de observaciones menos uno.

b) DESVIACION ESTANDAR: Es la cantidad promedio en que cada uno de

los puntajes individuales varia respecto a la media del conjunto de

puntajes.

3. PRUEBAS ESTADISTICAS

a. PRUEBA T DE STUDENT: Es el estadístico de prueba que se utiliza cuando

las poblaciones son pequeñas (menos de 30)

b. PRUEBA Z: Es una prueba de distribución Normal, que tienen que ver con

la probabilidad de que un puntaje dado de una medición aparezca en una

distribución.

c. ANALISIS DE VARIANZA: Es una prueba estadística que se utiliza para

analizar si más de dos grupos difieren significativamente entre sí, en

cuanto a su medida y varianza.

d. ANALISIS DE COVARIANZA: Es una prueba que se usa para analizar la

existencia o no de relación entre una dependiente y dos o más

independientes

e. CHI CUADRADO: Es una prueba estadística que permite probar si más de

dos proporciones de población pueden ser consideradas iguales o, en

otros palabras no permiten probar si dichas proporciones no presentan

diferentes significados.

f. ANALISIS DE REGRESION Y CORRELACION

g. ANALISIS DE REGRECION MULTIPLE

h. ANALISIS DE FACTORES

i. ANALISIS MULTIVARIADO DE VARIANZA

En la actualidad los análisis estadísticos se realizan mediante el uso de programas estadísticos por

computadora, como el STAPGRAPHIC o SPSS

5. Cuál es la fórmula o parámetros estadísticos para calcular la confiabilidad

y validez de una investigación cuantitativa

Algunas de las fórmulas utilizadas para los procesos estadísticos mencionados son los siguientes:

𝐾𝑅20 =𝑛

𝑛−1 𝑆⬚2 𝑡 − 𝑝𝑞

𝑠⬚2 𝑡

Importante: se sugiere repetir la validación del instrumento puesto que es recomendable que el

resultado sea mayor o igual a 0,81

FUENTE: RUIZ (2002).

Validez de Contenido: Juicio de expertos.

Validez de Criterio: Correlacionar la medición con el criterio para obtener el coeficiente de

validez.

Validez de Constructo: Suele determinarse un procedimiento estadístico denominado

“Análisis de Factores”´.

Sólidos Conocimientos Estadísticos.

Programas apropiados de Computadoras

Requiere de un solo instrumento, produciendo valores entre 0 y 1: -1 a 0: No es confiable 0,01 a 0,49: Baja Confiabilidad 0,50 a 0,75: Confiabilidad Moderada 0,76 a 0,89: Confiabilidad Fuerte 0,90 a 1,00: Confiabilidad Alta