Metodología

70
Tema 1. Medida en psicología Ione Esquer Terrazas El estado matemático es el segundo, comienzo con datos numéricos y concluye con resultados numéricos. El paso previo necesario a este estadio es la atribución de números a las manifestaciones psicológicas, a esto se le llama atribución numérica o definición de medida. ¾ Definición de medida Atribución de números a objetivos o sucesos de acuerdo con ciertas reglas. Regla general; aceptar como válidas entre los números aquellas relaciones que sean verificables empíricamente entre las modalidades. ¾ Definición de escala de medida Escala como conjunto de modalidades distintas y de números distintos relacionados, siempre y biunívocamente; a cada modalidad le corresponde un solo número y a cada número una sola modalidad. ¾ Tipos de escala de medida de Stevens x Escala nominal Dadas dos o más modalidades, sólo podremos comprobar empíricamente si ellas son iguales o distintas. Sólo se acepta la relación igualdad-desigualdad. Ej; sexo, grupos sanguíneo, diabetes, etc. La escala nominal permanece invariante frente a cualquier transformación que a números distintos haga corresponder números distintos (permutación). x Escala ordinal No sólo podemos comprobar si son iguales o distintas, sino, siendo distintas, cuál de cada dos es la mayor. Se admiten como válidas las relaciones igualdad-desigualdad y orden. Ej; nivel académico, nivel de dolor. La escala ordinal admite transformaciones que hagan corresponder a una sucesión ordenada de números otra sucesión de números ordenados del mismo modo que los primeros (transformación isomórfica y transformación monótona creciente). x Escala de intervalos No sólo podemos comprobar empíricamente la igualdad-desigualdad y el orden, sino que también, podemos establecer una unidad empírica de medida y observar cuántas veces se encuentra contenida dentro de la diferencia entre dos modalidades. No existe el cero absoluto que indique ausencia total de cantidad de variable. Ej; temperatura, CI. Se admiten como válidas relaciones igualdad-desigualdad, orden, suma y resta. La escala de intervalos permanece invariante frente a cualquier transformación de la forma y=ax+b ( transformación lineal). x Escala de razón Añade a la de intervalo la presencia del cero absoluto. Se admiten como válidas las relaciones igualdad-desigualdad y orden, y las operaciones suma, resta, multiplicación y división. Ej; longitud, edad, tensión arterial sistólica, colesterol. La escala de razón permanece invariante frente a cualquier transformación de la forma y=ax ( transformación geométrica). Relación Operaciones admisibles Transformación admisible Representación gráfica Nominal Igualdad /desigualdad x Igualdad/ desigualdad Permutación 9Diagrama de barras 9Ciclograma/diagrama de sectores 9Pictogramas Ordinal Igualdad /desigualdad Orden x Igualdad/ desigualdad x Mayor/menor que Isomórfica Monótona Creciente 9Diagrama de barras (siguiendo un orden) 9Pictogramas Intervalo Igualdad /desigualdad Orden Cuantas veces una unidad se encuentra dentro la de diferencia entre dos modalidades x Igualdad/ desigualdad x Mayor/menor que x Suma y resta entre los números x Multiplicación y división entre las diferencias Y= ax+b 9Diagrama de barras 9Histograma 9Polígono de frecuencias 9Diagrama de tallo y hojas 9BoxPlot Razón Igualdad /desigualdad Orden Cuantas veces una unidad se encuentra dentro la de diferencia entre dos modalidades Cuantas veces una modalidad es mayor que otra x Igualdad/ desigualdad x Mayor/menor que x Suma ,resta, multiplicación y división Y=ax 9Diagrama de barras 9Histograma 9Polígono de frecuencias 9Diagrama de tallo y hojas 9BoxPlot - Medida en psicología- --

description

psicólogo interno residente

Transcript of Metodología

Page 1: Metodología

Tema 1. Medida en psicología Ione Esquer Terrazas

El estado matemático es el segundo, comienzo con datos numéricos y concluye con resultados numéricos. El paso previo necesario a este estadio es la atribución de números a las manifestaciones psicológicas, a esto se le llama atribución numérica o definición de medida.

¾ Definición de medida

Atribución de números a objetivos o sucesos de acuerdo con ciertas reglas. Regla general; aceptar como válidas entre los números aquellas relaciones que sean verificables empíricamente entre las modalidades.

¾ Definición de escala de medida Escala como conjunto de modalidades distintas y de números distintos relacionados, siempre y biunívocamente; a cada modalidad le corresponde un solo número y a cada número una sola modalidad.

¾ Tipos de escala de medida de Stevens x Escala nominal

Dadas dos o más modalidades, sólo podremos comprobar empíricamente si ellas son iguales o distintas. Sólo se acepta la relación igualdad-desigualdad. Ej; sexo, grupos sanguíneo, diabetes, etc. La escala nominal permanece invariante frente a cualquier transformación que a números distintos haga corresponder números distintos (permutación).

x Escala ordinal No sólo podemos comprobar si son iguales o distintas, sino, siendo distintas, cuál de cada dos es la mayor. Se admiten como válidas las relaciones igualdad-desigualdad y orden. Ej; nivel académico, nivel de dolor. La escala ordinal admite transformaciones que hagan corresponder a una sucesión ordenada de números otra sucesión de números ordenados del mismo modo que los primeros (transformación isomórfica y transformación monótona creciente).

x Escala de intervalos No sólo podemos comprobar empíricamente la igualdad-desigualdad y el orden, sino que también, podemos establecer una unidad empírica de medida y observar cuántas veces se encuentra contenida dentro de la diferencia entre dos modalidades. No existe el cero absoluto que indique ausencia total de cantidad de variable. Ej; temperatura, CI. Se admiten como válidas relaciones igualdad-desigualdad, orden, suma y resta. La escala de intervalos permanece invariante frente a cualquier transformación de la forma y=ax+b (transformación lineal).

x Escala de razón Añade a la de intervalo la presencia del cero absoluto. Se admiten como válidas las relaciones igualdad-desigualdad y orden, y las operaciones suma, resta, multiplicación y división. Ej; longitud, edad, tensión arterial sistólica, colesterol. La escala de razón permanece invariante frente a cualquier transformación de la forma y=ax (transformación geométrica).

Relación Operaciones admisibles Transformación

admisible Representación gráfica

Nominal

Igualdad /desigualdad x Igualdad/ desigualdad Permutación 9 Diagrama de barras 9 Ciclograma/diagrama de

sectores 9 Pictogramas

Ordinal

Igualdad /desigualdad Orden

x Igualdad/ desigualdad x Mayor/menor que

Isomórfica Monótona Creciente

9 Diagrama de barras (siguiendo un orden) 9 Pictogramas

Intervalo

Igualdad /desigualdad Orden Cuantas veces una unidad se

encuentra dentro la de diferencia entre dos modalidades

x Igualdad/ desigualdad x Mayor/menor que x Suma y resta entre los

números x Multiplicación y

división entre las diferencias

Y= ax+b

9 Diagrama de barras 9 Histograma 9 Polígono de frecuencias 9 Diagrama de tallo y hojas 9 BoxPlot

Razón

Igualdad /desigualdad Orden Cuantas veces una unidad se

encuentra dentro la de diferencia entre dos modalidades

Cuantas veces una modalidad es mayor que otra

x Igualdad/ desigualdad x Mayor/menor que x Suma ,resta,

multiplicación y división

Y=ax

9 Diagrama de barras 9 Histograma 9 Polígono de frecuencias 9 Diagrama de tallo y hojas 9 BoxPlot

- Medida en psicología- --

Page 2: Metodología

Tema 2. Qué es la estadística Ione Esquer Terrazas

¾ Población

Conjunto de objetos (realmente existentes o posibles) que verifican una definición bien determinada. Ej; universitarios españoles.

¾ Muestra Cualquier subconjunto posible de una población. Ej; 300 universitarios españoles

¾ Parámetro Toda función definida sobre los valores numéricos de una población. La función es la misma para todos los casos. El resultado numérico varía de caso a caso. Ej; media aritmética de las alturas de todos los universitarios españoles.

¾ Estadístico Toda función definida sobre los valores numéricos de una muestra. Ej; media aritmética de las alturas de una muestra de 300 universitarios españoles.

¾ Definición de estadística x Estadística. Es la ciencia que recoge, ordena y analiza los datos de una muestra, extraída de cierta población y utilizando

como herramienta el cálculo de probabilidades, se encarga de hacer inferencias acerca de la población.

x Estadísticas. Son los resultados numéricos obtenidos mediantes la estadística.

x Estadístico. Es todo valor numérico obtenido a partir de los valores presentados por una muestra.

¾ División de la estadística x Estadística descriptiva. Su cometido es recoger, ordenar y analizar los datos de una muestra (describir la muestra).

x Estadística inferencial. Su cometido es verificar inferencias acerca de los parámetros y la forma de distribución de la

población, a partir de los estadísticos y la forma de distribución de la muestra.

x Probabilidad. Puente que nos permite pasar válidamente de la muestra a la población. Legitima el salto de las características (conocidas) de una muestra hasta las características (desconocidas) de una población.

- Qué es la estadística- --

Población

Muestra

Probabilidad

Estadístico – E. Descriptiva

Parámetro – E. Inferencial

Page 3: Metodología

Tema 3. Organización de datos Ione Esquer Terrazas

¾ Constante

Característica que sólo puede manifestarse bajo una única modalidad.

¾ Variable Característica que puede manifestarse según dos o más modalidades. Cuando una característica, en sí misma variable, sólo puede manifestarse bajo una modalidad, será considerada como constante. Ej; extraversión en un grupo de varones, el sexo se mantiene constante.

x Variable cualitativa Característica que solo puede ser considerada a nivel nominal. Ej; sexo, profesión, nacionalidad. Las representaciones gráficas posible son ciclogramas, pictogramas, diagrama de barras. La representación con un diagrama de barras se hace con rectángulos separados de igual base y alturas proporcionales a las frecuencias correspondientes.

x Variable cuasi cuantitativas Aquella característica que puede ser considerada como máximo, a nivel ordinal. Relación de desigualdad y orden. Representación gráfica; diagrama de barras.

x Variable cuantitativa Característica que puede ser considerada al menos, a nivel de intervalos. La representación gráfica de estas variables se realiza mediante histogramas y polígonos de frecuencias.

Variable cuantitativa discreta; característica que no admite siempre una modalidad intermedia entre dos

cualesquiera de sus modalidades (número de hijos).

Variable cuantitativa continua; característica que admite una modalidad intermedia entre dos cualesquiera de sus modalidades (longitud, peso, etc).

¾ Modalidades y clases

Una característica se puede manifestar bajo un gran número de modalidades. Conviene reducir estas modalidades a un número menor de clases (bien definidas, mutuamente exclusivas y exhaustivas).

Frecuencia (Frecuencia absoluta); el número de observaciones contenidas dentro de una clase.

Proporción (Frecuencia relativa); cociente entre la frecuencia absoluta de dicha clase y el número total de observaciones, en todas las clases.

Porcentaje. La proporción o frecuencia relativa multiplicada por 100.

Distribución de frecuencias. Conjunto de los números atribuidos a las clases y de las frecuencias correspondientes a cada una de aquellas.

¾ Intervalos elementales y compuestos

Intervalo elemental; con cada valor discreto va asociado un intervalo de amplitud unidad.

Intervalo compuesto; al conjunto de varios intervalos elementales consecutivos. Por regla general, cada intervalo

compuesto contiene el miso número de intervalos elementales. Ej; si tenemos dos intervalos compuestos, sus límites exactos son 3,5-6,5 y 6,5-9-5. Llamaremos límites aparentes de estos intervalos; 4-6 y 7-9.

Amplitud. Es la diferencia entre su límite exacto superior y límite exacto inferior; 6.5-3,5 = 9,5 – 6,5 = 3. Punto medio; de cada intervalo es la media aritmética de sus dos limites exactos. El punto medio del intervalo 4-6 es de 5.

¾ Representaciones gráficas

x Diagrama de barras. Se representan tantas barras como categorías tiene la variable, de modo que la altura de cada una de

ellas sea proporcional a la frecuencia o porcentaje de casos en cada clase. Se usa para representación de caracteres cualitativos y cuantitativos discretos.

x Histograma. Formas especiales de diagramas de barras para distribuciones cuantitativas continuas. Polígono de frecuencias; línea originada por el conjunto de segmentos rectlíneos obtenidos al unir los puntos consecutivos.

x Pictograma. Consiste en asociar a cada categoría de la variable un dibujo, relacionado con ésta, cuyo tamaño será proporcional a la frecuencia.

- Organización de datos- --

Page 4: Metodología

Tema 3. Organización de datos Ione Esquer Terrazas

x Diagrama de sectores. También se conoce como diagrama de tarta, ciclograma o quesito. Se dibuja un círculo que se

divide en tantas secciones como categorías o valores distintos presenta la variable objeto de estudio.

x Diagrama de tallo y hojas. Ideado por Turkey dentro del enfoque denominado análisis exploratorio de datos. Permite visualizar globalmente la distribución de frecuencias. Cada tallo define una clase y el número de hojas representa la frecuencia de dicha clase. Permite tanto un listado de puntuaciones como un dibujo de la distribución.

x Diagrama de Box and Whiskers (diagrama de caja y bigotes). Transmite de manera directa y simple la variabilidad observada en un conjunto de valores. Ofrece una representación gráfica en la que se distinguen la tendencia central, la dispersión y la distribución. Se calculan la mediana, cuartiles y Q1 y Q3.

Normas prácticas para las representaciones gráficas

9 Eje de abscisas (horizontal) representará las puntuaciones de la variable de que se trate. 9 Eje de ordenadas (vertical) representará las frecuencias, proporciones o porcentajes. 9 La intersección de los dos ejes será tomada como origen de las puntuaciones de ambos ejes. 9 Si la puntuación mínima y la frecuencia mínima son altas, en ambos ejes se suelen hacer dos cortes (al inicio de

abscisas y ordenadas).

Page 5: Metodología

Ione Esquer. Estadística

Estadística

Ciencia que se dedica a recoger, ordenar datos con el objeto de realizar inferencias acerca de la población

Estadística descriptiva; recoge, ordena, analiza datos de una muestra.

Estadística inferencia; a partir de los datos de la muestra, obtiene inferencias acerca de la población.

x Población; conjunto de individuos que son objeto de estudio. x Muestra; subconjunto posible de la población que se elige

para hace el estudio. x Características; genero, edad. x Variables; cualquier característica cuantitativa (tome valor

numérico) de una población. x Parámetro; función definida sobre los valores numéricos de la

población. x Estadístico; cualquier función que queda definida sobre los

valores numéricos de una muestra.

Medición

Proceso por el cual se asignan números a objetos o carac. según determinadas reglas.

Medir

Poner en relación el mundo ideal de los números y el real de los objetos (características y modalidades)

Escala de medida

Procedimiento mediante el cual se relacionan de manera biunívoca (sí y sólo sí), un conjunto de modalidades (distintas) con un conjunto de números (distintos)

Análisis de datos y medición en psicología

Tipos de variables

Variable como representación nº de una caract.

x Cualitativa; nivel nominal. Dicotómicas o politómicas. x Cuasicuantitativa; varia. Ordinales. x Cuantitativa; discreta (si es un número limitado) y

continua (cualquier valor entre 2numeros). Varia.de intervalo y razón.

Distribución de frecuencias

¾ Frecuencia absoluta. Nºde observaciones contenidas dentro de cada variable.

¾ Proporción o frecuencia relativa. Cociente entre la frecuencia absoluta y el nºtotal de observaciones.

¾ Frecuencia acumulada. Se obtiene sumando cada frecuencia.

9 Variables cualitativas (nominal); diagrama de

barras o rectángulos y diagrama de sectores o pictograma.

9 Variables cuantitativas (intervalo o razón); histograma, diagrama de caja y bigotes , diagrama de barras, diagrama de tallo y hojas y el polígono de frecuencias).

Propiedades de la distribución de frecuencias Tendencia central; centro de la distribución de

frecuencias. Promedio. Variabilidad. Homogénea si están cercanos al

promedio, heterogénea si se alejan de él. Sesgo o asimetría. Negativa (test fáciles) y positiva

(difíciles) Curtosis. Leptocúrtica (apuntada) y platicúrtica

(aplastada). Mesocúrtica (grado medio).

Concepto de medida y tipos de escalas Tipos de escalas de medida , Stevens

9 Escalas Nominales Solo permite comparar si dos modalidades son iguales o distintas. Única comprobación empírica que puede hacerse es la de igualdad o desigualdad. Ejemplo; rubio, moreno, albino. (Modalidad)

9 Escalas Ordinales Los objetos pueden manifestar determinada característica en mayor grado unos que otros. Permiten establecer relaciones de orden. Ejemplo; alto , regular, bajo. (Valor o puntuación)

9 Escalas de intervalo Incluye todas las características de la escala ordinal pero además la distancia entre valores es constante. Permite operaciones de suma y resta. El cero es arbitrario, y no significa carencia absoluta. (Valor o puntuación)

9 Escala de razón

Permite además operaciones de multiplicación y de división. Tiene cero absolutos, que significa ausencia del atributo. Ejemplo; distancia, velocidad. (Valor o puntuación)

Organización de datos

Page 6: Metodología

Tema 4. Estadísticos de posición y de tendencia central Ione Esquer Terrazas

Los estadísticos de tendencia central o de posición indican dónde se sitúa un grupo de puntuaciones (en zona alta, media o baja)

¾ Media aritmética

La media aritmética de n valores n es más que su suma dividida por el número de ellos. Propiedades;

9 La suma de las diferencias de n puntuaciones respecto a su media vale cero. 9 La media de y=ax+b, y2=ax2+b, etc, siendo A y B dos constantes arbitrarias es ݕത = ҧݔ + . 9 La media es sensible a la variación de cada una de las puntuaciones.

La media es función de todas y cada una de las puntuaciones y variará con que varié una sola de ellas. 9 La media es función de los intervalos elegidos. 9 No podrá ser calculado si el intervalo máximo no tiene límite superior y/o el intervalo inferior mínimo no lo tiene

inferior. 9 La media es el centro de gravedad de la distribución de frecuencias. 9 La media no es el estadístico más apropiado cuando la distribución es muy asimétrica.

¾ Media ponderada

La media ponderada de n puntuaciones es la media de esas puntuaciones multiplicadas o ponderadas por coeficientes o pesos apropiados.

¾ Medias aritméticas generalizadas x La media geométrica തg de N valores, la raíz enésima del producto de n valores. Es un valor tal que su logaritmo es igual a

la media aritmética de los logaritmos de los datos. Se ha utilizado en investigaciones sobre promedios de tiempos (latencias, tiempos de reacción). En psicofísica suele preferirse la media geométrica a la media aritmética cuando se trata de promediar razones.

x La media armónica തa de n valores, al recíproco de la media aritmética de los recíprocos de esos n valores. La media armónica se suele emplear en cálculos de psicofísica (audición, velocidades). Ej; velocidad con la que se traslada el impulso nervioso.

x La media cuadrática തc de n valores X1, X2 ….. Xn a la raíz cuadrada de la media aritmética de los cuadrados de esos n valores. La media aritmética cuadrática es un valor tal que su cuadrado es igual a la media aritmética de los cuadrados de los datos.

¾ Mediana

Si ordenamos las puntuaciones me menor a mayor o de mayor a menor, la mediana sería el punto o valor numérico que deja por encima y por debajo de sí el 50% de las observaciones. Cálculo

Para calcular la mediana en datos agrupados en intervalos, hemos de localizar el intervalo crítico. El intervalo crítico es aquel intervalo que contiene la puntuación que deja por debajo y por encima la mitad de las observaciones.

Propiedades

9 La sume de las diferencias (en valor absoluto) de n puntuaciones respecto a su mediana es igual o menor que la suma de las diferencias de esas puntuaciones respecto a cualquier otro valor.

9 Es menos sensible que la media a la variación de cada una de las puntuaciones. 9 Es función de los intervalos elegidos. 9 Puede ser calculada aunque el intervalo máximo no tenga límite superior, ni el intervalo mínimo lo tenga inferior,

cuando uno de esos intervalos no contenga dentro de sí más del 50% de los casos. 9 La mediana es un punto tal que la vertical levantada sobre el mismo divide el área total del histograma en dos áreas

con idéntica superficie. 9 Es más recomendable que la media cuando la distribución de frecuencias es muy asimétrica. 9 Dados r grupos con medianas Md1, Md2 … la mediana del grupo total es igual o mayor que la mediana mínima e igual o

menos que la máxima.

¾ Moda Puntuación a la que corresponde la frecuencia máxima. Es decir, la puntuación que más veces se repite. Cuando los datos están agrupados en intervalos, la moda corresponde con el punto medio del intervalo al que corresponde la frecuencia máxima. La moda se puede calcular para variables cualitativas, cuasi-cuantitativas y cuantitativas Propiedades

9 Sencilla de calcular 9 Tienen el inconveniente de no ser necesariamente única. 9 Es función de los intervalos elegidos. 9 Puede ser calculada aunque el intervalo máximo no tenga límite superior ni el mínimo lo tenga inferior.

- Estadísticos de posición y de tendencia central- --

Page 7: Metodología

Tema 4. Estadísticos de posición y de tendencia central Ione Esquer Terrazas

¾ Cuantiles

Estadísticos de posición que nos indican la situación o posición de una puntuación o valor numérico con respecto al grupo del que se procede. Se definen como un conjunto de K puntos que permiten dividir la distribución en k+1 partes iguales.

x Cuartiles Son tres valores (Q1, Q2 y Q3) de la variable que dividen a la distribución en cuatro partes iguales, cada una de las cuales supone un 25% del total. Estos tres valores coinciden con los percentiles P25, P50 y P75.

x Deciles Nueve valores de la variable que dividen la distribución en diez partes iguales de modo que cada parte serán una décima o un 10% del total. D5 equivale a Q2, P50 y la mediana.

x Percentiles Definiremos el percentil K como un valor numérico que deja por debajo de sí el k por 100 de las observaciones. Decir que 140 es el percentil 90 equivale a decir que dicho valor numérico deja por debajo de sí el 90% de las observaciones del grupo de que se trate. La mediana es un percentil determinado, el percentil 50. Los percentiles son calculables a nivel ordinal pero sólo se les suele aplicar a variables cuantitativas continuas. Tiene el inconveniente de presentar desigualdades en la distancia entre valores (especialmente entre los extremos de la distribución). La escala de percentiles es ordinal con unidades muy desiguales.

Page 8: Metodología

Tema 5. Estadísticos de variabilidad o dispersión Ione Esquer Terrazas

Los estadísticos de variabilidad o dispersión nos indican si esas puntuaciones se encuentran muy próximas entre sí o muy dispersas.

¾ Desviación media

La media de las diferencias (en valor absoluto) de n puntuaciones respecto a su media aritmética. Propiedades;

9 Es fácilmente inteligible y calculable 9 Raramente se utiliza debido a que sus valores absolutos son muy poco manejables matemáticamente

¾ Varianza y desviación típica

x Varianza. Es la media de las diferencias cuadráticas de n puntuaciones respecto a su media aritmética.

Referida a la muestra = s2. Referida a la población = o2.

x Desviación típica o estándar. Es la raíz cuadrada de la varianza. Será considerada siempre como positiva. Se expresa en las mismas unidades e las que están los datos.

Propiedades; 9 El valor de la varianza y la desviación típica siempre será mayor o igual a cero. 9 La varianza de Y=ax+b , Y2=ax2+b …etc, siendo A y B dos constantes arbitrarias, es igual a la varianza de X multiplicada

por A2. 9 Si a un conjunto de puntuaciones le sumamos una constante, la varianza y la desviación típica de las nuevas

puntuaciones será igual que la varianza y la desviación típica de las originales. 9 La varianza y la desviación típica son sensibles a la variación de cada una de las puntuaciones. 9 Son función de los intervalos elegidos. 9 Fuera del intervalo, se encuentran a lo más, el (1/k2)100 por 100 de las observaciones, sea cual sea la forma de la

distribución de frecuencias. Esta propiedad hace referencia al hecho de que las distancias menores hasta la media son más frecuentes que las distancias mayores (desigualdad de Tchebychev).

9 No serán calculables o no serán recomendables, cuando no se calculable, o no sea recomendable, la media como medida de posición o tendencia central.

9 La desviación típica viene expresada en las mismas unidades en las que vienen expresados los datos. Si los datos vienen expresados en metros, la desviación típica vendrá dada en metros, pero la varianza vendrá dada en metros cuadrados.

9 Dados r subgrupos, la varianza de las n puntuaciones incluidas en el grupo total es igual a la media de las varianzas de cada uno de los r subgrupos más la varianza de las medias de cada uno de esto mismos r subgrupos.

¾ Amplitud

La amplitud, también conocida como recorrido o rango, es diferencia entre la puntuación máxima y la mínima. Si tenemos en cuenta los límites exactos de los intervalos elementos o compuestos, la amplitud es la diferencia entre la puntuación máxima y la mínima más una unidad. Propiedades;

9 La amplitud es muy fácilmente calculable. 9 Tiene el inconveniente de tener en cuenta únicamente las puntuaciones extremas.

¾ Amplitud semiintercuartil

Semidistancia entre el tercer cuartil y el primer cuartil, es decir, entre el percentil 75 y el percentil 25. Propiedades;

9 La ASI es preferible a la desviación típica en el caso de distribuciones muy asimétricas. 9 Cuando el intervalo máximo carece de límite superior y/o el mínimo carece de límite inferior es posible calcular la ASI. 9 La ASI sólo es calculable a nivel de intervalos o de razón. 9 Es menos sensible que la desviación media y que la desviación típica a la variación de los datos.

¾ Coeficiente de variación

Se utiliza para comparar la variabilidad de dos conjuntos de datos. El coeficiente da variación es el resultado de dividir la desviación típica por la media.

Nos permite comprar dos grupos, con variables de distintas naturaleza, expresando la variabilidad de cada grupo en números abstractos. Si comparamos dos grupos de variables, por ejemplo longitud (X) y peso (Y), Sx vendrá dada en metros y Sy en gramos.

También es útil cuando tenemos dos grupos distintos y una misma variable, y las medidas de esa variable son muy distintas entre sí (ej, el peso de un grupo de elefantes y el peso de 100 hormigas).

- Estadísticos de variabilidad o dispersión- --

Page 9: Metodología

Tema 5. Estadísticos de variabilidad o dispersión Ione Esquer Terrazas

Propiedades;

9 Es un valor abstracto, como cociente de dos números concretos del mismo tipo. 9 Si a unas puntuaciones dadas les sumamos una cantidad positiva, el coeficiente disminuirá.

Si multiplicamos unas puntuaciones dadas por cualquier constante positiva el CV se mantendrá constante. Si Y=ax CV no se altera Y=Ax+b Si y=ax+b CV disminuye Si y=ax-b CV aumenta

9 El CV podría ser teóricamente negativo por se tomará el valor absoluto ya que ningún estadístico de dispersión tiene sentido en valor negativo. Las puntuaciones pueden ser positivas o negativas pero el índice de variabilidad o dispersión será siempre positivo (hay variabilidad) o nulo (las puntuaciones son iguales y no hay variabilidad).

Page 10: Metodología

Tema 6. Estadísticos de asimetría y apuntamiento Ione Esquer Terrazas

¾ Asimetría

Las medidas de asimetría muestran si en la distribución hay concentración de datos en un extremo, superior o inferior, y se denomina;

Asimetría positiva o a la derecha si la concentración es en el extremo inferior. Si tenemos muchas puntuaciones bajas y pocas altas. En este caso la media es superior a la mediana. Si As>0, la asimetría es positiva. Media >mediana. Q3-Q2 > Q2 – Q1.

Asimetría negativa o a la izquierda si la concentración es en el superior. Si tenemos muchas puntuaciones altas y pocas bajas. En este caso la media es inferior a la mediana. Si As<0, la asimetría es negativa. Media < mediana. Q3-Q2 < Q2 – Q1.

Se dice que la distribución de frecuencias es simétrica si las áreas en las que la mediana divide el histograma son de igual superficie. Si la distribución es simétrica la mediana coincide con la media (y con la moda si es unimodal). Si es simétrica; Q3-Q2 = Q2 – Q1.

¾ Apuntamiento Diremos que una curva es muy apuntada si es muy alta y estrecha. Diremos que es poco apuntada si es baja y ancha.

x Leptocúrtica. Aquella curva que es más apuntada que la curva normal. Hay una mayor concentración de los datos entorno a la media. A4>0.

x Mesocúrtica. Apuntalamiento de la curva normal. A4=0. x Platicúrtica. Curva menos apuntada que la normal. A4<0.

- Estadísticos de asimetría y apuntamiento- --

Page 11: Metodología

Tema 7. Puntuaciones típicas Ione Esquer Terrazas

¾ Puntuación directa

La atribuida directamente a cada objeto al ser sometido a cualquier tipo de prueba. Xi

¾ Puntuación diferencial Puntuación directa menos la media. Xi- ത

9 Si es positiva indica que la puntuación directa está por encima de la medida de su grupo. 9 Si es negativa, significa que la puntuación directa se encuentra por debajo de la media. 9 Si la puntuación diferencial es cero, significaría que puntuación y media coinciden.

La media de las puntuaciones diferenciales vale cero. La desviación típica de las puntuaciones diferenciales coincide con la desviación típica de las puntuaciones directas de las

cuales proceden.

¾ Puntuación típica Puntuación diferencial dividida por la desviación típica. Zi= Xi- ത/Sx Dos puntuaciones directas o diferenciales, referidas a dos características distintas, no son comparables entre sí. Las puntuaciones típicas al ser números abstractos, compartir medio y desviación típica, si son comparables entre sí. La media de las puntuaciones típicas vale cero. La varianza y la desviación típica de las puntuaciones típicas vale uno. Si multiplicamos las puntuaciones típicas por una constante A y sumamos a esos productos otra constante B, las nuevas

puntuaciones tienen como media B y como desviación típica A.

9 Una puntuación típica indica el número de desviaciones típicas que una observación separa de la media de su grupo. Decir que una persona tiene una puntuación típica igual a tres es equivalente a decir que supera la media en tres desviaciones típicas.

9 Estas puntuaciones nos aportan información sobre la posición de una observación en una distribución de frecuencias. 9 También nos permite detectar puntuaciones anómalas. No obstante este tipo de interpretaciones será correcta en la

medida en que la distribución de frecuencias de la variable en cuestión sea similar a una distribución normal. 9 Es la calificación estándar más elemental y útil.

¾ Puntuaciones típicas derivadas o transformadas

Se obtienen si a un conjunto de puntuaciones típicas les aplicamos una transformación lineal admisible. La necesidad de estas puntuaciones responde a dos inconvenientes de las puntuaciones típicas; puntuaciones con signo negativo y decimales. Llamaremos puntuaciones T a las obtenidas mediante la transformación lineal de las puntuaciones típicas, en la que la media es 50 y la desviación típica 10. T= z10+50.

¾ Puntuaciones típicas normalizadas Se obtienen si a un conjunto de puntuaciones típicas les aplicamos una transformación no lineal. Los eneatipos o estaninos son una transformación lineal de puntuaciones típicas noramlizadas (transformación no lineal) con una media de 5 y una desviación típica de 2.

¾ Curva normal o campana de Gauss Entre la puntuación típica -3 y la puntuación típica 3, se encuentra el 99,74% delárea total contenida bajo la curva normal (96% entre la -2 y 2 y 68% entre la -1 y 1). Tienen un único máximo para x=µ Tienen dos puntos de inflexión, para x= µ - ʍ y para x= µ + ʍ Se acercan asintóticamente al eje de abscisas, sin llegar a tocarle en ningún punto fijo. Son simétricas respecto aj eje vertical que pasa por la media.

-Puntuaciones típicas- --

Page 12: Metodología

Tema 7. Puntuaciones típicas Ione Esquer Terrazas

PUNTUACIÓN DIRECTA; Xi Resulta de aplicar la escala de medida correspondiente a una variable

PUNTUACIÓN DIFERENCIAL; Xi= Xi- ത ത=0 Sx=SX Nos indica si ese sujeto está por encima o por debajo de la media.

PUNTUACIÓN TIPICA; Zi= Xi- ത/ Sx ҧ=0 Sz=1 India cuantas DT se aleja de la media. Abstracto (permite comparación

TRANSFORMACIÓN NO LINEAL Percentiles

Transformación lineal Típicas derivadas o transformadas Transformación lineal de las típicas; predefinidas media y dt. T= z10+50. Ej; CI= 15Z+100.

Transformación NO lineal; Zn Típicas normalizadas Transformación no lineal de las típicas.

Cambia la distribución. Puede basarse en percentiles

Eneatiposo estaninos; putnuaciones derivadas normalizadas Transformación lineal de las puntuaciones típicas normalizadas. E= zn2+5. Sólo admiten valores enteros entre 1-9.

Page 13: Metodología

Ione Esquer. Estadística

¾ Media aritmética. Adecuada para variables cuantitativas con distribución simétrica. Suma de todas las puntuaciones de la distribución, dividida por el total de casos.

La suma de las diferencias de n puntuaciones respecto a su media = 0.

Si la distribución es asimétrica no es un estadístico apropiado.

Es el estadístico más sensible a variaciones de las puntuaciones.

x Media geométrica. Frecuencia central en escalas de

razón. Se trata de promediar razones y tiempos. x Media cuadrática. Raíz cuadrada de la media aritmética

de los cuadrados de esos n valores. x Media armónica. Cuando una variable cuyas magnitudes

a promediar dependen de otras variables. Velocidad.

¾ Mediana. Variables cuantitativas, de distribución asimétrica y ordinales. Menos sensible que la media. Mejor estadístico si hay valores extremos (asimetría). Puede ser calculad aunque el intervalo no tenga limites superior o inferior (la media no). Es el valor numérico que deja por debajo de si el 50% de las observaciones.

¾ Moda. Adecuada para variables nominales y ordinales. Categoría o valor más frecuente. Si hay varias modas; bimodal. Si todos los valores tienen la misma frecuencia; amodal.

Distribución simétrica; X= Mdna = Mo Asimétrica positiva; X > Mdna > Mo. (Drcha)

Asimétrica negativa; X < Mdna < Mo. (Izq)

Estadística descriptiva –Una sola variable–

¾ Puntuación directa Resulta de aplicar la escala de medida correspondiente a una variable.

¾ Puntuación diferencial Puntu.directa menos la media. Permite hacer comparaciones. Si resulta positivo; la puntuación directa esta por encima de la media. La media de las puntuaciones diferenciales = 0.

¾ Puntuación típica Es la puntuación directa dividida por la desviación típica. Media 0 y DT 1. Cuantas DT se aleja de la media. No depende de la unidad de medida. Es la calificación estándar más elemental y útil. La media y la varianza son constantes.

¾ Puntuación derivada Media de 50 y desviación típica (DT) de 10.

Estadísticos de posición o tendencia central Estadísticos de posición

Indican la posición o situación de una puntuación, con respecto al grupo del que procede. Cuantiles; valores que permiten estudiar la posición relativa de un individuo en una variable.

¾ Deciles. 9valores de la variable que dividen a la distribución en 10 partes iguales. D5= Q2=P50=Md.

¾ Cuartiles. 3valores de la variable que dividen a la distribución en 4 partes iguales. Q1, Q2 y Q3

corresponde a P25, P50 y P75.

¾ Percentiles. División de una distribución en 100partes iguales. Intervalo crítico al intervalo donde se encuentra un percentil determinado. Al menos escala ordinal.

Distribución simétrica; Q3-Q2= Q2-Q1

Asimétrica +; Q3-Q2>Q2-Q1 Asimétrica -; Q3-Q2< Q2-Q1

Puntuaciones Estadísticos de variabilidad

Grado de dispersión o separación entre los datos de distribución. Nunca negativos.

¾ Amplitud total Distancia entre los valores que representan la puntuación máxima y la puntuación mínima. Llamado tb rango o recorrido.

¾ Amplitud semi-intercuantil (ASI) Mitad de la distancia entre el Q3 y el Q1. Índice de ambigüedad. Distribuciones simétricas. Conocer cuantas unidades de los valores que toma la variable se concentran el 50% de los casos.

¾ Desviación media Media de las diferencias, en valor absoluto, de las puntuaciones respecto a su media.

¾ Varianza y desviación típica

x Varianza como promedio de las diferencias de cada puntuación respecto a su mediana, pero elevadas al cuadrado. Nunca es negativa. Sensible a la variación de las puntuaciones. (Muestra S, población O)

x Desviación típica; es la raíz de la varianza. Nunca es negativa. Cuando más pequeña, la muestra es más homogénea.

¾ Coeficiente de variación.

Mide el grado de dispersión de un conjunto de datos en relación a su media. x Desigualdad de Tchebychev. Nos permite saber el

número de observaciones que se encuentra entre la media y ±2 desviaciones típicas (%75).

Page 14: Metodología

Tema 8. Relación lineal y relación curvilínea Ione Esquer Terrazas

¾ Organización de datos e índices de tendencia central y variabilidad

x Covarianza de X e Y

Media aritmética de los productos entre la diferencia (Xi-X) y la diferencia (Yi-Y) correspondientes a cada uno de los n elementos que componen un grupo.

x Distribución marginal y distribución condicional Distribución marginal de X; distribución en X de todas las observaciones, independientemente de sus puntuaciones en Y. Distribución marginal de Y; distribución en Y de todas las observaciones, independientemente de sus puntuaciones en X. Distribución condicional de X (para Y=Yk); distribución en X de todas, y solas, las observaciones puntuación Y=Yk. Distribución condicional de Y (para X=Xk); distribución en Y de todas, y solas, las observaciones con puntuación X=Xk.

¾ Relación lineal entre dos variables

La correlación entre dos variables se refiere a la variación conjunta de dos variables, su intensidad y sentido (positivo y negativo).

9 La correlación entre Y e Y es positiva cuando X e Y covarían en el mismo sentido. 9 La correlación entre X e Y negativa cuando covarían en sentido opuesto. 9 La correlación es nula cuando no covarían en ninguno de los dos sentidos.

La regresión se refiere a la predicción o pronóstico de los resultados en una de las dos variables, conocidos los resultados en la otra.

x Coeficiente de correlación de Pearson

La covarianza presenta algunos inconvenientes; es función de las unidad de medida elegidas para X e y. El coeficiente de correlación de Pearson Rxy es un índice que mide la covariación conjunta, entre dos variables siempre y cuando ambas sean cuantitativas y además se relacionen linealmente.

El coeficiente de correlación de Pearson no puede valer menos que -1 ni más que 1. El coeficiente Rxy en valor absoluto, entre dos variables es invariante frente a cualquier transformación lineal

(V=ax+b y W=cy+d) de ambas. Para contrarrestar los posibles efectos de una tercerea variable, se pueden identificar grupos en función de los

niveles de esta variable y calcular el coeficiente de correlación para cada grupo. Para calcular Rxy es condición esencial la linealidad de los puntos que representan a las n personas. El que el Rxy sea igual a cero no permite concluir que no existe una relación entre X e Y ya que es posible que exista

una relación no lineal.

El que exista una alta correlación entre dos variables, no nos permite decir que una de ellas sea causa de la otra. La correlación indica una mera covariación entre dos variables y nada más.

9 Rxy= ±1; correlación lineal perfecta (ej; una variable consigo misma) La nube de puntos del diagrama de dispersión es más delgada.

9 Rxy=0; correlaicón lineal nula.

¾ Relación curvilínea entre dos variables; razón de correlación x Razón de correlación

Cuando la relación entre dos variables, X e Y, es curvilínea, no es razonable calcular el coeficiente de Pearson ya que mide la relación lineal. Un ejemplo de una relación curvilínea es la existente entre la fuerza física y la edad. Para estos casos se ha de utilizar la razón de correlación de Y sobre X (żyx) Solo es adecuada para el caso de variables cuantitativas que mantengan una relación curvilínea.

żyx2 Es igual o mayor que cero o menor o igual que 1. 0чżyx

2 ч1 La diferencia żyx

2 – ryx2 mide el grado de alejamiento mayor o menos de unos datos de la linealidad. Cuanto mayor

sea las diferencias menos lineales son los datos. żyx

es tomada como positiva.

-Relación lineal y relación curvilínea- --

Page 15: Metodología

Tema 9. La ecuación de regresión Ione Esquer Terrazas

El término de regresión se debe a los estudios de Galton sobre la herencia y la regresión a la media. Hoy regresión equivale a predicción, pronóstico, estimación. La ecuación de regresión es una ecuación de predicción, de pronóstico, de predicción.

¾ Ecuación de una recta en el plano Intentamos determinar una función matemática que nos permita pronosticar la puntuación de cada sujeto en una variable Y conocida su puntuación en otra variable X. Una ecuación de regresión de Y=-1+7X, nos indica una correlación de Pearson positiva entre X e Y. La función elegida es la función lineal, de la forma Y=bX+a.

9 Dada esta ecuación X es la variable independiente e Y es la variable dependiente. 9 La variable X (VI) se representa en el eje de abscisas (horizontal) 9 La constante a es llamada ordenada en el origen, pues representa el valor de Y (ordenada) cuando X=0. 9 La constante b es llamada pendiente de la recta y representa la inclinación mayor o menor de la misma.

¾ Ecuaciones de las rectas de regresión de Y sobre X según el criterio de mínimos cuadrados

Deseamos construir una línea recta tal que haga mínimo el error medio cometido en los pronósticos.

x Ecuación de regresión expresada en puntuaciones directas Son iguales la media de las puntuaciones directas pronosticadas y la media de las puntuaciones directas obtenidas. Ԣഥ = ത

La varianza de las puntuaciones directas pronosticadas es igual o menor que la varianza de las puntuaciones directas obtenidas, ya que r2

xy es menor o igual a 1. La recta de regresión de Y sobre X, en puntuaciones directas pasa por el punto ( ത , ത)

x Ecuación de regresión expresada en puntuaciones diferenciales

La recta de regresión en puntuaciones directas y la recta de regresión en puntuaciones diferenciales tienen la misma pendiente, son paralelas.

La media de las puntuaciones diferenciales pronosticada y la media de las puntuaciones diferenciales obtenidas valen ambas cero. ݕԢഥ തݕ = 0 =

La recta de regresión de Y sobre X, en puntuaciones diferenciales pasa por el origen (ݔҧ = 0, ݕത = 0). La varianza de las puntuaciones diferenciales pronosticadas es igual o menor que la varianza de las puntuaciones

diferenciales obtenidas, ya que r2xy es menor o igual a 1.

x Ecuación de regresión expresada en puntuaciones típicas

Las puntuaciones típicas pronosticadas y la media de las puntuaciones típicas obtenidas valen ambas cero. La recta de regresión de Y sobre X en puntuaciones pseudotípicas pasa por el origen. La varianza de las puntuaciones típicas pronosticadas es igual o menor que 1.

¾ El coeficiente de correlación de Pearson y las rectas de regresión r2

xy Este coeficiente (conocido como coeficiente de determinación) se entiende como la proporción de varianza asociada (varianza de Y asociada a la variación de X) o varianza común. r2

xy resulta del cociente entre la varianza asociada y la varianza total.

x Proporción de varianza asociada Varianza de Y asociada a la variación de X r2

xy de las diferencias individuales en Y está asociada de/es explicado por las variaciones o diferencias individuales en X.

Ej; Si rxy=0,70. R2xy= 0,70 x 0,70 = 0,49

Diremos que 0,49 es la proporción de la varianza asociada y que 0,51 es la proporción de varianza no asociada.

9 El 49% de las diferencias individuales en Y es explicado por las variaciones o diferencias individuales de X.

9 El 51% de las diferencias en Y no dependen de las variaciones en X.

x Índice de reducción de error en los pronósticos Proporción del error cuadrático medio eliminado usan Y’ en vez de la media de Y. Si r2xy 100%; hemos reducidos e E2m en ese porcentaje.

Ej; R2xy= 0,65 x 100= 65%.

Hemos reducido el E2m en un 65%. Valiéndonos de Y’ solo cometeríamos un 35% del error que habríamos cometido con Y.

x Índice de aproximación de los puntos a la recta de regresión

Cuanto mayor sea su valor más se aproximan los puntos a la recta.

- La ecuación de regresión- --

Page 16: Metodología

Tema 10. La relación entre variables ordinales Ione Esquer Terrazas

¾ Coeficiente de correlación de Spearman (rs)

No es más que el coeficiente de correlación de Pearson entre dos sucesiones de valores ordinales (por ejemplo las posiciones de un grupo en estudiantes es el último simulacro PIR y las posiciones de esos estudiantes en el examen PIR). Mas que la relación entre X e Y lo que nos mide es la relación entre el orden de los objetos en una variable y su orden en la otra.

El coeficiente de correlación de Spearman no puede valer menos que -1 ni más que 1. Su cálculo es más sencillo que el de Rxy para unos mismos datos.

¾ Coeficiente de correlación de Kendall (t)

Considera en orden de n objetos en una variable y su orden en otra e intenta medir el grado de correspondencia entre estos órdenes. No aplicaremos este coeficiente en situaciones en las que aparezcan empates.

9 Diremos que hay inversión (Q) si el sujeto A es superior al sujeto B en X e inferior a B en Y o inferior a B en X y superior a B en Y.

9 Diremos que se da una no-inversión (P) si A es superior a B en X y superior a B en Y, o inferior a B en X e inferior a B en Y.

El coeficiente de correlación de Kendall no puede valer menos que -1 ni más que 1.

o T=1 significa que no hay inversiones o T= -1 significa que todos los pares son inversos

¾ Coeficiente de correlación de Goodman y Kruskal (y)

La gamma de Goodman y Kurskal es recomendable cuando la muestra consta de muchas observaciones y son muy pocos los valores ordinales alcanzables por ellas, ser a muy grande el número de empates.n

9 Diremos que un par es semejante o no inverso si A es superior a B en X y superior a B en Y o inferior a B en X e inferior a B en Y.

9 Diremos que un par es desemejante o inverso si el sujeto A es superior al sujeto B en X e inferior a B en Y o inferior a B en X y superior a B en Y.

9 Diremos que un par está empatado o es un empate si la primera persona es igual que la segunda bien sólo en X, bien sólo en Y.

El coeficiente no puede valer menos que -1 ni más que 1. o Y=1 cuando todos los pares no empatados son semejantes o Y=-1 cuando todos los pares no empatados son desemejantes.

- La relación entre variables ordinales- --

Page 17: Metodología

Tema 11. La relación entre variables nominales Ione Esquer Terrazas

¾ Coeficiente Q de Yule

Este coeficiente se utiliza cuando tenemos dos variables nominales cada una de ellas con sólo dos categorías.

9 Diremos que no existe relación entre las variables A y B si la proporción de A1 es la misma entre los B1 y B2. 9 También diremos que no existe relación entre las variables A y B si la proporción de A2 es la misma entre los B1 y B2.

Para conocer la independencia o dependencia utilizarnos d. Si d=0 tendremos independencia. Si es distinto de cero significa que existe dependencia o relación entre las dos variables. Inconvenientes de d

8 No permite que nos hagamos una idea de la magnitud de la relación entre las variables. Para evitar estas dificultades, Yule propone el coeficiente Q. Propiedades; no puede valor menos que -1 ni más que 1.

9 Si la relación es nula d=0, y por tanto Q=0. 9 Si la relación es perfecta, o A2B1= A1B2=0 , o A1B1=A2B2=0.

¾ Coeficiente ʖ2

ʖ2 no es más que un estadístico cuya distribución de probabilidad se aproxima a la distribución de probabilidad llamada ʖ2, a

medida que aumenta más y más el tamaño de la muestra. El coeficiente ʖ2 se utiliza cuando tenemos dos variables nominales que constan de dos o más categorías. Diremos que existe independencia entre las variables A y B, si la frecuencia teórica y la empírica coinciden. La relación entre dos variables será mayor a medida que las frecuencias empíricas se alejen más y más de las teóricas. El número de grados de libertada para determinar el valor crítico de ʖ2 en una tabla de contingencias (fxc) es de (f-1) x (c-1).

Ej; 5x4. (5-1)x(4-1)=12.

¾ Coeficiente de contingencia C ʖ2 es función del tamaño de la muestra, de manera que al multiplicar por una constante k las frecuencias de todas las casillas de una tabla de contingencias, ʖ2 aumenta aunque las proporciones de las casillas sigan siendo las mismas. El coeficiente C nos permite evitar este inconveniente. Propiedades

El coeficiente de contingencia C no valdrá menos que cero ni valdrá uno o más. 0чC<1 Es función del número de filas y columnas.

La única interpretación razonable de un valor determinado de Q y de C es compararlo con los valores encontrados por otros investigadores trabajando con las mismas variables o variables semejantes.

- La relación entre variables nominales- --

Page 18: Metodología

Tema 12. La relación entre variables dicotómicas y dicotomizadas Ione Esquer Terrazas

Variables dicotómicas; aquella que por su propia naturaleza sólo pueden manifestarse según dos modalidades (sexo

femenino-masculino). Variables dicotomizadas; aquellas que por su propia naturaleza pueden manifestarse según muchas modalidades (más

de dos) pero que, de hecho, sólo se las permite manifestarse según dos (número de hijos; menos de 3 o más de 3).

¾ Coeficiente de correlación biserial puntual; rbp La aplicación del coeficiente de correlación de Pearson a dos variables, siendo una de ellas continua y la otra dicotómica. Su valor está comprendido entre -1 y 1.

¾ Coeficiente de correlación; ʔ La aplicación del coeficiente de correlación de Pearson a dos variables, siendo ambas dicotómicas. Su valor está comprendido entre -1 y 1.

¾ Coeficiente de correlación biserial; rb Si tenemos dos variables que aparecen una como continua y la otra aparece dicotomizada artificialmente, este coeficiente nos permite estimar el coeficiente de correlación de Pearson si la variable dicotomizada artíficamente se hubiera mantenido continua. Se han de cumplir dos condiciones; que la distribución de Y considerada como continua es normal y la relación ente X e Y es lineal.

Para unos mismos datos, el coeficiente de correlación biserial es siempre mayor que el coeficiente biserial puntual. Puede valer más que uno y menos que uno.

¾ Coeficiente de correlación tetracórica; rt

Estimación del coeficiente de correlación de Pearson si dos variables dicotomizadas artificialmente se hubieran mantenido continúas, tienen una distribución normal y su relación es lineal.

Para unos mismos datos, el coeficiente de correlación tertracórico es siempre mayor o igual que el coeficiente de correlación ʔ.

Su valor está comprendido entre -1 y 1.

¾ Coeficiente Kappa Este coeficiente fue propuesto por Cohen para el cálculo de la fiabilidad interjueces o inter-evaluadores. Una variable continua y otra… Las dos variables

Dicotómica Coeficiente de correlación biserial puntual; rbp

Phi; ʔ Aplicaciones de Pearson

Dicotomizada Coeficiente de correlación biseral; rb

Coeficiente de correlación tetracórica; rt

Estimación de Pearson

-La relación entre variables dicotómicas y dicotomizadas- --

Page 19: Metodología

Tema 13. Correlación y regresión múltiple Ione Esquer Terrazas

¾ Correlación parcial R12.3

Correlación existente entre dos variables, eliminando el influjo de la tercera. Si por ejemplo queremos estudiar la correlación entre el peso y habilidad numérica está será alta y positiva por la influencia de la edad Para eliminar el influjo de la edad se puede utilizar;

x En la eliminación empírica se forman subgrupos con el mismo valor en la tercera variable (en este caso la misma edad) y se calculan rxy dentro de cada grupo.

x En la eliminación estadística utiliza los datos del grupo total y elimina el influjo de la edad (tercera variable) calculando la correlación entre aquella parte del peso y aquella parte de la habilidad numérica que no dependen de la edad.

Propiedades;

R12.3 no puede valer menos que -1 ni más que 1.

¾ Regresión múltiple Pronóstico de las puntuaciones en una de las variables conociendo las puntuaciones en las otras dos. En este caso no se utiliza una recta sino un plano. σ (X1-X’1)2 es la suma de las diferencias cuadrácticas entre las puntuaciones obtenidas en el criterio y las puntuaciones pronosticadas en el mismo mediante el plano.

Propiedades;

Para aplicar la regresión múltiple se debe cumplir la linealidad entre las tres variables. El número de sujetos tiene que ser mayor que el número de variables más uno. No multicolinealidad (las variables predictoras deben ser mutuamente excluyentes). La distribución conjunta de la variable criterio con las variables predictoras debe ser la normal multivariada. Parte del supuesto de que los errores aleatorios sean normales e independientes.

¾ Correlación múltiple

Correlación de una variable X1 y otras variables X2, X3,X4 ..Consideradas conjuntamente. Valdrá lo mismos tanto si lo calculamos a partir de puntuaciones directas, como si lo hacemos a partir de puntuaciones diferenciales o típicas. No tienen por qué ser del mismo tipo las puntuaciones obtenidas y las pronosticadas en el m ismo. R2

123 está midiendo el grado de aproximación de los puntos al plano de regresión. R2

123 se puede entender como la proporción de la varianza de X1 asociada a la variación de X2 y de X3. El coeficiente de correlación múltiple tiene una gran sensibilidad frente al número de predictores. Su valor no decrece al incluir nuevos predictores en la ecuación, en general se incrementa.

Propiedades;

R2123 no puede ser menor que cero ni mayor que uno.

R2123 es igual o mayor que r12

2 y que r132.

R123 es aceptado siempre como positivo. R123 tiende a aumentar cuando aumentan r12 y r13 y disminuye r23. R123 será mayor para la muestra mediante la cual hemos construido las ecuaciones de regresión, que para otra muestra a

la que aplicamos esas mismas ecuaciones.

- Correlación y regresión múltiple- --

Page 20: Metodología

Ione Esquer. Estadística

(Ejemplo; edad y habilidad motora) ¾ Razón de correlación de Y sobre X. Valores del 0 al

1. Para variables cuantitativas. Si =0 , no hay relación. Si =1 , hay relación.

¾ Covarianza Mide la relación (variación conjunta) entre 2 variables. Refleja la relación lineal. Depende de la escala de medida. No son nºabstractos. No puede determinarse grado de relación, solo tendencia. Si es positiva, hay relación directa. Si es negativa, hay relación inversa. Si es = 0, no hay relación.

¾ Coeficiente de correlación de Pearson (rxy) Mide el grado de intensidad de la relación lineal entre 2 variables cuantitativas. A тde la covarianza es independiente de la escala de medida de las variables. Si r=0, no existe correlación. Si r=1, relación +perfecta. R= -1 correlación negativa perfecta.

x El cuadrado de Pearson; coeficiente de determinación. Indica el % de varianza explicada por la VI.

¾ Análisis de regresión (Galton)

Una vez que sabemos si hay relación, la regresión define la recta que mejor se asusta a esta nube de puntos.

x Método mínimos cuadrados; ofrecer la recta

que mejor se ajusta la nube de puntos.

Estadística descriptiva –Dos variables–

¾ Correlación parcial

Correlación entre 2 variables separando el influjo de la tercera (edad, altura y habilidad lingüísticas).

¾ Regresión múltiple Predecir la puntuación de un sujeto en una variable conociendo su puntuación en otras dos. Se define en un espacio tridimensional. Las variables deben de ser independientes entre si. Cuanto más perfecta sea la correlación, representación gráfica más cercana al plano. Hay múltiples predictores o VI.

¾ Correlación múltiple Si el coeficiente de correlación múltiple entre una variable y K variables es nulo; la variable criterio no tiene variabilidad común con las K variables predictoras.

V.CUANTITATIVAS V.ORDINALES

¾ Coeficiente de correlación p de Spearman Se define como Pearson, pero en vez de utilizar los valores de las variables, utiliza los rangos. Si 1ordinal y otra cuantitativa= las 2como ordinales. Diferenciar en cada suj. entre el orden en X y en Y. Si = 1; relación directa

máxima Si= -1; relación inversa

máxima Si= 0; relación nula

¾ Coeficiente de correlación

de Kendall Denominemos P, al número de no-inversiones y Q al de inversiones.Pares de suj.si n hay empates . Del -1 al 1. Medir el grado de semejanza entre los valores de 2 sucesiones ordinales.

¾ Coeficiente de correlación de Goodman y Kruskal Coef.más apropiado cuando existen muchas observaciones , pero pocos valores ordinales, produciéndose así, numerosos empates. (Muestras grandes)

V. NOMINALES

¾ Coeficiente Q de Yule Dos variables nominales, ambas con solo dos modalidades. Si Q=0, independencia.

¾ Coeficiente de Chi cuadrado ʖ² Puede ser aplicado cuando se añade una tercer modalidad a la variable X (una más que yule). Esta en función de n. Si aumenta n, el coef.chi tb aumenta. Si las variables fuesen independientes entre si (diferencia entre frecuencias observadas y experadas).

¾ Coeficiente de contingencia C Supera el problema del aumento de n en chi. Entre 0 y 1.

Estadística descriptiva

–Tres variables–

Relación lineal

Relación curvilinea

V. DICOTOMIZADAS

Variable dicotomizada; entendemos por ella a aquella que por su propia naturaleza puede manifestarse según muchas modalidades pero que únicamente se le permite manifestarse en dos.

¾ Coeficiente de correlación biserial puntual Rbp Aplicación del coef, de correlación de Pearson a dos variables, una continua y otra dicotómica (-1, +1).

¾ Coeficiente correlación Phi Formula del coef.de correlación de Pearson aplicada a dos variables dicotómicas genuinas.

¾ Coeficiente de correlación biserial Rb Estimación de Pearson siempre que Y se hubiera mantenido continua y si la distribución de Y es normal y q. la relación entre X e Y, es lineal. 1 variable continua y otra dicotomizada.

¾ Coeficiente de correlación tetracórica Rt Estimación de Pearson siempre que, tanto X como Y, se hayan mantenido continuas y si las distribuciones de X e Y, son normales; y la relación entre ambas variables es lineal. 2 variables dicotomizadas.

Page 21: Metodología

Tema 14. Estimación puntual de parámetros Ione Esquer Terrazas

¾ Estimación puntual de parámetros

x En la estimación puntual de parámetros intentamos obtener un único valor, un punto, como estimación de cierto

parámetro desconocido. Para ellos es necesario un estimador. Pearson. Método de momentos; consiste en atribuir al parámetro poblacional el valor tomado por su correspondiente estadística en una muestra concreta. Con la estimación puntual de parámetros no podemos establecer el error cometido al estimar el parámetro.

x La estimación por intervalos. Propone un intervalo dentro del cual habría una gran probabilidad de encontrar el parámetro. Esta probabilidad se conoce como el nivel de confianza. El error típico de un estimador es la desviación típica de la distribución muestral del estimador.

¾ Propiedades deseables en un estimador

1) Carencia de sesgo

Un estimador de un parámetro es insesgado si el valor esperado del estimador es el parámetro.

9 Cuasivarianza; característica de una muestra o población que cuantifica su dispersión o variabilidad. El sesgo del estimador de la varianza disminuye cuando aumento el tamaño de la muestra. La cuasivarianza es aconsejable cuando se pretende medir la homogeneidad es una muestra pequeña.

2) Consistencia

Alude a la capacidad del estimador de proporcionar una estimación muy cercana al verdadero valor del parámetro.

3) Eficiencia Dados dos estimadores de un parámetro, es más eficiente el de menor varianza.

4) Suficiencia Un estimador se considera suficiente respecto a un parámetro si él sólo basta para estimarlo (proporciona suficiente información). Un estimador es suficiente, si agota toda la información existente en la muestra que sirva para estimar el parámetro.

- Estimación puntual de parámetros- --

Page 22: Metodología

Tema 15. Comprobación de hipótesis estadísticas e intervalos confidenciales Ione Esquer Terrazas

¾ Hipótesis estadística

Hipótesis acerca de los parámetros de una distribución supuesta dad la forma de la distribución. x Hipótesis simple; aquella en que se especifica completamente la distribución. Si especifica e valor exacto de todos los

parámetros. x Hipótesis compuesta; aquella en que no se especifica completamente la distribución. x Hipótesis nula; es la hipótesis aceptada por el investigador provisionalmente como verdadera y que es sometida a

comprobación experimental. x Hipótesis alternativa; aquella otra propuesta que acompaña a la hipótesis nula. Es la aspirante a reemplazar a la nula.

¾ Región crítica y criterio de decisión

x Criterio decisorio; rechazar H0 si en dicho experimento el valor generado por dicho estimador cae dentro de la región crítica

o aceptar H0 si el valor generado cae fuera (en la región no crítica). A la región crítica también se la conoce como región de rechazo, puesto que cuando el valor del estimador cae dentro de ella se procede a rechazar la hipótesis nula y a aceptar la alternativa.

¾ Errores del tipo I y del tipo II

x Error tipo I

Error cometido al rechazar H0 siendo verdadera. La probabilidad de cometer este error suele ser designada por ɲ. ɲ o nivel de significación; probabilidad de que rechacemos la hipótesis nula siendo verdadera. Si p<0,05 diremos que

si hay diferencias y rechazaremos la hipótesis nula. Si p<0,05 la diferencia es significativa al 5% y también lo sería al 1 por mil.

Probabilidad Nivel de significación p<0,01 1% p<0,05 5%

p<0,001 0,1% Nivel de confianza Nivel de significación

95 0,05 99 0,01

999 0,001

x Error tipo II; Error cometido al aceptar H0 siendo falsa. La probabilidad de cometer este error suele ser designada por ɴ.

ɴ; es la probabilidad de que X pertenezca a la región no-crítica, siendo H1 verdadera (siendo H0 falsa). Suponiendo fijo el tamaño de la muestra, n, al aumentar ɲ disminuye ɴ, y al disminuir ɲ, aumenta ɴ. Si en una situación determinada el error tipo I, es más grave que el error tipo II, procuraremos reducir ɲ lo más posible, aún a costa de que aumente ɴ.

H0 Verdadera H0 Falsa

Aceptamos H0 Decisión correcta

1- ɲ Nivel de confianza

Error tipo II ɴ

Rechazamos H0

Error tipo I ɲ

Nivel de significación

Decisión correcta 1- ɴ

Potencia de la prueba

¾ Potencia La potencia de una prueba o de la región crítica es la probabilidad de rechazar H0 siendo H1 verdadera (1- ɴ) Cohen propone como un criterio válido para aumentar la potencia de la prueba de hipótesis, aumentar la probabilidad de error tipo I.

¾ Contrastes unilaterales y bilaterales Una hipótesis nula que ha sido rechazada en un contraste unilateral, a un determinado nivel de confianza, puede no ser rechazar, a ese nivel de confianza, si el contraste es bilateral. x Diremos que un contraste es unilateral cuando la región crítica impuesta sea unilateral

Contraste unilateral derecho. H0; µ ч µ0 ; H1; µ > µ0 o H0; µ = µ0 ; H1; µ > µ0

Contraste unilateral izquierdo. H0; µ t µ0 ; H1; µ < µ0 o H0; µ = µ0 ; H1; µ < µ0

x Diremos que un contraste es bilateral cuando sea bilateral la región crítica impuesta.

Contraste bilateral. H0; µ = µ0 ; H1; µ т µ0.

- Comprobación de hipótesis estadísticas e intervalos confidenciales- --

Page 23: Metodología

Tema 15. Comprobación de hipótesis estadísticas e intervalos confidenciales Ione Esquer Terrazas

¾ Curva de potencias

Con cada hipótesis nula que ha sido rechazada en un contraste unilateral, a un determinado nivel de confianza, puede no ser rechazada a ese nivel de confianza, si el contraste es bilateral.

¾ Intervalo confidencial Se conoce como intervalo confidencial al intervalo de valores con un determinado grado de probabilidad, que pretenden ser estimaciones del parámetro. Llamaremos coeficiente confidencial o nivel de confianza (1-ɲ) a la probabilidad asociada a este intervalo. El intervalo confidencial será más útil cuanto más estrecho sea pero menos será la probabilidad de que contenga a µ, y cuanto mayor sea la probabilidad de que lo contenga, más extenso será dicho intervalo.

PROCEDIMIENTO DE COMPRBOACIÓN DE HIÓTESIS

1) Formulación de hipótesis nula y alternativa

2) Determinación del nivel de significación (ɲ)

3) Estudio de características de población; distribución de probabilidad (VD)

4) Especificar tipo de muestro y tamaño de la muestrea; normalmente aleatoria simple

5) Selección del estadístico de contraste

6) Atención a la distribución de probabilidad muestral del estadístico de contaste (tabla a usar; z, T, F, x2); distribución hacia la cual se irían acercando las distribuciones empíricas del estadístico de contraste si se aplicara a todas las muestras posibles de la población.

7) Determinación de región crítica o región de rechazo

Método de bisección de Stevens; división en dos regiones (crítica y no crítica) del segmento rectilíneo cuyos puntos presentan los posibles valores del estimador del parámetro.

Región crítica asociada a ɲ;

Una cola; H1>H0 ; unilateral derecho. H1<H0; unilateral izquierdo.

Dos colas; contraste bilateral H1=H0.

8) Rechazar o aceptar H0 según el valor del estadístico de contraste 9 Estadístico de contraste en la región no crítica; aceptamos H0 Æ 1-ɲ 9 Estadístico en región críticas; rechazamos H0Æɲ

Ej. Si contraste unilateral derecho;

p> ɲ, estadístico de contraste en la región no crítica por tanto aceptamos H0 p< ɲ, estadístico de región crítica, por tanto rechazamos H0

9) Determinación del intervalo confidencial del parámetro en función de los datos de la muestra y del nivel de confianza

9 Límites confidenciales; valores extremos del intervalo. 9 Mejor cuanto más estrecho (más preciso) pero cuanto más estrecho menos nivel de confianza (más posibilidad de

equivocarnos) Según aumenta el tamaño de la muestra se estrecha el intervalo confidencial.

Page 24: Metodología

Tema 16. Bondad de ajuste e independencia de dos variables Ione Esquer Terrazas

¾ Bondad de ajuste Y ʖ2

ʖ2 nos permitirá comprobar si la distribución de frecuencias de una muestra extraída aleatoriamente de cierta población se asemeja en su forma a la distribución que rige dicha población. La hipótesis nula en la independencia de variables es; en la población la variable dependiente observada X es independiente de la variable dependiente observada Y.

- Bondad de ajuste e independencia de dos variables- --

Page 25: Metodología

Ione Esquer. Estadística

ESTADÍSTICA INFERENCIAL

ESTIMACIÓN PUNTUAL de parámetros

Problemas inferenciales; estimación de parámetros (siempre desconocidos) y sobre la distribución de las poblaciones.

¾ Estimación x intervalos Proponer un intervalo dentro del cual habría una alta probabilidad de encontrar el parámetro. Es posible determinar el tamaño del error muestral máximo. x Nivel de confianza; probabilidad de

efectuar la estimación correcta. x Nivel de significación; nivel de riesgo,

probabilidad de efectuar la estimación incorrecta. Riesgo máximo que estamos dispuestos a asumir.

¾ Estimación puntual

Se intenta obtener un único valor como estimación de cierto parámetro desconocido. El estimador es el instrumento utilizado para ello. Existirá discrepancia entre la estimación concreta y el valor real Æerror muestral (E).

Propiedades de un estimador

Carencia de sesgo (cuando la esperanza matemática coincide con el valor del paramétro poblacional q. estima), consistencia (capacidad de proporciona una estimación lo más cercana posible al valor real) eficiencia (varianza muestral mínima) y suficiencia (sólo él basta para estimar dicho parámetro).

CONTRASTE DE HIPÓTESIS

Proceso de decisión en el que una H es puesta en relación con los datos empíricos para determinar si es compatible con ellos.

¾ Clasificación de las hipótesis x Grado de especificación. Simple si se especifica completamente el valor de

un parámetro, y compuesta sino es exacto. x Función que desempeña en el contraste estadístico. Hipótesis nula (H0) la

que se acepta como verdadera y se somete a contrastación empirica, y hipótesis alternativa (H1) que es la que aspira a suplantar la H0.

¾ Región crítica y criterio de decisión. También conocida como región de rechazo, ya que cuando el valor del estimador cae dentro de ella, se rechaza la hipó nula y se acepta la alternativa. Método de bisección de Stevens. Método de producción de intervalos. División en dos regiones; crítica y no crítica. Bilateral. La región crítica consta de dos colas Unilateral izquierdo. Región crítica en la izq. Unilateral derecho. Región crítica en la dcha.

¾ Tipos de errores

x Error de tipo I. Rechazar H0 , siendo esta verdadera. Probabilidad de

cometer este error llamado “Nivel de significación” ь . Comprende la región crítica.

x Error de tipo II. Aceptar H0 , siendo esta falsa. Probabilidad de cometer este error se designa como ɴ” . Y es la probabilidad del área de aceptación.

x Potencia de la prueba; probabilidad de acertar al rechazar H. Rechazar siendo falsa.

¾ Intervalos confidenciales. Podemos definir el intervalo confidencial que sería el intervalo de estimaciones probables. El intervalo de confianza, será más útil cuando más estrecho sea. Cuanto mayor sea el tamaño de la muestra, menor será la amplitud del intervalo confidencial. Nivel de confianza; probabilidad deaceptar H0 que es cierta.

MUESTREO

¾ No probabilístico. Muestreo intencional u opinático. Subjetividad. Se toma la muestra sin criterios. No tenemos forma de saber si es representativa. Censo; no inferencia.

¾ Probabilístico / Aleatorio Se conoce la probabilidad asociada a cada una de las muestras que es posible extraer. Todos los sujetos la misma probabilidad.

x Muestreo aleatorio en una población finita; Todos los elementos la misma probabilidad. Se realiza al azar.

Con reposición. Población siempre la mismas. Las variables aleatorios son independientes.

Sin reposición. Todos los elementos misma probabilidad. El resultado de las extracciones depende de las anteriores.

x Muestreo aleatorio en población infinita; nº infinito de elementos de la población, y un nºinfinitos de muestras de cualquier tamaño.

x Muestreo aleatorio estratificado; se divide población total en subpoblaciones. Mantienen una determina representación en la muestra.

x Muestreo aleatorio de conglomerados; consideramos los grupos de elementos para extraer aleatoriamente.

x Muestreo aleatorio sistemático; Elegimos elemento K, y a partir de eso, añadimos los n q.queramos.

x Muestreo polietápico; se toma un nºde unidades dentro de conglomerados.

x Muestreo polifásico; se toma 1muestra grande y rápida, para construir una +pequeña +tarde.

x Muestreo mixto; combinación

Page 26: Metodología

Tema 17. Análisis de la varianza y de covarianza Ione Esquer Terrazas

¾ Análisis de varianza (un criterio de clasificación)

El objetivo es comprobar la hipótesis acerca de medidas, no de varianzas. El análisis de varianza es una técnica de análisis estadística, introducida por Fisher, mediante la que se puede comprobar

la significación estadística de las diferencias entre las medias de más de dos muestras. El propósito del análisis de varianza es el de separar los efectos de las variaciones debidas a las causas asignables, de

aquellas otras variaciones debidas al azar. En otras palabras, el objetivo es determinar en qué medida una (o varias) VD está influenciada por una o varias VI. Resulta especialmente útil en el contexto de un experimento para trata de comprobar si existe un efecto significativo de

un tratamiento determinado. Las VI deben ser categóricas y las VD cuantitativas (medida en escala de intervalo o razón). Hablamos de efectos fijos, cuando nos fijamos únicamente en si difieren en eficacia los r métodos bien definidos.

Hablamos de efectos aleatorios cuando estos r métodos son considerados como una muestra aleatoria extraída de cierta población de métodos.

9 Variabilidad intergrupo. Las puntuaciones de los grupos, 1,2 y 3 diferirá en función del distinto tratamiento que se está

aplicando a cada grupo. 9 Variabilidad intragrupo. Es la varianza error o residual y hace referencia a las diferencias entre los miembros de un mismo

grupo. Si la variabilidad intragrupo es mayor que la intergrupo podremos concluir que el criterio de clasificación no es una fuente

muy potente de variación sobre las puntuaciones, y por lo tanto que los diferentes tratamientos no crean variaciones significativas en las puntuaciones.

Cuando se trabaja con medidas repetidas, la variabilidad total se descompone en varianzas intersujetos (debe afectar por igual a todos los tratamientos) y varianza intrasujetos (varianza intertratamiento y varianza error o residual).

El criterio utilizado para comprobar la variabilidad de las observaciones es el estadístico de contraste F (cociente entre la varianza intergrupo y varianza intragrupo).

o Si el valor pчɲ se rechaza la hipótesis nula de medias iguales. o Si el valor ptɲ no se rechaza la hipótesis nula da igualdad de medias.

En el caso de que una F haya dado significativa, podemos llevar a cabo pruebas múltiples a posteriori (para el análisis

estadístico).

Condiciones;

a) Normalidad. Las puntuaciones han de seguir una distribución normal. La transformación logarítmica de los datos puede servir para corregir la no –normalidad de las distribuciones.

b) Independencia. Las puntuaciones han de ser independientes entre sí. Esto lo garantiza un muestreo aleatorio simple.

c) Homocedasticidad. Se refiere a la igualdad de las varianzas de las subpoblaciones de las que proceden los distintos grupos. La prueba de Barlett permite comprobar esta condición.

d) Supuesto de esfericidad. Trabajando con medidas repetidas los errores pueden estar correlacionados. Diremos que viola el supuesto de esfericidad cuando la correlaciones entre los errores son elevadas. En el test de Mauchley la hipótesis nula es la existencia de esfericidad.

e) Supuesto de aditividad (no interacción sujeto x tratamiento). Es posible que los sujetos y tratamientos interaccionen. La prueba de no aditividad de Turkey nos lo permite comprobar. Se puede solventar este problema con la transforamción de las puntuaciones.

¾ Análisis de varianza (doble criterio de clasificación)

Se introducen dos criterios de clasificación o dos factores que pueden influir en los resultados en cierta variable Y. Los factores no tienen por qué coincidir en el número de categorías o niveles.

x En el Anova II son tres las hipótesis nulas; que todos los niveles del facto A son igual de eficaces, que todos los niveles del factor B son igual de eficaces y que no existe interacción positiva entre el factor A y el B. Se exigen las condiciones de independencia, homocedasticidad y normalidad.

En el caso de una sola Vi se haba de análisis de varianza de una vía o one way. Cuando se trabaja con dos o más vías se suele hablar de diseños factores o de anova factorial.

x Si se dispone de más de una VD, estaríamos ante un Análisis multivariante de la Varianza o MANOVA.

-Análisis de la varianza y de covarianza- --

Page 27: Metodología

Tema 17. Análisis de la varianza y de covarianza Ione Esquer Terrazas

¾ Análisis de covarianza

El ancova es una técnica de control estadístico que puede ser concebido como un análisis de varianza verificado sobre unas puntuaciones corregidas o ajustas mediante una recta de regresión. Se utiliza para controlar estadísticamente parte del error experimental cuando queremos aislar estadísticamente el efecto de laguna variable extraña en nuestro diseño. En el Ancova se distinguen tres tipos de variables;

1) Las VI; cuyos efectos se quieren estimar. 2) La VD; donde esperamos que se vean reflejados los efectos de las diferentes Vi o tratamientos. 3) Las COVARIABLES; que son incluidas en el diseño para controlar su posible relación con la VD.

Supuestos;

Normalidad Independencia de las observaciones Homocedasticidad La covariante no debe estar afectada por los efectos de los tratamiento Linealidad de la regresión Y sobre X Homogeneidad de las pendientes de regresión intragrupo; las pendientes de las K rectas de regresión de Y sobre la

variable extraña en los K grupos de tratamiento deben coincidir. Escalas de medida de la VD y la covariante al menos a nivel de intervalo

Cuadro resumen de los supuestos para Anova; normalidad, independencia y homocestasticidad y para el Análisis de varianza de medidas repetidas; los 5 supuestos de la tabla.

Supuesto Violación Prueba estadística Posible solución Normalidad

Puntuaciones VD

distribución normal

No se ajusta a la distribución

normal

Prueba de bonda de ajust; X2, Lilliegors, Kolmogorov-

smirnoff (H0; se ajusta a normalidad)

Si afecta mucho puede hacerse transformación

logarítmica de datos

Independencia o “no autocorrelación”

Puntuaciones

independientes entre sí

Autocorrelación; las

puntuaciones dependen una de las otras (tienen relación)

Test de Durbin-Watson

T.Rachas (H0; independencia)

Estadístico Box-Ljung

Se evita a través de m.a.s. Si no es así transformar el

modelo (mínimos cuadrados)

Homocedasticidad

Igualdad de varianzas de los grupos de datos

Heterocedasticidad;

diferencia de varianzas en subpoblaciones

Prueba de Levene Prueba de Barlett

(H0; igualdad varianzas)

Transformación puntuaciones (modelo logaritmo neperiano,

método mínimos cuadrados)

Esfericidad

Misma varianza de las diferencias de los pares

posibles de observaciones

Los errores correlacionan, disminuye la varianza residual, aumenta F

artificialmente.

W de Mauchly (H0; esfericidad)

Corrección de F (ajuste gl) Manova; considera cada

una de medidas repetidas como una VD diferente

Adictividad

No interacción x sujeto

Interacción sujeto x tratamiento (engrosa la

varianza error artificialmente y F disminuye)

Prueba de no aditividad de Tukey

(H0; adictividad)

Transformación de las puntuaciones a través de

logaritmos

Page 28: Metodología

Tema 18. Técnicas no paramétricas Ione Esquer Terrazas

¾ Técnicas no paramétricas

Las técnicas no paramétricas o de distribución libre no imponen condiciones tan restrictivas como lo hacen las paramétricas. Podríamos entender que son más robustas (insensibilidad a la violación de los supuestos)

No exigen que la distribución poblacional tenga una forma específica determinada ni que sus parámetros verifiquen las condiciones; varianza conocida, igualdad de varianzas… si exige que se verifique que sea continua.

No exigen un nivel tan alto de medida. Son válidas a niveles ordinal y aun nominal. Son válidas cuando las muestras son muy pequeñas. Los cálculos numéricos exigidos por ellas suelen ser más sencillos. Dejan de utilizar bastante la información contenida en las observaciones al no operar explícitamente con las

puntuaciones. Son menos potentes que sus correspondiente paramétricas.

x Prueba de Kolmorov- Smirnov; versa sobre la bondad de ajuste entre la muestra y la población de la cual se supone extraída

aquella.

x Prueba de Mann-Whitney; (dos muestras independientes) Cuando queremos comparar dos poblaciones con objeto de comparar si son iguales o diferentes. Es la alternativa más utilizada a la T de Student para muestras independientes. Comprueba si dos distribuciones son distintas.

x Prueba de Wilcoxon; (dos muestras dependientes) Trata de evaluar si la población de la que se ha extraído la muestra permanece igual o ha cambiado.

x Prueba de Kruskal-Wallis; (K muestras independientes) Es una alternativa al análisis de varianza más sencillo. Cuando el supuesto de homogeneidad de varianzas no es sostenible, permite poner a prueba la hipótesis de que varias medias proceden de la misma población.

x Prueba de Friedman; (K muestras correlacionadas) Es también una alternativa no paramétrica del análisis de varianza convencional de varias muestras relacionadas. La situación experimental que permite resolver esta prueba es similar a la estudiada a propósito del ANOVA de un factor con medidas repetidas.

No paramétricas Paramétricas

Dos tratamientos

Intergrupo (independiente) U/T Mann-Whitney Prueba T para diferencia de medias Intragrupo (medidas relacionadas) W Wilcoxon

Más de dos tratamientos

Intergrupo (independiente) T- Kruskal Wallis Anova Intragrupo (medidas relacionadas) F Friedman Anova (medidas repetidas)

T de Student

La prueba T de Student se basa en el cálculo de estadísticos descriptivos previos; el número de observaciones, la media,

y la desviación típica en cada grupo. Con la ayuda de unas tablas se obtiene a partid de dicho estadísticos el p-valor. Si p<0,05 se concluye que hay

diferencia entre los dos tratamientos. La prueba T de Student permite contrastar la hipótesis de igualdad de medias entre dos poblaciones independientes, a

partir de las medias obtenidas en una muestra aleatoria extraída de cada una de ellas.

- Técnicas no paramétricas- --

Page 29: Metodología

Tema 18. Técnicas no paramétricas Ione Esquer Terrazas

x Espacio muestral; asociado a un experimento aleatorio es el conjunto de todos los posibles resultados del experimento. Es

discreto si los posibles resultados del experimento son una cantidad finita o numerable. Se dice que es continuo si el conjunto de posibles resultados es infinito.

x Suceso; es un subconjunto cualquier del espacio muestral; Elemental; el que contiene sólo un punto muestral. Imposible; a aquel que nunca ocurre. Seguro; a aquel que ocurre siempre.

x Unión; de los sucesos A y B, se denota por A U B y se refiere al suceso formado por todos los puntos muestrales que pertenecen, al menos, a uno de los sucesos.

x Intersección; de sucesos A y B, se denota por A ⋂ , y se define como el suceso formado por todos los puntos muestrales que pertenecen a ambos sucesos.

x Inclusión; cuando se die que el suceso A está contenido o incluido en el suceso B y por lo tanto todos los puntos muestrales de A pertenecen a B.

x Complemento; de un suceso, son los elementos del espacio muestran que no pertenecen a ese suceso. x Sucesos incompatibles; disjuntos, o mutuamente excluyentes si no tiene puntos en común.

Propiedades básicas del cálculo de probabilidades

Para un suceso A, la probabilidad de que suceda su complemento es igual a uno menos la probabilidad de A. P(A) + P( )= 1 Æ P( )= 1 – P(A)

Si un fenómeno determinado tiene dos posibles resultados A y B mutuamente excluyentes, la probabilidad de que una de esas dos posibilidades ocurra se calcula como la suma de las dos probabilidades individuales. P (A o B) = P(A) + P(B).

Si dos o más sucesos no son mutuamente excluyentes, la probabilidad de que ocurra uno de ellos o ambos se calcula sumando las probabilidades individuales de que ocurra una de esas circunstancia, pero restando la probabilidad de que ocurra la común. P (A o B) = P(A) + P(B) – P (AyB).

A veces la probabilidad de que un determinado suceso tenga lugar depende de que otro suceso se haya producido o no con anterioridad. P (A/B) a la probabilidad condicionada del suceso A suponiendo que el suceso B haya ocurrido ya.

9 Ley multiplicativa; de probabilidades indica que la probabilidad de que dos sucesos A y B ocurran simultáneamente es igual a ; P(A y B)= P (A/B) x P(B).

9 Independencia; diremos que dos sucesos A y B del espacio muestral ɏ son independientes, si y solo si p(B/A)=p(B). La independencia entre sucesos es lo opuesto si la probabilidad condicional.

Teorema de la probabilidad total; a partir de las probabilidades del suceso A (probabilidad de que llueva) deducimos la probabilidad del suceso B (que ocurra un accidente).

Teorema de Bayes. Parte de una situación en la que es posible conocer las probabilidades de que ocurran una serie de sucesos Ai. A esta se añade un suceso B (que ocurra un accidente) cuya ocurrencia proporciona cierta información, porque las probabilidades de ocurrencia de B son distintas según el suceso Ai que haya ocurrido (las probabilidades de tener un accidente con lluvia o buen tiempo son diferentes).

Distribuciones discretas

x Distribución continúa; son aquellas que presentan un número infinito de posibles soluciones (ej; altura de una clase). Distribución exponencial; mientras que la distribución de Poisson describe las llegadas por unidad de tiempo, la

distribución exponencial estudia el tiempo entre cada una de estas llegadas.

x Distribución discretas; son aquellas en las que la variable puede tomar un número determinado de valores (ej; una moneda).

Distribución de Bernouilli; es el modelo que sigue un experimento que se realiza una sola vez y que puede tener dos soluciones; acierto o fracaso. Se trata de sucesos complementarios.

o A la probabilidad de éxito se le denomina P. o A la probabilidad de fracaso se le denomina Q.

Distribución Binomial; parte de la distribución de Bernouilli y se aplica cuando se realizan un número n de veces el

experimento de Bernouilli, siendo cada ensayo independiente del anterior.

Distribución Poisson; parte de la distribución binomial. Cuando en una distribución binomial se realiza el experimento un número n muy elevado de veces (n tiende a infinito) y la probabilidad e éxito p en cada ensayo es reducida, entonces se aplica el modelo de distribución de Poisson.

- PROBABILIDAD- --

Page 30: Metodología

Ione Esquer. Estadística

ANOVA

Anova dos factor (tipo II)

En este caso introducimos dos criterios de clasificación o dos factores que pueden influir en los resultados. Estos funcionan como variables independientes. Tb puede aplicarse en el caso de disponer de tres o más criterios. La hipótesis nula no es una sino tres. Mismos supuestos que el tipo I. Para alcanzar la misma potencia se necesitan menos sujetos.

¾ Análisis mediante los efectores factoriales

Análisis de los efectos factoriales, a los que podríamos definir como la influencia específica ejercida por los factores sobre las respuestas de los sujetos en la variable dependiente.

x Según los efectos producidos x los factores aisladamente considerados; efectos principales (diferencia entre la media de un factor y media general) y efectos diferenciales ;тentre efectos principales de dos niveles de ese factor).

x Según los efectos producidos por la acción combinada de dos o más efectos. Efectos de interacción (influencia específica de un factor, cuando actúa en combinación con otro) y efectos simples (efecto de un nivel de un factor, bajo cada nivel de otro).

TÉCNICAS NO PARAMÉTRICAS

Son mas robusas que las paramétricas; más ins4ensibles a los supuestos de partida.

Además de con variables cuantiativas, también podemos hacer con cualitativas (con las paramétricas no).

Se utilizan cuando no se cumplen los supuestos.

Los contrastes no paramétricos no se refieren a los parámetros de la población.

Válidas para muestras pequeñas.

x Pruebas de bondad de ajuste Pretende comprobar el ajuste de ambas distribuciones; la empírica o procedente de la muestra y la teórica o procedente de la población. Ordinal al menos.

x Kolmogorov-Smirnov, Distribución población = distribución muestra.

x Pruebas de independencia X2, o W Verificar a nivel poblacional la independencia de 2variables aleatorias. Al menos nominal.

x Prueba de Mann-Whitney. Comparar si 2poblaciones son iguales o diferentes. Contraste U.

x Prueba de Wilcoxon 2muestras depen. Objetivo; ver si una población ha cambiado (Ej; comprobar eficacia tratam)

x Prueba de Kruskal-Wallis Comparar K muestras aleatorias simples e independientes, e indicar si existen т

x Prueba de Friedman Comparar +de 2pruebas de medidas dependientes o muestras correlacionadas. Única muestra de sujetos.

Anova un factor (tipo I)

Comparar dos medias. Cuando hay más de dos tratamientos (VI) ,el nivel de medida de la VD es cuantitativo y se cumplen los supuestos;

9 Normalidad; distribución normal. Pruebas de bondad de ajuste

9 Independencia ; interdependiente entre sí. Test Durbin-Watson.

9 Homocedasticidad ; las varianzas son iguales. Prueba de Bartlett.

Variabilidad total explicada por la variabilidad explicada por intergrupo—> gracias al tratamiento (influencia de VI sobre VD). Usamos la F (Estadístico de contraste) Si la F empírica es > que la teórica; rechazo H.

¾ Análisis de varianzas tipo I con medidas repetidas Cada sujeto se somete a los diferentes tratamientos. Cada sujeto tienen puntuaciones en cad uno de los niveles de la VI. La variabilidad en este caso se debe a vari.intersujetos (diferencias individuales) y vari.intrasujetos (influencia de los métodos, tratamientos) dentro de esta variabilidad intertratamiento y error residual. Dos supuestos; 9 Esfericidad. Test W de Mauchly. Para

comprobar la igualdad de varianzas. 9 Aditividad. Prueba de no aditividad

de Tukey. Aditividad; que los sujetos y los tratamientos no interaccionen.

ANCOVA

(Análisis de covarianza).

Aislar estadísticamente el efecto de alguna variable extraña en nuestro diseño.

Son necesarios los supuestos del ANOVA y otros adicionales.

Page 31: Metodología

Ione Esquer. Estadística

PROBABILIDAD

Propone leyes formales que deben ser respetadas por ciertos valores numéricos para que puedan ser llamados probabilidades.

P(e)= 1 probabilidad del suceso seguro.

La probabilidad es una carac. inherente a los objetos. x Punto de vista

objetivo clásico o a priori. Se conoce de antemano el E y sus posibilidades. Nº finito y todos los sucesos misma probabilidad.

x Punto de vista posteriori o frecuentista. Necesito recurrir a la experiencia para poder atribuir probabilidades.

ENFOQUE INTERPRETATIVO

Punto de vista

objetivo

Punto de vista

subjetivo / Bayesiano

La probabilidad de un suceso es algo subjetivo. Es un grado de confianza que un sujeto tiene acerca de la verificación. La probabilidad no está en la realidad, esta en nosotros.

ENFOQUE FORMAL o AXIOMÁTICO

CONCEPTOS BÁSICOS

x Experimento aleatorio; cuyos resultados son impredecibles a priori.

x Espacio muestral (E) ; conjunto de todos los posibles resultados de un experimento aleatorio. Discreto finito; nº posibles de

resultados finito Discreto infinito; nº infinito de

posibles resultados Continúo; sus resultados no son

numerables.

x Suceso; cada uno de los subconjuntos del espacio muestral . Puede ser; Elemental; consta de un solo elemento Compuesto; consta de 2 o +elementos Imposible; elem. q no pertenecen a E Seguro; contiene todos los elementos

x Operaciones entres sucesos

Unión; Todo A y todo B Intersección; elementos q.son A y B a

la vez Diferencia; elementos de A que no son

B Suceso contrario Mutua exclusividad

x Combinatoria ; diversas formas de realizar

agrupaciones con los elementos de un conjunto. Variaciones; todos los conjuntos

distintos que podamos formar con n elementos.

Permutaciones; distintas agrupaciones formadas con m elementos que pueden repetirse

Combinaciones; se consideran т cuando difieren en algún elemento.

Probabilidad condicional

Dado que ya ocurre A , ocurre también B.

Teorema del producto (tanto para sucesos dependientes como independientes)

¾ Sucesos dependientes. Si ocurre uno, ocurre otro. La aparición de B va a depender del suceso anterior.

¾ Sucesos independientes. Por el hecho de que ocurra A, no se modifica la probabilidad de B y viceversa. Independientemente de lo que ocurra en otros casos.

Teorema de Bayes

Condiciones; exclusividad mutua y exhaustividad.

Los sucesos mutuamente excluyentes son dependientes xq la presencia de A depende de la no presencia de B.

Las probabilidades de las intersecciones se expresan en términos de probabilidad condicional.

P(A/B) = P (AʿB) / P(B)

¾ Normal Es la única que no depende del tamaño de la muestra.

¾ Chi-cuadrado Cuadrados de las puntuaciones típicas extraidas de una población normal (0,1) en combinaciones según su grado de libertad. Variables aleatorias independientes entre si

¾ T-Student

Admite valores negativos. Es como la normal pero más apuntada.

¾ F de Fisher

El valor F siempre es positivo.

¾ F de Snedecor No admite valores negativos.

V.A.Continuas

¾ Distribución de Bernoulli Experimento aleatorio en el q. solo son posibles 2resultados (éxito-fracaso) Moneda. ¾ Distribución

binomial Es una distribución de tipo Bernoulli pero que se repite n veces. P=Q= 50. Los sucesos son equiprobables. (Examen tipo test) ¾ Distribución de

Poison Para estudio de sucesos poco comunes. Cuando n tiende a infinito, y p tiende a cero.

V.A.Discretas

FUNCIÓN DE DISTRIBUCIÓN DE PROBABILIDAD (Fx)

Son distribuciones teóricas que intenta explicar las distribuciones empíricas

Page 32: Metodología

Tema 19. Introducción al conocimiento científico Ione Esquer Terrazas

¾ Conocimiento científico

El conocimiento científico aspira a establecerse en forma de leyes de la mayor generalidad posible. McGuigan dice que el conocimiento científico parte de planteamientos de problemas resolubles y utiliza el método científico. Método científico; procedimiento mediante el cual podemos alcanzar un conocimiento objetivo de la realidad. Característica principal; su replicabilidad. x Fases del método científico

1) Planteamiento del problema; nos preguntamos el porqué de un determinado fenómeno. 2) Formulación de hipótesis; una posible solución al problema. Esta adquiere la forma de hipótesis o conjetura básica.

La hipótesis añade al problema la posible relación que se espera encontrar entre las variables. 3) Validación de la hipótesis; consiste en validar una hipótesis. La palabra verificación implica probar que es verdad, y

esto no es lo que se pretenden al confirmar una hipótesis. Se busca solo determinar que la hipótesis posee cierto grado de probabilidad. Tres momentos; recopilación de datos, reunión de datos y procesamiento de datos.

4) Experimentos exploratorios, cruciales y confirmatorios. Experimento crucial; tipo de experimento en el que se ponen a prueba dos hipótesis alternativas.

5) Generalización de los resultados y planteamiento de nuevos problemas. Grado de generalización; a qué población de elementos podemos aplicar los resultados;

La replicabilidad en el método científico se puede conseguir diferentes estrategias que dan lugar a variantes; Método inductivo. Experiencia como punto de partida. Parte de la observación de la realidad para mediante la

generalización de dicha observación, llegar a la formulación de la ley o regla científica. Método deductivo. Parte de la ley general, a la que se llega mediante la razón y de ella deduce consecuencias lógicas

aplicables a la realidad. Método hipotético-deductivo. Conjunto de pasos, más o menos secuenciados, que se siguen para realizar la

investigación de un problema. Fases; definición del problema, deducción de hipótesis contrastables, establecimiento de un procedimiento de recogida de datos, análisis de los resultados, discusión y conclusiones y elaboración del informe.

¾ Contraste de hipótesis

9 Variable independiente; factor que explica el fenómeno. 9 Variable dependiente; fenómeno explicado.

Confirmación; estrategia de contrastación de hipótesis consistente en la búsqueda de datos que apoyen la hipótesis. Falsación; estrategia de contrastación de hipótesis que consiste en la búsqueda de datos que refuten la hipótesis.

La confirmación y la falsación son las estrategias opuestas para la contrastación. Será la estrategia de la falsación la que nos resulte más útil. Cuando decimos que una teoría científica debe de ser susceptible de refutación, nos referimos al principio de falsación.

¾ Informe de investigación

1) Título; nos da la idea de contenido, normalmente sólo plantea las variables dependientes e independientes. 2) Resumen; 100 palabras sintetiza los puntos fundamentales de un artículo. 3) Introducción; especifica el problema que se estudiar, se revisa la bibliografía experimental, especificará las hipótesis que

se someterán a prueba y las razones que dieron lugar a las predicciones. 4) Método; operaciones realizadas por el experimentador. Suele dividirse en;

Participantes; cuantos sujetos, como se seleccionaron y quienes fueron. Aparato y materiales; equipo, cuestionarios, etc. Procedimiento; explica qué le sucedió a los sujetos, características del diseño estadísticos, etc. Diseño (adicional); si la técnica estadística utilizada es poco común.

5) Resultados; indica lo sucedido en el experimento. 6) Discusión; interpretación de los datos por parte del autor a modo de conclusión. 7) Referencias bibliográficas

- Introducción al conocimiento científico-

Page 33: Metodología

Tema 20. La evidencia empírica Ione Esquer Terrazas

¾ Evidencia empírica

Variables implicadas en la investigación x Variables independientes; son las que el investigador espera que produzcan un determinado efecto. x Variables dependientes; son sobre las que se espera encontrar cambios como consecuencia de la acción de sus respectivas

independientes.

Operativización de las variables; concretarlas hasta un punto en el que se puedan observar y registrar.

¾ Variaciones en los datos La variabilidad de los datos de un experimento se denomina varianza total. La varianza total se descompone en varianzas sistemática y varianza error. x Varianza sistemática; aquella parte de la variabilidad producida por los niveles de la variable independiente y las variables

extrañas no controladas. Primaria; producida por la influencia de la variable independiente. Secundaria; producida por la acción de las variables contaminadoras no controladas.

x Varianza error; es la variabilidad procedente de fuentes aleatorias, que actúa conjuntamente con la variable independiente.

Estas fuentes son fundamentalmente, errores de medida, que afectan a todos los sujetos y se distribuyen aleatoriamente entre ellos.

Kerlinger. Principio estadístico de MAXMINCON; maximizar la varianza sistemática primaria, controlar la varianza

sistemática secundaria y minimizar la varianza de error.

¾ Generalizibilidad de las mediciones x Fiabilidad temporal; valor de correlación entre dos aplicaciones sucesivas. x Fiabilidad interjueces; al menos dos observadores e informar del grado de acuerdo de sus registros. x Validez aparente; se establece cuando una persona examina el instrumento y concluye que éste mide el rasgo de interés. x Validez de contenido; atiende a la representatividad del dominio, y la especificación del dominio o de la relevancia del

contenido. x Validez relativa a un criterio; indica cuál es la eficacia del instrumento en la predicción de algún tipo de comportamiento

futuro del sujeto en situaciones específicas; Validez predictiva; transcurre un periodo de tiempo entre la medición del predictor y del criterio y en ese periodo

se produce algún tipo de intervención en los sujetos. Validez concurrente; implica la recogida de ambos tipos de medidas al mismo tiempo. No se producen cambios ni

en los sujetos ni en las condiciones. Validez postdictiva o retrospectiva; nos permite estimar el grado en que un individuo poseyó un rasgo determinado

en el pasado. x Validez de constructo; se da si el instrumento correlaciona con las variables que la teoría dice que debe correlacionar. Debe

disponer de validez discriminante. No debe correlacionar con las variables que la teoría dice no correlaciona. x Validez discrminativa; la capacidad del instrumento de diferenciar entre grupos que son diferentes. El que con el

instrumento utilizado se ven reflejadas las diferencias de la variable independiente en la variable dependiente.

- La evidencia empírica-

Page 34: Metodología

Tema 21. La observación Ione Esquer Terrazas

¾ Criterios de bondad para el proceso de observación

La observación científica debe ser sistemática. La forma de operativizar las variables del estudio con metodología observacional se realiza a través de la creación de categorías. Medida; Latencia; tiempo desde la presentación del estímulo hasta el inicio de la respuesta. Velocidad; tiempo empelado en realizar una tarea. Ocurrencia; número de veces que ocurre una conducta. Frecuencia; número de respuesta dadas en una unidad de tiempo. Exactitud; corrección/ incorrección. Intensidad; fuerza con la que se da la respuesta.

¾ Técnicas para el estudio de la fiabilidad

El grado de acuerdo entre dos observadores es el medio más usual para el estudio de la fiabilidad. Son fáciles de aplicar para el caso de medidas de ocurrencia y frecuencia. En el caso de medidas de latencia, duración e intensidad se pueden utilizar coeficientes de correlación para variables cuantitativas. Algunos ejemplos de índices numéricos para el cálculo del acuerdo entre observadores; x El porcentaje de acuerdo entre dos observadores es un índice que expresa, en términos de tanto por ciento, las veces en las

que los dos observadores han coincidido en sus observaciones sobre el total de observaciones realizadas. No se tiene en cuenta el azar.

x El coeficiente de Kappa propuesto por Cohen para corregir la dificultad que presenta el porcentaje de acuerdos; corrigiendo la probabilidad de que el acuerdo entre los observadores sea debido al azar.

¾ Validez y fuentes de error en la observación

Validez de contenido; si la selección de conductas recogidas en un código es una muestra representativa del fenómeno que

se pretende observar. Validez de constructo; indica en qué medida un código de observación correlaciona con las variables que establece la teoría

desde la que se formuló el problema. Validez orientada al criterio; establece en qué medida un código detecta las posibles variaciones del fenómeno que se

pretende observar. La reactividad; es un posible sesgo en la observación por parte del observado. Expectativas; el observador tiende a sesgar su percepción a favor de sus expectativas. El medio más sencillo para que no

ocurra es que el observador sea ciego (no conozca la razón por la que está observando).

- La observación-

Page 35: Metodología

Tema 22. Encuestas Ione Esquer Terrazas

Las encuestas nos van a permitir conocer; opiniones, actitudes, creencias, etc. El proceso ha de ser sistemático. Cuando se parte de un censo las conclusiones no son inferencias.

¾ Procedimiento general de una encuesta

a) Población y la unidad muestral;

La población es el conjunto del cual se quiere conocer su opinión. La unidad muestral se refiere a quién va a contestar.

b) Selección y tamaño de la muestra; procuraremos que sea representativa. c) El material para realizar la encuesta; la preparación del cuestionario (el conjunto de preguntas) d) Organización del trabajo de campo e) Tratamiento estadístico; una vez codificadas las respuestas, se procede al análisis estadístico. f) Discusión de los resultados; sólo es posible extraer conclusiones en términos de relaciones, no en términos causales. Se

puede hablar de diferencias pero no de influencias.

¾ Selección y tamaño de la muestra La muestra tiene que ser representativa cumpliendo dos criterios; que las variables que caracterizan a la población estén presentes en la muestra y que el tamaño sea adecuado.

x Representación y sesgo Una muestra representativa es un subconjunto que tiene las mismas características generales que la población. La representatividad de la muestra nos posibilitará generalizar los resultados a la población. Cuando una muestra no es representativa, se dice que es sesgada.

x El tamaño Aunque la muestra sea representativa, ha de tener un cierto tamaño para que quede libre de errores que pueden ocurrir por azar. El tamaño depende de; el tamaño de la población, el estadístico con el que estemos midiendo, la variabilidad de la medida, los márgenes de error de nuestras predicciones y el nivel de seguridad. En las muestras más pequeñas es más fácil encontrar desviaciones de la norma.

x Técnicas de muestreo Procedimientos que nos aseguran que los individuos seleccionados representan a su población. En el muestreo probabilístico se conoce la probabilidad asociada a cada una de las muestras que es posible extraer de una determinada población. En el muestro probabilística se puede estimar el error muestral.

Muestreo aleatorio simple; asegura que cada elemento de la población tiene la misma probabilidad de ser incluido en la muestra. Hay que numerar cada elemento. Poca utilidad si la muestra es grande.

Muestreo aleatorio sistemático; numerar todos los elementos de la población, pero en lugar de extraer n números aleatorios sólo se extrae uno. I, I+K, I +2K.

Muestreo aleatorio estratificado; asegura que los estratos de la población estén representados en la muestra. Seleccionamos aleatoriamente de cada estrato de población el número de elementos que le corresponde.

o Proporcional; mantiene en la muestra las mismas proporciones de los estratos de la población. o Simple; todos los estratos tienen el mismo número de unidades elementales. o Óptimo; los estratos más homogéneos aportan menos casos y los estratos menos homogéneos.

Muestreo por gonglomerados y etapas (polietápica); este muestreo se utiliza cuando se trabaja con una

población grande y no es suficiente determinar un solo nivel de conglomerados. En el muestreo no probabilístico o no aleatorio se desconoce o no se tiene en cuenta la probabilidad asociada a cada una de las muestras posibles. No tenemos información sobre el grado de representatividad de la muestra obtenida. Son menos representativas que las aleatorias;

Muestra accidental; muestra seleccionada por un hecho o un accidente. Obtención de sujetos mediante un anuncio en le periódico (sólo representaría a los que ven la televisión o leen el periódico).

Muestreo o propósito, intencional; los participantes de la muestra cumplen un requisito, por ejemplo; adecuación a los fines de la investigación. El caso más frecuente es utilizar como muestra los individuos a los que se tienen fácil acceso.

Muestra bola de nieve; cuando se entrevista a miembros de un grupo, podemos pedir a las personas que nos indiquen otros individuos en ese grupo que podrían dar información sobre ese tema. Su inconveniente; no obtenemos una idea exacta de la distribución de las opiniones.

- Encuestas-

Page 36: Metodología

Tema 22. Encuestas Ione Esquer Terrazas

Muestreo estratégico; son los propios investigadores a los que eligen las unidades de muestra, de acuerdo con

los objetivos de la investigación.

Muestreo errático; sin ningún tipo de norma. Por ejemplo los reporteros por la calle (sin cuotas ni rutas aleatorias).

¾ Diseños de investigación con encuestas

x Diseño transversal

Describir una población en un momento dado. Las encuestas epidemiológicas son un tipo de encuesta diseñada transversalmente, y que se utiliza para conocer el estado de expansión de una enfermedad.

x Diseño longitudinal Cuando el interés del investigador es observar el cambio en una población. Para esto se han de tomar varias medidas a lo largo de un período de tiempo.

Muestreos sucesivos con grupos de sujetos distintos; se hacen sucesivos estudios transversales. Diseños de panel; cuando son exactamente los mismos individuos los que se entrevistan más de una vez.

Presenta dificultades como la mortandad estadística y la reactividad. Diseños de cohorte; estudia el cambio producido en grupos grandes de sujetos que tienen alguna característica

común muy notoria.

Page 37: Metodología

Tema 23. Etapas en la investigación Ione Esquer Terrazas

¾ Definición de variables

x Variable independiente

El facto que se espera que sea la causa de algo y que es manipulado por los investigadores. Sus valores no dependen de otra variable, sino de voluntad y propósito del investigador. Es la variable que manipulamos para estudiar sus efectos.

x Variable dependiente La conducta que se verá influida por la variable independiente porque sus valores dependerán de los que hayamos elegido para la variable independiente. Los criterios para elegir una variable dependiente son; sensibilidad, validez y fiabildad.

x Variables controladas Toda variable, distinta a la independiente, de la que se tenga fundada sospecha de que pueda influir en la variable dependiente, debe de ser inmediatamente detenida y puesta bajo control.

Constancia de las condiciones; para controlar las variables se pueden eliminar, hacer que todas las posibles variables que el investigador no manipula aparezcan con el mismo nivel.

Grupos equilibrados; se pueden incluir en los grupos del experimento sujetos con distintos niveles en estas variables, pero de forma en todos los grupos haya sujetos de todos los tipos.

x Variable extraña

Cualquier elemento que produzca variaciones en la variable dependiente y que no sea la variable independiente o las variables controladas.

Variables enmascaradas; variable extraña que varía al mismo tiempo que las variables independientes y que influye en la misma dirección sobre la variable dependiente.

Cuando el investigador no controla la variable extraña se produce la confusión o el efecto de confundido. 3 tipos;

x Espuriedad; la variable extraña rompe la relación entre la VI y la VD x Interacción de la VI con la variable moderadora;

V.Extraña sistemática (Variable enmascarada); modulan y median la interacción VI-VD. Interacción irregular; se matiza la posible relación causal por una tercera variable que altera la relación en

determinados niveles de esta tercera variable.

¾ Técnicas de control en la situación experimental de tipo I / Diseños intergrupos En estos diseños se forman grupos a los que se asigna respectivamente distintos tratamientos (a cada grupo uno distinto)

Eliminación. Consiste en suprimir todos los factores considerados variables contaminadores. Dificultad; generalizar los resultados.

Constancia. Asignar a los distintos grupos experimentales valores de la variable extraña matemáticamente iguales (mismo número de mujeres que de hombres).

Balanceo o equiparación. Variante de la constancia que consiste en asignar a cada grupo experimental los valores de las variables contaminadoras en la misma proporción (misma proporción hombres/mujeres).

Fluctuación aleatoria. El experimentador deja fluctuar aleatoriamente las variables contaminadoras, y sus distintos valores, de forma que sus efectos se distribuyan también aleatoriamente entre los grupos experimentales. Neutraliza las variables extrañas desconocidas.

¾ Técnicas de control en la situación experimental de tipo II / Diseños intragrupo

Todos los tratamientos se aplican al mismo grupo de sujetos, con lo que el problema de las diferencias individuales está resuelto. En estos diseños cada sujeto es control de sí mismo. El diseño de medidas repetidas debe utilizarse cuando las diferencias individuales no pueden afectar a la variable estudiada.

x Euiponderación intrasujetos (ABBA) Consigue que el error progresivo se equipondere dentro de cada sujeto. x Equiponderación intersujetos. Cada secuencia es asignada a un sujeto o grupo de sujetos distinto; método ABBA o

contrabalanceo, equiponderación total o contrabalanceo completo, parcial o incompleto y aleatoria total.

¾ Relaciones causales Los experimentos tratan de averiguar si determinadas afirmaciones son correctas (afirmaciones que son relaciones causales tentativas entre variables) Tres son los requisitos para poder establecer relaciones causales;

1) Anteceder. Los valores de la variable independiente se deben producir antes de observar los valores de la variable dependiente.

2) Covariar. Las variaciones en los niveles de la variable dependiente deben coincidir sistemáticamente con los cambios en la variable independiente. Deben variar al mismo tiempo.

3) Descartar causas alternativas. Debemos poder descartar que existe que cambia al tiempo que lo hace la independiente y pudiera explicar los cambios observados.

- Etapas en la investigación-

Page 38: Metodología

Tema 23. Etapas en la investigación Ione Esquer Terrazas

¾ Fuentes especiales de error

x Expectativas del experimentador. Reflejan una cierta influencia del experimentador que lo ha llevado a cabo.

Efecto Rosenthal; expectativas del experimentador. De hecho uno de los problemas que presenta la experimentación en el ámbito clínico es el control de las expectativas del experimentador.

x Pérdidas de sujetos. Se habla de pérdida no aleatoria o sesgo de atrición cuando los sujetos se pierden por alguna razón conectada con la condición a la que han sido asignados.

x Regresión a la media. Tendencia de los datos extremos a volver hacia la media, cuando se repiten las mediciones.

¾ Propiedades que se deben exigir a los experimentos 9 Fiabilidad. Que al repetir el experimento se obtengan los mismos resultados. 9 Sensibilidad. Los experimentos han de ser sensibles a los efectos de los cambios en los niveles de la V. 9 Validez interna. Si podemos asegurar que las diferencias encontradas no se deben a otras causas distintas de la variable

independiente. Es el grado de seguridad con el que podemos establecer la causa de las variaciones. 9 Validez externa. El poder de generalización de los resultados obtenidos. La validez externa puede verse afectada por el

nivel de operativización de las variables, la selección de los niveles de la variable independiente y la actitud de los sujetos. o Validez ecológica; las conductas de los sujetos pueden no llegar a tener nada que ver con los contextos naturales, a

pesar de que en la mente del investigador exista un isomorfismo estructural o lógico entre las tareas de laboratorio y las cotidianas (interacción entre el contexto y el tratamiento).

Page 39: Metodología

Ione Esquer. Diseños

INVESTIGACIÓN CIENTÍFICA EN PSICOLOGÍA

Fases del método científico

1. Identificación y formulación del problema. Ato; relación entre dos o más conceptos.

2. Formulación de la hipótesis o solución tentativa. Hipótesis; anticipación de una ley explicativa del problema. Plantea posible relación entre variables. x Cientifica; adecuada,

consistente y compatible. x Estadística; exclusivas y

exhaustivas. Nula H0. Si se rechaza, el

error debe de ser pequeño. Error tipo I.

Alternativa H1. Se acepta si se rechaza H0.

3. Recopilación o recogida de datos. x Si se observa en el marco

natural; correlaciones, diferenciales y observacionales.

x Si se interviene; experimental.

4. Análisis de los datos y contraste de los resultados con la hipótesis usando técnicas estadísticas.

5. Conclusiones y generalización de los resultados.

Tipos de métodos

Atendiendo al modo de recopilación de datos

Observacionales o correlaciónales .No se altera su naturaleza. Contigüidad temporal de la VI-VD.

Experimentales; se provocan los fenómenos

Atendiendo al modo de inferir conclusiones

Deductivos; conclusiones derivadas de las premisas válidas. De lo general a lo particular.

Inductivos; conclusiones con cierta probabilidad de ser verdaderas. De lo particular a lo general.

Hipotético-deductivo; ofrecer hipótesis explicativas de los fenómenos y confirmarlas

Atendiendo al grado de manipulación

Método experimental; manipulación VI (intencional) Aleatorización. Método cuasiexperimental; manipulación VI (selección) No

aleatorización. Método no experimental; no manipulación VI y no aleatorización.

Atendiendo al grado de control

Método experimental; control de la VI, y anulación de V.Extrañas. Método cuasiexperimental; se controlan los niveles de la VI. Pero no las varia.extrañas. Método comparado o comperativo; 2 tipos; correlaciones y comparativos.

Método no experimental; método correlacional o diferencial, y método natural u observacional. Control minimino; Serendipity (observación casual).

Diseños de investigación

Método transversal (una única ocasión) o método longitudinal (varias ocasiones)

El informe de investigación

A. Marco conceptual Introducción- justificación / objetivos de la investigación / revisión de aportaciones previas e hipótesis.

B. Marco metodológico Variables implicadas / método / población muestra / instrumentos / recogida de datos.

C. Resultados D. Discusión y conclusiones

Ppos del diseño experimental

Aleatorización Asignación al azar a las observaciones de todas las variables no controladas.

Replicación del experimento Repetir cada observación y repetir el experimento.

Bloqueo Variable q. se introduce dentro del experimento produciendo un efecto sobre la VD q.no es de interés.

x Variables de confundido; enmascaran o distorsionan el efecto q. produce la VI sobre la VD.

x Sensibilidad de la investigación; determinar la p.del efecto, si el efecto del tratamiento (VI) puede detectarse mediante una prueba estadística.

9 Validez teórica. Problemas y soluciones derivadas de teorías bien establecidas.

9 Validez interna. Garantiza que los cambios producidos en la VD se deben solo a la VI.

9 Validez externa. Grado de confianza con que una relación entre VD y VI es representativa y puede generalizarse a otros o contextos o poblaciones.

9 Validez conclusión estadística. Potencia del contraste y tamaño del efecto.

9 Validez de constructo. Relación entre VI (causa) y VD (efecto). Inferencias q. se hacen acerca de fenómenos no observables. Amenazas; falta definición construc. teóricos.

Validez de la experimentación

Page 40: Metodología

Ione Esquer. Diseños

Variabilidad del conjunto de datos de un experimento que es producida por todos los factores que han influido sobre los datos. ¾ Varianza sistemática. Primaria o intergrupo; influida por la VI . Hay que maximizarla. Secundaria; variables contaminadoras o extrañas; controlarlas. ¾ Varianza error. Intragrupo. Fuentes aleatorias. Hay que minimizarla.

Principio de Kerlinger MAXimizar la varianza primaria, MINimizar varianza de error y CONtrolar la varianza secundaria.

x Maximizar varianza primaria o intergrupo. Mejor para incrementar efecto de VI; valores intermedios. x Minimización de la varianza de error. Instrumentos de medida, diferencias individuales, instrucciones, experimentador e incremento tamaño grupo. x Control de la varianza sistemática secundaria. Se produce por potenciales fuentes de variación extrañas al experimento. Variables de sujeto, apsectos

ambientales y procedimientos experimentales.

Validez externa. Grado de confianza con que se pueden generalizar los resultados o las conclusiones. Mejor si la muestra es representativa.

Varianza total

EL DISEÑO EXPERIMENTAL

Validez de diseño Campbell y Stanley

Validez de constructo. Grado de confianza con que podemos establecer generalizaciones a constructos de orden superior. Cuanto mayor rigor (validez interna) menor generalización (validez externa). Se recomienda primar la validez interna sobre la externa.

Amenazas

Validez interna. Influencia de la VI sobre la VD. Minimizar la varianza sistemática secundaria, mediante el control riguroso de las variables extrañas.

Validez de conclusión estadística . Cook y Campbell. Grado de significación estadística de la relación entre VD y la VD Error tipo I (alfa) Afirmar que hay relación cuando no la hay. Nivel significación. Rechazo H0 (nula) cuando es verdadera. Nivel de confianza. Probabilidad de acertar cuando no se rechaza Ho que es cierta ( 1 – alfa). Error tipo II. No detectar una relación que si existe. (b, beta) Aceptar H0 (nula) cuando es falsa. Potencia. Capacidad para detectar una relación entre variables. (1-b) Tamaño del efecto. Depende de la intensidad de la relación.

Sesgos en comparaciones pre –post (intrasujetos) Asociadas al tiempo; efecto de la historia y de la maduración. Asociados a la medición; instrumentación y administración. Asociados a la selección; regresión estadística y mortandad experimental.

Sesgos en comparaciones de grupo (Intersujetos) Selección diferencial, interacciones con selección y ambigüedad de la dirección causa efecto.

Representatividad de la muestra de sujeto (mejor si muestreo aleatorio) representatividad de los valores /niveles de la VI y efectos reactivos

Sesgos de reactividad; ante la observación. La adivinación de hipótesis; Efecto Hawthorne; sesgo del sujeto por sentirse observado. Situacion experimental. Efecto Rosenthal; conseguir datos que confirmen sus hipótesis.

Amenazas

Amenazas

Page 41: Metodología

Ione Esquer. Diseños

LAS VARIABLES y EL CONTROL EXPERIMENTAL

Tipos de variables

Variables en el experimento

Toda experimentación estudia VI, y VD.

x Constructo Ψ; conductas cuantificables asociadas a conceptos teóricos.

x Variable Ψ; constructo Ψ q. puede ser medido.

Clasificación de las variables

Independientes; experimental, la q.se manipula

Dependiente; en la que se observan los cambios. La que se mide.

Extraña; variable no controlad Relevantes; tienen efecto.relevante

sobre la VD Asignadas; no se elijen aleatoriament.

(personalidad) Activas; se puede asignar

aleatoriamente.

¾ Clasificación de variables de McGuigan; estimulos, respuesta, organismica y entermediarias.

¾ Clasificación devariables de Underwood; ambientales, instruccionales, tarea y suj.

Según el nivel de medida Cualitativas; nominal, ordinal

politomica (estadio enfermedad) ordinal dicotómica (vivo-fallecido).

Cuantitativa; continua (altura) discreta (nº hijos).

Intervención sobre la variable…

Dependiente ¾ Según el número de VD. Univariados; una conducta o VD. Multivariados; más de una VD. ¾ Indicadores estandarizados de medida. McGuigan; ocurrencia, exactitud, latencia, velocidad, frecuencia, habilidad e

intensidad. ¾ Criterios para medir la VD. Los índices deben de poseer; validez (mide lo que tiene que medir), fiabilidad (grado en el

que mide) y sensibilidad ante la VI (capacidad de detectar variaciones. Efecto techo; valor por encima del cual VD modifica su valor. Efecto suelo; por debajo del cual no cambio su valor).

Independiente ¾ Según el número de variables.Unifactorial; si se empela una sola variable. Factorial; influencia de 2 o más variables. ¾ Seleccionar y definir las variables independientes. Se tendrán que operativizar, hay que asignarles contenidos

cuantificables. ¾ Manipulación de la variable independiente. Asignación de los valores de la variable, determinando tanto el número

de valores, como la naturaleza de dichos valores.

Extrañas ¾ Variables extrañas. A la hora de actuar sobre las VI se habla de manipulación, cuando se tratan las variables extrañas el término es control (eliminándolo o manteniéndolo constante).

¾ Fuentes de contaminación; los sujetos del experimento, el experimentador (Efecto rosenthal; influencia del experimentador sobre el estudio) el material, el ambiente, el error progresivo debido a la fatiga o la práctica.

¾ Técnicas de control experimental. Son a priori (las de control estadístico son a posteriori) Tipo I ; intergrupo x Eliminación; eliminar los valores de la variable contaminadora, menos una. x Aleatorización; si N es grande, con variables extrañas desconocidas. Dejar al azar la fluctuación. x Constancia; asignar valores de la variable extraña matemáticamente iguales. x Balanceo o equiparación. Asignar valores de las variables contaminadoras en la misma proporción.

Tipor II; Intragrupo x Métodos de equiponderación o contrabalanceo. Distribución equitativa de la cuantia de error progresivo. Para

controlar los efectos de orden. (Intrasujetos; se controla en cada individuo, Intersujetos; en el grupo). Asociados al diseño experimental x Bloqueo de variables relevantes; neutralizar una variable contaminadora (variable bloqueo) formando grupos

homogéneos de suj, en función de alguna variable relevante. x Apareamiento o emparejamiento; variante de la anterior, pero cada bloqueo lo forman únicamente aquellos

suj. q han obtenido la = puntuación en la variable de apareamiento. x Técnicas de simple y doble ciego; Simple ciego, sujetos desconocen todo (adivinación hipótesis; amenaza

validez constructo) Doble ciego; los investigadores y sujetos desconocen el proposito (efec.rosenthal).

Page 42: Metodología

Tema 24. Diseños experimentales con grupos de sujetos distintos Ione Esquer Terrazas

Un diseño experimental es un plan, estructura o estrategia que se adopta para el estudio preciso de un fenómeno psicológico. O’Neil; es un modelo particular de variación y constancia.

¾ Diseño de grupos aleatorios

Si los sujetos son asignados al azar a cada uno de los grupos. La asignación aleatoria no consigue cambiar la representatividad de los participantes pero consigue controlar, por equilibrado, las variables extrañas que están presentes en los sujetos. Además permite una buena generalización de los resultados y una ayuda a la validez interna.

Grupo experimental (GE); aquel al que se aplica el tratamiento. Grupo control (GC); es el grupo cuyo comportamiento nos sirve como punto de referencia, como línea base.

¾ Diseños de grupos aleatorios con bloques

Estos diseños están indicados cuando la asignación aleatoria puede no ser suficiente para asegurar que las variables extrañas estén controladas mediante el equilibrado. Uso cuando los grupos son pequeños.

x El caso de varios sujetos por nivel y bloque. Medir a los sujetos en la variable extraña a controlar, realizar agrupaciones de sujetos (bloques) con similares valores en la variable extraña (la que se bloquea) y asignar al azar a los sujetos de cada bloque a cada uno de los grupos del experimento. A esta técnica de control para conseguir grupo emparejados se la conoce con el nombre de bloqueo. Es más efectiva en grupos pequeños.

x El caso de un sujeto por nivel y bloque. Puede darse el caso en que en cada bloque solo haya tantos sujetos como condiciones en el experimento.

x El caso de la camada. Una pareja de gemelos forman el bloque natural más perfecto de la naturaleza El caso de gemelos sería un ejemplo de Grupos equiparados, caso especial de diseños por bloque. Los sujetos no son similares, sino que son idénticos. En este caso, la VB, se llama variable de apareo o de equiparación. Cada bloque está formado por sujetos con identifica puntuación en la variable apareada.

¾ Diseño Solomon

Finalidad; subsanar los problemas de validez interna. El resultado es una mejora en la validez externa sin renunciar a la validez interna. Se utiliza en metodología experimental cuando se quiere controlar el efecto de la medida pre tratamiento. Tiene como finalidad controlar explícitamente la interacción de la medida pre tratamiento con la VI.

¾ Diseños especiales

x Control por placebo. Para controlarlo en lugar de pretender eliminarlo hacemos que aparezca en el grupo experimental y en el control. Es un grupo que no recibe tratamiento pero que se opera con él como si lo recibiese.

Efecto nocebo; hace referencia a las reacciones adversas asociadas con sustancias inertes. Los efectos psicológicos negativos que pueden acompañar a tratamiento medicamentosos serían un efecto nocebo.

x Caso de doble ciego.

Diseño ciego; es aquel en el que los sujetos no saben si su condición es la de tratamiento o es la placebo. Diseño doble ciego; es aquel en el que el experimentador tampoco conoce qué condición está administrando a

los sujetos.

¾ Asignación de grupos frente a asignación de sujetos Se asignarán a las condiciones experimentales grupos enteros de sujetos que ya estaban creados antes de que interviniera el experimentador.

- Diseños experimentales con grupos de sujetos distintos-

Page 43: Metodología

Tema 25. Diseños experimentales con los mismos sujetos Ione Esquer Terrazas

En los diseños de replicación intrasujetos el muestro de las unidades de tiempo que van a servir para tomar las observaciones o registros es un problema básico, pues una selección errónea puede desvirtuar los resultados.

¾ Efectos distorsionantes en los diseños intra-sujeto

a) Para ser controlados antes de realizar el experimento

Los siguientes efectos son variables extrañas que amenazan la validez interna; Efecto del aprendizaje Efecto de la fatiga; el rendimiento puede disminuir por efecto del cansancio Error progresivo; producido por el aprendizaje y fatiga de los sujetos Efecto de la motivación

b) Para ser controlados durante la realización del experimento

Efecto de la práctica o efecto del orden de aplicación La forma de controlar esta variable es hacer que todos los niveles de la variable independiente aparezcan presentados en todos los órdenes posibles. No es el orden el que produce el efecto sino la cantidad de práctica que se lleva hecha antes de una presentación determinada.

Efecto de persistencia No podemos asegurar que cuando se aplica un nivel de la variable se haya extinguido por completo el efecto del nivel aplicado anteriormente. Cuando sospechamos que los efectos de un tratamiento persistente a lo largo del tiempo, debemos establecer períodos de extinción entre un tratamiento y el siguiente, y debemos estudiar su influencia.

¾ Técnicas de control del efecto de la práctica en los diseños intra-sujeto

x Control mediante aleatorización

Se puede utilizar una aleatorización simple del orden de presentación de los niveles de la variable independiente. La estrategia de aleatorización por bloques se utiliza cuando la lista de tareas experimentales a aplicar es corta.

x Reequilibrado. Esta técnica repite los tratamientos experimentales de tal forma que primero se presentan en un orden y

después en el inverso. Hablamos de diseños intra-sujeto completos cuando el investigador aplica la secuencia ABBA a todos los sujetos, el

control del orden de presentación se hace para cada sujeto. Hablamos de diseños intra-sujetos incompletos cuando los tratamientos se aplican en un orden AB a un grupo y en el

otro orden BA al otro, el control del orden se hace para el conjunto de la muestra.

x Diseño de cuadro latino. Los diseño s de cuadrad latino nos permite el control, establecer la cuantía del efecto de la práctica y eliminarlo en el análisis.

- Diseños experimentales con los mismos sujetos-

Page 44: Metodología

Tema 26. Diseños factoriales Ione Esquer Terrazas

¾ Características de los diseños factoriales

Diseños factoriales; cuando se estudian simultáneamente dos o más variables independientes y cuando los niveles de las variables independientes se presentan combinados. La ventaja esencial de un diseño factorial sobre uno que no lo sea es la posibilidad de examinar la interacción. Unifactorial; cuando se estudia una única VI.

9 Si el diseño alcanza a todos los niveles de todas las variables se dice que es un diseño factorial completo. 9 Si una variable tuviera 4 niveles y la otra 5, la forma de representar su combinación factorial sería 4X5. Dando lugar a 20

tratamientos o condiciones experimentales.

Se considera que el modelo es equilibrado (balanceado) cuando el número de observaciones para cada nivel del facto es siempre el mismo. Efectos simples a los resultados producidos desde el punto de vista de la primera variable independiente condicionados por los niveles de la segunda variables.

a) Si son paralelos; no hay interacción entre las variables independientes al actuar con la variable dependiente. Hay paralelismo si las rectas tienen la misma pendiente. Las líneas son paralelas cuando los perfiles de las líneas quebradas son iguales.

b) Si no son paralelas las líneas hay interacción entre las variables independientes al actuar sobre la dependiente. Diremos que hay un efecto de interacción.

En la interacción ordinal las líneas están unas encima de las otras, sin juntarse. En la interacción no ordinal, las líneas se juntan al cruzarse.

Si no existe interacción debemos proceder a continuar el estudio de los efectos principales. Si existe relación, debemos detenernos en su estudio y no sacar conclusiones sobre los efectos principales. El efecto principal de la variable independiente es el efecto que produce una variable independiente sobre la dependiente, evaluado a través de los promedios en sus niveles.

¾ Casos especiales de interacción Aquellos en los que, tanto gráfica como numéricamente, aparece interacción y sin embargo no es posible explicarla teóricamente. Estas interacciones se han producido por restricciones en el rango de medida de la VD.

x Efecto techo; se producen resultados con apariencia de interacción, cuando en uno de los niveles se alcanza el máximo y no es posible registrar niveles superiores.

x Efecto suelo; se producen resultados con apariencia de interacción, cuando en uno de los niveles se alcanza el mínimo y no es posible registrar niveles inferiores.

- Diseños factoriales-

Page 45: Metodología

Tema 27. Diseños experimentales de caso único Ione Esquer Terrazas

9 Es una aproximación centrada en el individuo. Supone que si un fenómeno es lo suficientemente básico se tendrá que

producir de forma similar en el resto de los individuos. 9 Describe de forma detallada las características de un individuo en condiciones especiales. 9 Normalmente se realiza sin controles 9 No permite establecer relaciones ni generalizaciones. 9 Uso adecuado cuando la investigación es sobre procesos muy básicos o con clara base biológica. 9 Su nivel de generalizaciones bajo.

¾ Características de los diseños experimentales de N=1

Para poder contrastar un hipótesis causal ha de cumplirse; que anteceda, que covarien y que sean descartadas otras explicaciones. Si se cumplen estas condiciones se pueden establecer relaciones de causalidad. x Fases en la experimentación de caso único

1) Establecer la línea base; el conjunto de observaciones dentro de una condición se denomina serie. La serie registrada

antes de la intervención se denomina línea base. Se considera la línea base como la tasa de respuestas antes de la aplicación del tratamiento.

2) Aplicar la intervención; puede ser puntual, uniforme o gradual.

3) Interpretar los resultados; además del criterio de significación estadística, se defiende la existencia de la; Significación clínica; donde es el terapeuta el que decide cuando el cambio es relevante. Significación subjetiva; donde es el cliente el que transmite cuales son las expectativas que harán que su

conducta se considere aceptable. Significación social; donde el patrón para evaluar el cambio se establece con arreglo a lo que se admite que es

el comportamiento de los sujetos normales

¾ Tipos de diseño de caso único x Diseño AB

Se designa con la letra A a las fases sin tratamiento y la letra B a las fases con tratamiento. Si hay una variable enmascarada. No lo podemos comprobar. Al experimento le faltará validez interna.

x Diseño ABAB Los diseños BAB y ABA se pueden considerar como aplicaciones parciales del ABAB.

El caso BAB se puede dar en situaciones en las que es necesario una intervención inmediata sin poder esperar a establecer una línea base.

El caso ABA es menos frecuente porque el diseño acaba en una fase sin tratamiento. Estos diseños se denominan de vuelta atrás, retirada o inversión debido a que después de una fase de tratamiento se vuelve a la situación interior. Nos permiten conocer la influencia de variables enmascaradas.

x Diseños de línea base múltiple Se consideran una extensión de los diseños A porque solventan el problema de la imposibilidad de la vuelta atrás. Se pueden utilizar cuando se dan las siguientes características;

9 Independencia de las conductas seleccionadas 9 Similar sensibilidad de las conductas seleccionadas. Ambas serán receptivas de igual forma al tratamiento.

Tres tipos de diseño;

Varios registros del mismo individuo en diferentes condiciones Diferentes variables del mismo individuo en una sola condición Varios individuos observados en la misma variable y condición.

¾ Validez y limitaciones de los diseños de N=1

x Validez interna. Depende de la correcta aplicación del método; del control que permita asignar los cambios de la variable

dependeinte a la independiente. Interacción sujeto x tratamiento; un sujeto particular puede reaccionar de una forma especial al tipo de tratamiento que le estén aplicando.

x Validez externa. Se ve amenazada ya que una sola persona no conforma una muestra representativa. A pesar de esto podemos decir que el sujeto del experimento suele representar bastante bien a los sujetos con el mismo síndrome. Los diseños N=1 no están indicados cuando es factible aplicar diseño de grupos o cuando la variabilidad de la conducta en la línea base es muy grande, cuando se necesite un informa sobre la eficacia con el objeto de utilizarlo de forma generalizada en instituciones y cuando hay que hacer estudios comparativos sobre la eficacia.

- Diseños experimentales de caso único-

Page 46: Metodología

Tema 28. Diseños cuasi-experimentales Ione Esquer Terrazas

9 Los diseños cuasiexperimentales aparecen como una solución de compromiso dentro de los conflictos entre la validez

interna y validez externa. 9 Estos diseños tienen una gran semejanza con los experimentales pero tienen dificultades para alcanzar las condiciones

necesarias para el establecimiento de una relación causal entre las variables independientes y dependiente. 9 Diremos que hay experimentación verdadera cuando el experimentador no puede asignar los sujetos al azar a cada una

de las condiciones experimentales y/o los niveles de la variable independiente no son condiciones manipuladas por el investigador, sino que son características que poseen los sujetos antes de comenzar la investigación.

9 Los análogos clínicos son por tanto propios de la investigación cuasi experimental.

¾ Diseño pre-post

x Diseño pre-post con un solo grupo. Presenta grandes amenazas a la validez. x Diseño pre-post con grupo de cuasi control. Se introduce en la investigación a un grupo control. El grupo control se

considera no equivalente. x Diseño pre-post con cuasi control en una segunda variable dependiente. La lógica de este diseño es similar a la lógica del

diseño con un solo sujeto de línea base múltiple. Ambos diseños se basan en que si un tratamiento puede modificar dos conductas, al aplicar a una sí y a la otra no, podemos esperar que una cambie y la otra no lo haga.

x Diseño pre-post con cuasi control en una cohorte anterior. (o ciclo institucional) El grupo control lo debe formar una cohorte determinada.

x Diseños con observaciones solo post. Grupo de sujetos ya era superior antes de aplicarle el tratamiento. La amenaza está en la selección.

¾ Diseños de serie temporal interrumpida

x Diseño simple de serie temporal interrumpida. Siguen la misma lógica de los diseños experimentales con un sujeto,

aplicada a grupos de sujetos. Se dispone de una serie de puntuaciones de un grupo de sujetos a lo largo de una serie de momentos y en algún momento se introduce un tratamiento. Si el tratamiento es efectivo son de esperar signos de interrupción en la serie, y por tanto, cambios de la fase pre a la fase post.

x Diseño de serie temporal interrumpida con grupo de cuasi control. Mejor respecto al anterior ya que nos permite tener mayor certeza de que los cambios habidos entre el pretest y el postest son debidos a nuestro tratamiento y no a ninguna otra variable.

x Diseño de serie temporal interrumpida con un grupo y dos variables dependientes. Sigue el mismo esquema que el diseño pre-post con cuasi control en una segunda variable dependiente. Gana en control al poder estudiar la estabilidad de la conducta de los sujetos tiempo antes de la intervención y tiempo después.

¾ Diseño de discontinuidad en la regresión

Hacemos una división en los sujetos en dos subgrupos atendiendo a las puntuaciones pre. A este estudio de las diferencias de pronósticos en el retorno al punto de clasificación se le denomina análisis de la discontinuidad en la regresión.

¾ Valoración de programas Actividad profesional que consiste en la sistemática investigación del mérito, valor o éxito de concretos tratamientos, intervenciones o programas llevados a cabo con el fin de producir cambios comportamentales en el contexto social.

¾ Validez

x Validez interna Campbell, Stanley y Cook, señalan que en los diseños cuasi experimentales aparecen amenazas potenciales a la

validez interna como son; el efecto de la historia del sujeto, la maduración, la adaptación de los sujetos a las pruebas, la instrumentación, la regresión a la media, la selección de las muestras en función de sus características con respecto a la variable independiente, pérdidas no aleatorias de sujetos o mortalidad selectiva.

El transcurso del tiempo puede hacer que los instrumentos utilizados en las diferentes mediciones de la variable dependiente no sean exactamente los mismos.

El efecto de la regresión a la media era más probable que ocurriera cuando se seleccionaba a los sujetos por puntuaciones extremas en alguna variable.

La pérdida no aleatoria de sujetos aumenta su probabilidad en investigaciones cuasiexperimentales.

x Validez externa Para garantizar la validez externa además de tener en cuenta la artificialidad de la situación experimental es

conveniente maximizar la representatividad de la muestra. El efecto de la muestra es uno de los factores que disminuyen la validez externa en los diseños cuasiexperimentales.

x Causación y cuasi experimentos

Los diseños experimentales tienen un mayor grado de seguridad de la existencia del nexo causal.

- Diseños cuasi-experimentales-

Page 47: Metodología

Tema 29. Diseños ex post facto Ione Esquer Terrazas

Diseños ex post facto

a) Hablamos de diseños ex post facto retrospectivos cuando el investigador se encuentra con que ya ha ocurrido el proceso

causal (causas y sus consecuencias). En este caso el investigador sólo puede trata de reconstruir los hechos. b) Hablamos de diseños ex post factor prospectivos en situaciones en las que la expresión ex post factor se aplica sólo a las

variables independientes. En este caso las causas están en marcha, pero todavía no ha habido desenlace.

¾ Diseños ex post facto retrospectivos Esta estrategia consiste en medir la variable dependiente y después buscar hacia atrás posibles explicaciones de la misma, es decir, medimos las posibles variables independientes. x Diseño retrospectivo simple. Sólo podemos tratar de reconstruir lo acontecido. Sólo se pueden observar coincidencias y el

diseño es muy débil para poder descartar otras explicaciones.

x Diseño retrospectivo con grupo cuasi control. En este diseño se localizad un grupo de personas, grupo calve, que poseen el mismo valor en la variable que queremos investigar (variable dependiente). A continuación, localizamos a un grupo de personas, grupo cuasi control, que no posean ese valor en la variable dependiente, pero que sea lo más parecido posible al grupo clave en todas aquellas variables que al investigador le interesa controlar.

x Diseño retrospectivo de grupo único. En este diseño se miden la variable dependiente y las potenciales variables independientes en un único grupo procurando que este sea lo más representativo posible de la población bajo estudio. En este diseño la variable dependiente toma más de un único valor.

¾ Diseños ex post factor prospectivos

Las variables independientes ya han tomado sus valores pero está todavía pendiente en desenlace del fenómeno que al investigador le interesa estudiar, la variable dependiente. Ahora empezamos buscando a personas que se parezcan entre sí por poseer determinados valores de la variable independiente. A continuación, estudiaremos esas personas en cuanto a su comportamiento en relación a la variable dependiente. x Diseño prospectivo simple. Los investigadores no manipulan la variable independiente sino que seleccionan sujetos en

función de sus características relativas a dicha variables. Si los grupos son pequeños, la representatividad se ve limitada. El alta la probabilidad de que se dé un sesgo de selección.

x Diseño prospectivo factorial. En este diseño se estudia el influjo de dos o más variables independientes sobre una dependiente.

x Diseño prospectivo de grupo único. En este diseño mediremos a muchos sujetos de tal forma que todos los valores posibles de las variables independientes están bien representadas en la muestra.

x Diseño prospectivo con más de un eslabón causal. Necesitamos contar con un modelo teórico que determine claramente qué posibles relaciones, directas e indirectas, se espera encontrar entre las variables independientes y la dependiente.

¾ El método clínico y los diseños evolutivos

x Método clínico. Las hipótesis que se contrastan en estas investigaciones suelen ser de tipo evolutivo, es decir, postulan la

edad como causante de cambios. x Los diseños evolutivos. Todo aquel diseño en el que la edad es considerada como variable independiente

Diseño evolutivo transversal; las comparaciones respecto a la edad se realizan en el mismo momento temporal, mediante grupos de sujetos distintos. Varias muestras de sujetos. La misma estructura que el diseño prospectivo. Posible sesgo de selección.

Diseño evolutivo longitudinal; permite estudiar los efectos de la edad dentro de un esquema intra-sujeto controlado las diferencias individuales. La misma muestra de sujetos a través de todas las edades con medidas repetidas.

9 Efecto cohorte; los sujetos se comportarían de forma distinta ante la tarea experimental dependiendo del año en el que hubieran nacido y no tanto por la edad que tuvieran. Los resultados basados en una generación pueden no aplicarse a niños nacidos en otra época.

Diseño evolutivo secuéncialo time lag; se utiliza para estudiar el efecto de cohorte junto con el de edad. Consiste en

estudiar longitudinalmente varias cohortes. Se puede considerar un prospectivo complejo. Schaie distingue entre secuenciales de cohorte, secuenciales de tiempo y secuenciales-transversales.

- Diseños ex post facto

Page 48: Metodología

Tema 29. Diseños ex post facto Ione Esquer Terrazas

¾ Validez en los diseños ex post facto

Tipo Modalidad Ventajas Problemas

Retrospectivo

Simple

x Único posible en algunos casos

No covariación No antecesión VI, VD No descarta; sesgo retrospectivo, posibles

enmascaramientos

Con cuasi control

x Covariación x Restringe sesgo

retrospectivo

No antecesión VI, VD Riesgo menor, pero no descarta; sesgo

retrospectivo, posibles enmascaramientos Dificultad de encontrar sujetos emparejables

Grupo único

x Covariación x Restringe sesgo

retrospectivo x Mayor validez externa

No antecesión VI, VD Riesgo menor, pero no descarga; sesgo

retrospectivo, posibles enmascaramientos Dificultad de encontrar muestra grande y adecuada

Prospectivo

Simple

x Diferencias x Antecesión VI, VD x Elimina sesgo retrospectivo x Acoplable a experimento

Baja validez externa No descarta sesgo de selección

Factorial

x Diferencias x Antecesión VI, VD x Elimina sesgo retrospectivo x Acoplable a experimento

Baja validez externa Riesgo menor, pero no descarta sesgo de selección Difícil con más de dos VIs

Grupo único

x Covariación x Predicción sujeto a sujeto x Antecesión VI, VD x Elimina sesgo retrospectivo x Mayor validez externa x Muchas VIs

Riesgo menor, pero no descarta enmascaramiento Dificultad de encontrar muestra grande y adecuada Relaciones entre las Vis

Más de un

eslabón causal

x Covariación; efectos directos e indirectos

x Antecesión VI, VD en cadena x Elimina sesgo retrospectivo x Mayor validez externa x Contrasta todo el modelo

Riesgo menor pero no descarta enmascaramiento Dificultad de encontrar muestra grande y adecuada Exige modelo teórico previo

Page 49: Metodología

Tema 30. Clasificación de diseño y amenazas a la validez Ione Esquer Terrazas

¾ Clasificación de diseños por grado de control y tipo de manipulación

x En función del grado de control tendríamos

Experimental. Podríamos hablar claramente de una causalidad. Comparativo o comparado (también llamado correlacional) No podríamos hablar de causalidad;

9 Correlacional; no diferencia VI de VD, se estudia si dos variables van en la misma dirección. No causalidad. 9 Propiamente comparativo; diferencia VI de VD. No se puede hablar de causalidad pura. Sino de cuasi

causalidad. Observacional y de encuestas. Diseño de control mínimo, no se puede hablar de causalidad.

9 Observacional, natural o descriptivo; observación sistemática, intención previa de observar y registrar. x Serendipity; observación no científica pero que da lugar a investigación.

x En función del grado de manipulación de las variables tendríamos

Experimental. Manipulación intencional y aleatorización de las variables independientes. Permite la asignación

aleatoria de valores a sujetos. La técnica de aleatorización es una condición imprescindible para poder aplicar pruebas de significación.

Cuasi-experimental; manipulación de selección o asignación, sin aleatorización de las Vis. Nos permite seleccionar la VI y los valores de la VI. Pero al no poder hacer la asignación aleatoria de valores a sujetos, ya no podemos hablar de causalidad. (Ej; población de sujetos con depresión) El método experimental y el método correlacional se diferenciarían en el grado de manipulación de las variables.

No experimental; el investigador no cambia las variables.

¾ Amenazas a la validez interna, externa y de constructo x Validez interna; supone la influencia inequívoca de la VI sobre la VD. Los factores que la amenazan son según Anguera;

9 Sesgos en comparaciones pre-post (intrasujetos)

a) Cambios que afectan a los sujetos entre sesión y sesión. Sobre todo en investigaciones longitudinales;

Historia; factores externos. Acontecimientos ajenos a las variables experimentales que pueden producirse durante la realización del experimento.

Maduración; factores internos.

b) En la medición; Instrumentación; errores de medida. Cambios en el calibrado o cambios en los observadores. Administración de test o medida reactiva; con nuestros tests y preguntas estamos realizando una

manipulación que puede tener efectos sobre esos sujetos, y lo asociamos a la VI cuando en realidad está asociado con nuestras medidas.

c) En la selección; Regresión estadística; regresión a la media. Fenómeno asociado a medidas sucesivas. Ocurre cuando

se seleccionan a los grupos en función de las puntuaciones extremas en una variable. Mortandad o mortalidad experimental o selectiva; desaparición, por cualquier por cualquier tipo de

causa, de los sujetos.

9 Sesgos en comparaciones de grupos (intersujetos)

Selección diferencial; tenemos sujetos con características muy diferentes. Interacción con selección; cualquiera de los fenómenos anteriores pueden afectar diferencialmente a un grupo

con respecto al otro. Ambigüedad en la dirección causa efecto; efecto producido cuando la procedencia de la causa no es clara.

x Validez externa

Generalización de las conclusiones, está ligada a la representatividad de los elementos integrados en el experimento. Tipos; 8 De la muestra a la población; validez de población. 8 De las condiciones de investigación a la reales; validez ecológica. 8 A lo largo del tiempo, a otros momentos históricos; validez histórica.

Factores que la amenazan;

Representatividad de la muestra de los sujetos; (v.población); este requisito solo se puede cumplir con un muestreo aleatorio.

Representatividad de los valores/niveles de la VI. Efectos reactivos de;

9 Medidas pretratamiento y tratamientos sucesivos; 9 Artificialidad de la situación experimental (v.ecológica).

- Clasificación de diseño y amenazas a la validez-

Page 50: Metodología

Tema 30. Clasificación de diseño y amenazas a la validez Ione Esquer Terrazas

x Validez de constructo Es necesaria una correcta definición operativa de las variables y el control de los sesgos de reactividad en las unidades de medida de la respuesta. Factores que la amenazan;

Operacionalización de los constructos; fallos a la hora de definir.

9 Sub-representación; no se captan todas las dimensiones que teóricamente incorpora el constructo. 9 Irrelevancias sobre añadidas al constructo; los indicadores incluyen aspectos no relevantes para el

constructo.

Sesgos de reactividad; 9 Interacción entre tratamientos múltiples. 9 Efectos reactivos situacionales. 9 Adivinación de hipótesis.

o Efecto Hawthorne; los sujetos adivinan la hipótesis e intentan demostrarla. Para evitarla, doble ciego. 9 Artefactos del sujeto; que no se comporta de forma natural.

o Efecto Orne; o características de la demanda. Adopción de diferentes roles por parte del sujeto. 9 Artefactos del experimentador. Ej; Rosenthal. Para evitarlo; doble ciego.

Page 51: Metodología

Ione Esquer. Diseños

Unifactoriales intragrupo

DISEÑOS EXPERIMENTALES (1)

Unifactoriales intergrupo

1. Diseños de grupos aleatorios x Dos grupos aleatorios. Se contrasta efecto

de una VI con 2 niveles (uno de los niveles es cero o ausencia tratamiento) sobre una VD.

x Diseño multigrupo. Tres o más valores de la VI. Asignacion aleatoria

x Diseño Solomon. Controlar la interacción de la medida pretratamiento con la VI (controlar el efecto). 4 grupos; 2 experimentales y 2 control.

2. Diseños de bloques.

Muestras pequeñas. Bloques creados a partir de un criterio previo (la variable de bloqueo). x Diseños de bloques aleatorios. Una variable

de bloqueo. x Diseños de grupos apareados. La variable de

bloqueo hace de variable de apareamiento. 2bloques = con las = puntuaciones.

x Diseños de cuadrado.Se bloquean más de una variable a la vez; Cuadrado latino. 3 factores; el

tratamiento y 2 v.bloqueo.

Cuadrado grecolatino. 4 fac; tratamiento y 3 v.bloqueo.

La desigualdad entre los grupos desaparece, pero aparece el error progresivo, porque es un solo grupo.

x Diseños intragrupo bivalentes. 2 condiciones a todos los sujetos de un mismo grupo. Alta v.interna, la externa no es muy solida.

x Diseños intragrupo multivalentes. 4 o más condiciones experimentales

Diseños jerarquicos o

anidados

Dos niveles de tratamiento.

Se aplica el 1º a tres muestras y el 2º a otras tres.

Se consigue que el factor grupo quede dentro del tratamiento.

Características de los dice.facto.intergrupos

El investigador divide a la muestra en tantos grupos como tratamientos tenga el experimento, asignando un tratamiento a cada uno de estos grupos. 22, dos factores de dos niveles.

Varianza intergrupo; influencia de los tratamientos experimentales.

Varianza intragrupo; mejor estimación del error experimental.

Técnicas para reducir el tamaño de los diseños factoriales

Aumento nº de factores, aumento tb de grupos de tratamiento. Técnicas para obtener bloques mas pequeños;

x Técnica de confusión. Suprimir interacciones de poca importancia.

x Técnica de replicación fraccionada. Una fracción del diseño completo.

x Diseño de parcela dividida. Se sacrifica el efecto principal.

x Diseño de bloques incompletos. x Diseños de cuadrado Youden;

dice.bloques+cuadrado latino

Diseños factoriales de grupos independientes (Intergrupos / Tipo I)

Cuando las diferencias individuales no pueden afectar a la variable estudiada.

x Diseños bifactoriales de medidas repetidas. El análisis de los datos consiste en un análisis de la varianza.

x Diseño bifactorial mixto.

Dos variables; una entre y otra intra. Los т niveles de la primera variable, se asignan de manera aleatoria entre los тgrupos de sujetos; mientras q.los niveles de la segunda variable, se aplican a todos los suj.

Diseños factoriales de medidas repetidas (Intragrupos / Tipo II)

DISEÑOS FACTORIALES

Dos o más factores (VI’s) Diseño completo/ cruzado (tantos grupos como posibilidades de formalos) vs incompleto / anidado ( jerarquico). Efecto de las interacciones. Factor= VI. Las categorías en las que se dividen los factores; niveles.

9 2x3. 2 VI’s . Una con 2 otras con 3 niveles. 6 tratamientos.

9 2x3x2. 3 VI’s. Una con 2, otra con 3 y otra con 2 niveles. 12 tratamientos.

Page 52: Metodología

Ione Esquer. Diseños

DISEÑOS EXPERIMENTALES (2)

Diseños de caso único N=1

Validez interna (relaciones VI-tratamiento y la VD-cambios en los síntomas). Procedimiento; establecimiento de línea base (tasa de R antes del tratamiento) ,introducción tratamiento y registro de la VD. Se pueden establecer relaciones de causalidad. Nivel generalización bajo.

ÆPatrones de cambio. Cambios de nivel (discontinuidad) o de tendencia (cambio en la pendiente).

ÆClasificación

1. Intraseries. Cambios a través de las series. x Modelo básico (1 componente).

AB o de fase simple. A; línea base. B; tratamiento. o ABA de retirada; línea base- tratamiento

– retirada tratamiento. Cambio de criterio (DCC) La fase de

tratamiento se divide en subfases que van cambiando, a medida que el nivel de R se ajusta a un criterio previo establecido.

De revisión de 3 y 4 fases. x Complejas.

De tratamiento o componente múltiple. Interactivo.

2. Entreseries. Comparación 2 o más conjuntos de datos. x Tratamientos alternativos. Aplicación de

tratamiento alternando en periodos igual de tiempo.

x Tratamientos simultáneos. Comparación de tratamientos aplicados simultáneamente a lo largo del tiempo.

3. Series combinadas. x Diseños de línea base múltiple. 2 conductas/

pacientes/ contextos independientes entre sí. Equivalentes en sensibilidad al tratamiento. Líneas bases de varias conductas susceptibles de ser modificadas con el mismo tratamiento.

Para favorecer la efectividad. Los sujetos no se asignan aleatoriamente. En situaciones naturales. Mayor validez externa que los experimentales y menor validez interna. Las variables son de selección o atributos. Ausencia de un verdadero grupo control. Cook y Campbell; ausencia de pretest y ausencia de grupo control. Clasficación; 1. Diseños de grupo pre-postest. Medida pre y post tratamiento. Asignacion no aleatoria.

x Variable de asignación no conocida (grupos naturales ya formados antes de empezar la investigación )

Sin grupo control pre-post; con un solo grupo Con grupo control no equivalente De cohorte. Seguimiento de una o más cohortes de individuos sanos que

presenta diferentes grados de exposición a un factor de riesgo en quienes se mide la aparición de la enfermedad o condición en estudio

Ex post facto; retrospectivos (solo post) y proespectivos (longitudinal). Tanto VI como VD toman sus valores antes de que intervenga el investigador. No se manipula la VI, se espera que acontezca de manera natural.

x Variable de asignación conocida. Diseño de discontinuidad de la regresión. Sujetos asignados a la condición

control o tratamiento en función de las puntuaciones en la medida pretratamiento.

2. Diseños de series temporales interrumpidas. Múltiples medidas previas y múltiples medidas posteriores.

1. Diseño de comparación estática con pretest y postest. Se sustituye grupo control x 1experimental. Probar q. los resultados son superiores

2. Diseño de comparación estática con doble pretest. Mejorar el control de variables extrañas. 3. Diseños de comparación estática con varios grupos de control. Mejor validez interna, control

historia. 4. Diseño de comparación estática con varios grupos de tratamiento. тintensidad del tratamiento. 5. Diseño de comparación estática con tratamiento intercambiado. Combinación varios diseños. 6. Diseños de comparación estática con tratamiento invertido. Dos tratamientos т,1 inverso del otro. 7. Diseño de comparación estática con replicaciones múltiples. Muestras grandes. Retirada

tratamiento. 8. Diseños de comparación estática con VD no equivalentes. 2VD ,A y B. Se esperan cambios en A, no

en B. 9. Diseños de cohortes. Cohorte; grupo q. experimentan 1determinado suceso en un = periodo de

tiempo. 10. Diseño de cohortes con tratamiento dividido. Tres variables; intenso, débil y no tratamiento.

DISEÑOS CUASIEXPERIMENTALES

No se manipula la VI solo se mide la VD. Clasificación x Según objetivos; estatus

(descripción) e investigación (descubrir relaciones).

x Otros; descriptivos (obtener información) y analíticas (finalidad explicativas).

Diseños 1. Transversales. 1 vez y periodo corto.

Encuestas epidemiológicas. 2. Longitudinales. Cambio con el paso

de tiempo. x Brutos (niveles individuos).

Encuestas de panel. La misma muestra a lo largo del tiempo. Es entrevistados más de una vez.

x Netos (Agregados). Encuestas longitudinales de

población o de series temporales. Cambio en el conjunto de una población en el tiempo.

Diseños de cohorte longitudinal- secuencial. Combinan estrategia longi y transv.

Encuestas longitudinales retrospectivas. Relación entre un fenómeno A presente en el momento de la encuesta y algún suceso B anterior.

DISEÑOS NO EXPERIMENTALES

Encuestas

Page 53: Metodología

Tema 31. Introducción a la teoría y principios de construcción de test Ione Esquer Terrazas

¾ Introducción

Un test es un instrumento de medición, diseñado para inferir una medida de las capacidades de los sujetos a través de las respuestas que dan en ese test. Las aportaciones de Galton, Pearson, Binet y Spearman, constituyen los tres pilares básicos que han soportado a las teorías de los tests psicométricos.

a) Galton. Idea de medir las diferencias individuales a través de métodos objetivos. Binet. Primer test de inteligencia, introdujo el concepto de edad mental. Stern. Cociente de inteligencia.

b) Spearman. Teoría clásica de los tests. Las puntuaciones obtenidas por los sujetos en los test hay que interpretarlas en relación a su grupo normativo. Pionero en el desarrollo de los métodos conocidos como Análisis factorial.

c) Rasch y Lord. Impulsores de la Teoría del Rasgo Latente. Instrumentos de medida del nivel que poseen los individuos en los rasgos psíquicos y que son latentes al no ser directamente observables para su medición. La estimación del nivel del rasgo que pretende medir el test sólo está en relación con la forma matemática que tenga la curva característica de cada ítem, expresada en forma probabilística.

¾ Puntuaciones

x Asignación de puntuaciones. Las formas más usuales de otorgar puntuaciones son los;

Ítem dicotómico; sólo admite dos respuestas que a su vez son excluyentes. 0= respuesta incorrecta. 1= respuesta correcta.

Respuestas alternativas; entre las que solamente una de ellas es la respuesta.

x Test de velocidad. Aquel en el que se procura que los ítems sean de muy escasa dificultad y la ejecución del test suele realizarse en un tiempo limitado y definido previamente.

x Test puro de fondo. La aportación de la no respuesta a la varianza total es nula y la varianza error observada se debe a la varianza de las puntuaciones observada en los sujetos en relación con sus respectivos números de errores.

¾ Distribución de las puntuaciones en los tests

x Distribución normal. La media, mediana y la moda coinciden, las frecuencias se distribuyen simétricamente con respecto a

los valores de la variable. Una mayor o menor desviación típica indica que la curva estará más o menos apuntada.

x Distribución uniforme o rectangular. Una línea recta paralela al eje X de las puntuaciones, donde se puede considerar que todos los valores son modales, o bien, que no hay moda. Si la distribución de una aptitud es rectangular, la probabilidad de encontrar sujetos con altos niveles de aptitud es la misma que la encontrar sujetos con bajos niveles.

x Distribuciones asimétricas. Una distribución será más asimétrica cuanto mayor sea la diferencia entre la media y la mediana. Está desviada negativamente si tiene demasiados ítems fáciles por lo que la mayor parte de los individuos obtienen altas puntuaciones.

x Distribución multimodal. Las distribuciones que presentan varios máximos o valores modales, incluso con distintas frecuencias, sugiere que la población es heterogénea con grupos bien diferenciados.

- Introducción a la teoría y principios de construcción de test-

Page 54: Metodología

Tema 32. Teoría clásica de los test Ione Esquer Terrazas

¾ Hipótesis del modelo lineal de Spearman

Las hipótesis básicas son las del modelo aditivo lineal, donde la variable dependiente es la puntuación observada en las pruebas y la variable independiente corresponde con las puntuaciones verdaderas de los sujetos.

Puntuación observada; variable dependiente. Puntuación verdadera; variable independiente.

x Hipótesis

1) Hipótesis fundamental; cualquier puntuación observada X es función de dos componentes, que son la puntuación

verdadera V del sujeto y el error e. X=V +e 2) Hipótesis de nulidad de los errores; los errores, en media, se anulan. La media aritmética de los errores es cero (su

esperanza matemática es cero) E (e)= 0 3) No existe correlación entre las puntuaciones verdaderas y el error en una misma prueba. 4) No existe correlación entre los errores. 5) No existe correlación entre las puntuaciones verdaderas y los errores en formas distintas de un mismo test o en tests

diferentes.

x Relaciones e índices estadísticos deducidos como consecuencia de la verificación de las hipótesis

1) El valor esperado de la puntuación verdadera es igual al valor esperado de la puntuación observada. Las medias de las puntuaciones observadas y las verdaderas coinciden. E(V) = E(X).

2) La ecuación de regresión de la puntuación observada sobre la puntuación verdadera es la ecuación de una línea recta que pasa por el origen y que tiene pendiente unidad.

3) La varianza de las puntuaciones observadas es igual a la suma de la varianza de las puntuaciones verdaderas más la varianza de los errores.

4) La covarianza entre las puntuaciones empíricas y verdaderas es igual a la varianza de las puntuaciones verdaderas. 5) El cuadrado del coeficiente de correlación lineal entre las puntuaciones observadas y sus correspondientes

verdaderas. Se suele conocer como coeficiente de determinación y va a ser útil en el establecimiento de la fiabilidad de la prueba.

6) La varianza de las puntuaciones verdaderas es igual a la varianza de las puntuaciones observadas menos la varianza de los errores.

x Condiciones

Diremos que dos conjuntos de puntuaciones, sean estas X y X’; son medidas paralelas si se cumplen las condiciones; 9 Ambas tienen la misma puntuación verdadera. 9 Ambas poseen la misma varianza error.

Relaciones derivadas de las condiciones de paralelismo;

1) Las medidas aritméticas de las puntuaciones observadas en medidas paralelas coinciden. 2) Las varianzas de las puntuaciones observadas en dos variables X y X’ son iguales, cuando se trata de medidas

paralelas. 3) La varianza de la puntuación verdadera es equivalente a la covarianza entre dos puntuaciones observadas que sean

paralelas. 4) Las intercorrelaciones entre formas paralelas de un test son todas iguales. 5) La varianza de las puntuaciones verdaderas es igual o menor que la de las observadas. 6) La exigencia de paralelismo entre medidas nos permite el hacer uso de las ventajas de los modelos homocedásticos,

ya que la igualdad de varianzas entre los errores es una condición necesaria para el paralelismos. 9 Si las medidas y varianzas de las puntuaciones son iguales aceptaremos el paralelismo. 9 Si se da la igualdad de las varianzas y no la de las medias, es necesario recurrir a un contraste formal de hipótesis. 9 Si se obtiene empíricamente la igualdad entre las medias de las medidas supuestamente paralelas y no la de las

varianzas, se procede al contraste a través del estadístico muestral F de Snedecor. 9 Si las puntuaciones obtenidas no coinciden ni en los valores de las medias ni los de las varianzas, entonces se procederá

al contraste de hipótesis de las diferencias para ambos estadísticos en las formas indicadas.

x Significado psicométrico de los índices Puntuación verdadera; la variable asociada al inobservable psíquico, o rasgo, acerca del que se pretende hacer

inferencias. La puntuación verdadera del sujeto tiene que ser inferida mediante procedimientos estadísticos. Error estándar o error típico de medida; desviación típica de la variable error asociada con el modelo general. X=V+e Coeficiente de fiabilidad; coeficiente de correlación entre medidas paralelas. Equivale a la correlación del test consigo

mismo, a la correlación entre las puntuaciones del test. Índice de fiabilidad; coeficiente de correlación lineal entres las puntuaciones observadas y verdaderas. Varianza error; cualquier condición que provoque diferencias entre las puntuaciones de una prueba que sean irrelevantes

para su propósito se refleja en la varianza error. El grado en que las diferencias entre puntuaciones se deben a la variable que queremos medir y no a otras, pone en evidencia la relación que existe entre fiabilidad y varianza de error.

- Teoría clásica de los test-

Page 55: Metodología

Ione Esquer. Psicometria

¾ Fechner. Elementos de psicofísica. Analizar reacciones percibidas entre los estímulos.

¾ Weber;тpercibidas aumentan de forma proporcional a la intensidad del E.

¾ Fechner; sensación percibida crece mediante тconstantes y el E.fisico se incrementa de manera proporcional.

¾ Francis Galton. Fundador de la meto.psicometrica.

¾ Pearson; principios de correlación y regresión.

¾ Spearman; inteligencia general g, factor especifico s.

9 Test normativos o referidos a la norma (TRN). Se evalúan los suj. con referencia a las conductas de otro grupo. Situar a cada suj. en relación a otros suj. de la =población.

9 Test de dominio o referidos al criterio (TRC). Estudio en un nivel o grado de ejecución del suj, sobre un dominio o criterio definido previamente.

Tres teorías

1. Tª clásica de los test. Spearman.

2. Tª de la generalizabilidad. Cronbach.

3. Tª de la respuesta al ítem. Lord y Novick.

INTRODUCCIÓN y TEORÍAS

Explica el comportamiento de un suj. en un test recurriendo a su grupo normativo. Modelo lineal clásico.

Supuestos básicos

La puntuación empírica (X) = puntuación verdadera (V) + error de medida del sujeto (E). La distribución de los errores es normal. Media cero, varianza constante. La puntuación V es la esperanza matemática de la empírica.

Medidas paralelas

Para calcular el coeficiente de determinación (en qué medida las puntuaciones de un test proporcionan la puntuación real) –> medida paralela. Se divide en dos grupos iguales el número de ítems de un test, aplicándose cada conjunto de ítems por separado a la misma muestra. Son paralelas si tienen la misma varianza.

Medidas equivalentes o tau-equivalentes

Paralelas; igual puntuación verdadera y misma varianza de errores.

Estrictamente tau-equivalentes; igual puntuación verdadera y diferente varianza de errores.

Esencialmente tau-equivalentes; puntuación verdadera difiere y diferente varianza de errores.

Congenéricas; puntuación verdadera transformación lineal de otra y diferentes varianza de error.

La puntuación

Tipos de puntuación atendiendo a los ítems

x Ítems dicotómicos ; si/no. x Respuestas alternativas; (solo 1correcta,

se penaliza. x Ítems de producción ; elaborar

respuestas propias.

Tipos de puntuación atendiendo al tiempo

x Test de velocidad ;tiempo límite. x Test de fondo ;no hay tiempo límite. x Valoración del tiempo del test ; No

correctas= erróneas + blancas. Índice de velocidad de Gulliksen o Stafford y Lord y Novick.

Formas de distribución de las puntuaciones

Distribución normal. Media, moda y mediana coinciden. Muchas preguntas de dificultad media.

Distribución uniforme o regular. Ítems q. no discriminan correctamente. Línea recta.

Distribuciones asimétricas. Sesgo a la drcha (demasiado ítems de difíciles, asimétrica positiva, X > Md) sesgo a la izq (ítems muy fáciles, asimetría negativa, X < Md)

Distribuciones modales. 2grupos; a uno le resulta muy fácil y a otro muy difícil.

Curtosis Leptocúrtica > 0. Mesocurtica = 0. Platicurtica < 0.

La aptitud La distribución de la aptitud la entendemos como una distribución probabilística.

Tª Clásica de los test. Spearman

Permite estimar la fiabilidad en sitauciones en las que intervienen multiples fuentes de error. Modelos que mejor permite estimar las fuentes de error.

Conceptos fundamentales

El obj de esta teoría; determinar las т fuentes de error existentes en el proceso de medición.

Una medida (x)= es una muestra de observaciones admisibles o posibles.

Faceta; Cada características es una faceta. Manifestaciones de una faceta se denomina condición.

El concepto de fiabilidad se sustituye por el de generalizabilidad.

Tipos de estudio

x Estudios G o generalizabilidad. Estudiar las propiedades del test.

x Estudios D o de decisión. Tomar decisión practica basada en los datos del instrumento.

Optimización de un diseño

Aumentar el número de condiciones de una faceta.

Tª de la generalizabilidad. Cronbach

Page 56: Metodología

Tema 33. Fiabilidad Ione Esquer Terrazas

¾ Concepto de fiabilidad

9 Por fiabilidad de un test se entiende la precisión, consistencia y estabilidad de las medidas obtenidas de este test. 9 Si el instrumento de medida es preciso, medidas repetidas serán semejantes y, salvo errores accidentales, se dará la

constancia en las medidas. 9 La constancia o estabilidad de las puntuaciones se evalúa mediante un coeficiente de correlación lineal entre dos series

de puntuaciones. x La Fiabilidad de un test se define como la variación relativa de la puntuación verdadera con respecto a la puntuación

observada, calculada a través de la razón entre las respectivas varianzas.

x La relación ox2 es por definición la medida de la fiabilidad. El coeficiente de fiabilidad no indica en qué medida el test está libre de error (precisión del test). El coeficiente de fiabilidad es el coeficiente de determinación o proporción de la variación de X explicada por V. Es decir; en qué medida las puntuaciones de un test (X) recogen puntuaciones reales (V) en la variable X. Su valor se encuentra entre 0 (X=e) y 1 (X=V).

x Al coeficiente de correlación rXX se le denomina Índice de fiabilidad. El índice de fiabilidad será, para un mismo test, siempre mayor que el coeficiente, pues aquel es el resultado de la raíz cuadrada del coeficiente de fiabilidad.

9 La fiabilidad perfecta se identifica con el valor rxx= 1, y supone teóricamente que, no existe varianza error y que toda la varianza de la puntuación observada se debe a la puntuación verdadera. ov2=ox2

9 Por tanto un test es fiable si está libre de errores de medida. Así mismo, cuando los errores de medida son pequeños, se dice que el test es fiable.

9 Cuando la correlación entres las puntuaciones empíricas y los errores de medida es máxima, la fiabilidad del test es nula.

¾ Formas usuales de obtención de medidas repetidas x Test-retest

Diseño que nos lleva a una medida de la estabilidad de las puntuaciones. Las puntuaciones repetidas X y X’ se obtienen aplicando el mismo test a los mismos individuos y en las mismas condiciones en dos ocasiones diferentes en el tiempo, por ello nos muestra el grado en que las puntuaciones son independientes de factores dependientes de la situación, ya sean internos o externos.

Se recomienda el uso para hallar la fiabilidad de los test de velocidad. Un posible problema de este diseño es el efecto de aprendizaje del sujeto. Para paliar este efecto se procura dejar

transcurrir un tiempo suficiente entre ambas aplicaciones de la prueba.

x Formas paralelas de un test Aplicar a los sujetos dos tests construidos de forma que resulten ser prácticamente iguales. Trata de la equivalencia de las formas de un test. Algunos autores se refieren a esta forma como coeficiente de

equivalencia. Cuando se aplican ambas formas paralelas en momentos temporales distintos proporciona una estimación de la

estabilidad de las puntuaciones. Las respuestas pueden estar contaminadas por un efecto fatiga en los sujetos. Multiplica el esfuerzo en el proceso de construcción y selección de ítems.

x División en dos mitades

Se ponen en relación las puntuaciones entre dos partes del mismo test, actuando ambas como si fuesen dos formas paralelas.

Este diseño nos indicará la consistencia interna de la prueba. No sería conveniente el realizar una división arbitraria en dos mitades. Otra medida de la consistencia interna nos la daría la covarianza de los ítems, que calcula la relación que tienen entre sí

todos los ítems.

¾ Formulas de Rulon y de Guttman Si para la obtención de las medidas repetidas se utiliza el procediemitno de las dos mitades (en el caso particular de la consideración de elementos pares e impares) las fórmulas deducidas por Rulon y Flanagan y Guttman nos proporcionan dos formas de cálculo del coeficiente de fiabilidad.

Formula de Rulon. El coeficiente de valor uno, corresponde al valor máximo para la fiabilidad. Fórmula de Flanagan y Guttman. Se deriva directamente de la dada por Rulon.

- Fiabilidad-

Page 57: Metodología

Tema 34. Fiabilidad y la homogeneidad de los grupos y la longitud del test Ione Esquer Terrazas

¾ Fiabilidad en relación con la homogeneidad del grupo

Un test no dispone de una sola fiabilidad. Existen variaciones entre las posibles muestras que se pueden extraer de la

población con objeto de inferirla. La fiabilidad de un test aumente a medida que aumenta la varianza de las puntuaciones muestrales en dicho test. Cuando aumenta la variabilidad de la muestra, aumenta también el coeficiente de fiabilidad, por el contrario, cuanto más

homogénea sea una muestra menor será el coeficiente de fiabilidad.

¾ Fiabilidad y longitud en tests compuestos La longitud de un test viene dada por el número de elementos o de ítems que lo componen y se puede comprobar que, la

fiabilidad del test aumenta si se aumenta su longitud mediante la adición de elementos paralelos a los datos. También varía su error típico.

La ecuación que expresa la relación entre la fiabilidad y la longitud de un test es la denominada ecuación de Spearman-Brown.

A mayor longitud se obtiene mayor fiabilidad, pero la ganancia en fiabilidad no es proporcional al número de elementos añadidos. El crecimiento es más rápido en valores pequeños de k (mayores que 1).

Los tests escasamente fiable deben ser despreciados en su forma original y no trata de mejorarlos aumentando su fiabilidad por adicción de elementos paralelos.

x Cálculo del tamaño de un test para un nivel de fiabilidad prefijado. Utilizando la ecuación Spearman-Brown.

x Fiabilidad, longitud y varianza. Cuando se construye un test de longitud doble la varianza de las puntuaciones verdaderas

crece más que la varianza de las observadas.

- Fiabilidad y la homogeneidad de los grupos y la longitud del test-

Page 58: Metodología

Tema 35. La fiabilidad como índice de consistencia interna Ione Esquer Terrazas

Si al utilizar el método de las dos mitades en el cálculo del coeficiente de fiabilidad, la correlación se establece entre las puntuaciones de todos los individuos en cada uno de los ítems de una parte, con los correspondientes de la otra, la fiabilidad será un indicador de la consistencia interna de los elementos del test.

¾ Coeficiente alfa de Cronbach y las ecuaciones de Kuder-Richardson

El coeficiente alfa es una fórmula general para el cálculo de la fiabilidad como índice de la consistencia interna de las

puntuaciones. Este coeficiente nos indica el grado en que covarían los ítems del test y aumenta al aumentar la covarianza entre los ítems

del test. Richardson y Kuder desarrollan las ecuaciones, KR20 y KR21.

9 KR20 es una versión destinada a aquellos casos en los que cada una de las componentes Xi del test sea un ítem y que ese ítem sea un ítem dicotómico. Si en lugar de tomar para cada ítem sus parámetros pi y qi se utiliza para todos el índe promedio de dificultad. 9 KR21; los ítems tienen que ser dicotómicos y con el mismo índice de dificultad.

La relación entre KR20 y KR21 la da la desigualdad; KR20 t KR21. La igualdad se dará solamente en el caso en que todos los ítems ténganla misma dificultad.

¾ El alfa como cota inferior de la fiabilidad en tests compuestos

El coeficiente de fiabilidad calculado por cualquier procedimiento entre medidas paralelas es mayor que el calculado

mediante alfa. La correlación entre dos mitades aleatorias de un test es menor que el coeficiente de fiabilidad del test.

¾ Las formulas de Rulon, Guttman y Hoyt como casos particulares del coeficiente alfa

Para la obtención de las fórmulas de Rulon, y Flanagan y Guttman se realiza una división de la totalidad del test en dos

partes, que se corresponden con elementos que ocupan el lugar par y aquellos que ocupan el lugar impar. Estas fórmulas se pueden considerar casos particulares del coeficiente de alfa, cuando el test está compuesto por dos

componentes (conjunto de ítems pares y conjunto de ítems impares).

9 Fórmula de Hoyt; en esta ecuación se manifiesta expresamente la dependencia que el coeficiente alfa tiene con el número de elementos del test y las covarianzas.

- La fiabilidad como índice de consistencia interna-

Page 59: Metodología

Tema 36. Inferencias acerca de las puntuaciones Ione Esquer Terrazas

¾ Estimación y predicción de la puntuación verdadera a partir de las puntuaciones empíricas

Utilizaremos la regresión para estimar la puntuación verdadera V a través de las puntuaciones X.

¾ Errores de medida, de estimación y de predicción.

x Error de medida. Viene dado por la diferencia entre la puntuación observada y la verdadera. E = X-V

x Error típico de medida. La desviación típica de la distribución de la variable.

x Error de estimación. Viene dado por la diferencia entre su puntuación verdadera y la estimada por regresión.

x Error de predicción. Se obtiene como diferencia entre la puntuación verdadera estimada para el sujeto y la observada directamente en una segunda medida paralela.

x Error de sustitución. Es el error que se comete al sustituir una forma paralela por otra.

¾ Intervalo de confianza para la puntuación verdadera Un intervalo de confianza para la puntuación verdadera se puede dar si se conoce la distribución de los errores. A medida que la fiabilidad aumenta, la amplitud del intervalo requerido para que quede comprendida la puntuación verdadera de un test disminuye.

- Inferencias acerca de las puntuaciones-

Esquema –Cálculo del coeficiente de fiablidad- Cada procedimiento puede dar valores diferentes.

x Dos aplicaciones;

Formas paralelas o equivalentes (coeficiente de equivalencia);

aplicación simultánea de X y X’. Desventajas; fatiga y construcción de dos pruebas.

Test-retest (coeficiente de estabilidad); X-lapso tiempo- X. Desventajas; aprendizaje y evolución de la persona.

Test-retest con formas alternativas; x-lapso de tiempo- X’.

x Consistencia interna; 2 mitades

o Paralelas; Spearman- Brown o Equivalentes; Rulon o Guttman-Flanagan o Congenéricas; Rajú

Covarianza entre ítems

o Coeficiente alfa de Cronbach o Küder-Richardson (ítems dicotómicos) o Gutman o Rajú

Page 60: Metodología

Ione Esquer. Psicometria

FIABILIDAD

¾ Método test-retest

Consiste en administrar el =test en 2ocasiones т pero en condiciones idénticas. La varianza error; azar de una aplicación a otro, o el suj. Desventaja; aprendizaje. Uso para test de velocidad. Estabilidad temporal.

Método de test-restest con formas alternativas Se divide el grupo en 2, aplicando primero el test X y luego el test X’. Con el segundo subgrupo se hace lo = pero a la inversa. Fiabilidad como estabilidad y equivalencia.

¾ Método de las formas paralelas o alternativas (fiabilidad de la forma equivalente)

Administración sucesiva a una muestra de sujetos, de dos formas equivalentes del mismo test. El 2ºtest no es el mismo ,pero mide lo mismo. Equivalencia de contenido. ¾ Método de la división del test en 2mitades

Un =test en una 1única ocasión a un =grupo de suj. y luego se divide el test en 2mitades (pares e impares). Consistencia interna. Spearman-Brown (paralelas) , Rulon (tau equivalentes) Guttman- Flanagan (esencialmente tau equivalentes)

¾ Métodos basados en la covarianza de los ítems

Al menos son tau equivalentes. Se basa en la consistencia de las respuestas del suj. a todos los elementos del test.

Coeficiente ь de Cronbach. Ítems no dicotómicos. Consistencia interna. Grado en que covarían los ítems.

Coeficiente de Küder- Richardson. Ítems dicotómicos. KR20; dicotómicos. KR21; dico. y =índice de dificultad.

Coeficiente de Hoyt o coef.correlación interclase. Test con varios ítems = diseño experimental intragrupo

Concepto y factores que influyen

Fiabilidad ;precisión. Consistencia de las puntuaciones obtenidas x los mismos sujetos, cuando son examinados con el mismo test. Diferencia entre varianza verdadera y la varianza de error.

¾ Coeficiente de fiabilidad. Correlación existente entre las puntuaciones obtenidas x los suj. en 2medidas paralelas de un test. Estabilidad de la medida. Test consigo mismo. Entre 0 y 1.

¾ Índice de fiabilidad. Es la raíz cuadrada el coef.de fiabilidad y se define como el coef.de correlación entre las puntuaciones observadas y las verdaderas. (Índice siempre mayor q. el coef).

¾ Error típico de medida. Medida

indirecta de la fiabilidad (a menor error mayor fiabilidad).

Homogeneidad de la muestra. Al aumentar la variabilidad de la muestra, aumenta tb el coef. de fiabilidad. A menor variabilidad u heterogeneidad en una muestra, menor será el coef. de fiabilidad.

Longitud del test. Si aumentamos la longitud de un test el coef. de fiabilidad aumentara. Si se añaden elementos; varia el error típico.

Longitud y varianza. Al duplicar la longitud de un test, aumentamos la fiabilidad.

Razón señal-ruido .Cuanto mayor sea el coef. más información verdadera del test.

Métodos de estimación del coeficiente de fiabilidad Estimar la cantidad de error que afecta a las puntuaciones empíricas. Podemos estimar la puntuación verdadera a partir de medidas paralelas; o mediante los intervalos de confianza o la ecuación de regresión. ( y = a (pendiente)x + b (ordenada)

x Error de medida. Diferencia entre puntuación observada (x)y la medida (v). Es función de desviación típica del test.

x Error de estimación. Diferencia entre su puntuación verdadera y la estimada por la regresión.

x Error de predicción. Diferencia entre la puntuación verdadera estimada por un suj, y la obtenida en una medida paralela.

x Error de sustitución. Se comete al sustituir una forma paralela por otra.

Estimación de la puntuación

verdadera

¾ Índice de dificultad de los elementos (media de aciertos) nº de suj. q responden bien ,y nºtotal que lo han intentado resolver. Heterogeneo = 0,5./ 1= fácil. Si es alto; índice de homogeneidad alto.

¾ Índice de discriminación. Si тa suj. q puntúan alto, y los q puntúan bajo. Correlación de ese ítem con el test. Correlación biserial(continua dicotomizada) y correlación tetracórica (dicotómicas artificialmente)

¾ Índices de fiabilidad y validez.

Análisis de ítems

TRN; clasificar suj. TRC; evaluar grado de control del suj en una variable (master y no master).

Fiabilidad basadas en formas paralelas (2veces); COeficiente po y coeficiente kappa (acuerdo entre jueces, nominal).

Fiablidad basada en una única aplicación. Subkoviac, Huynh, Livingston y Brennan y Kane.

Selección del punto de corte.Q separe a los que controlan de los que no . Decidido por jueces.

Test referidos a la norma y

al criterio

Page 61: Metodología

Tema 37. Teoría de la generalizabilidad de la aptitud Ione Esquer Terrazas

¾ Teoría generalizada de la aptitud o generalizabitliy

Cronbach. Dio la denominación de generalizabitiy. No permite considerar a un instrumento como bueno si su coeficiente de

fiabilidad es alto, pues las decisiones las basa en los resultados del análisis de las fuentes y tipos de error. La técnica de análisis es la del análisis de varianza. El error ahora se puede atribuir a diferentes factores, pudiéndose estimar cuanta variabilidad proviene de cada una de las

fuentes de error controlables. Atribuye el concepto de error a múltiples factores de influencia que llaman facetas; designar cada uno de las características

de la situación de medición que pueden modificarse de una ocasión a otra, y por tanto, hacer variar los resultados obtenidos.

Permite estimar la fiabilidad en situaciones en las que intervienen múltiples fuentes de error o variabilidad de las puntuaciones.

Faceta de diferenciación; es la que se espera sea fuente fundamental de las variaciones observadas en las puntuaciones. Se conoce como varianza verdadera.

Faceta de generalización; son fuentes de error, factores de variación. La variación asociada a estas fuentes sería varianza de error.

Thorndike. Clasifica las variabilidades en cinco categorías; a) Duraderas y general del individuo; variaciones de aptitud. b) Duraderas pero específicas; factores como el conocimiento o ignorancia sobre un ítem. c) Temporales y generales; confianza, fatiga. d) Temporales y específicas; éxito en un determinado conjunto de ítems. e) Otras.

Conceptos y características generales de la teoría

A través de las puntuaciones obtenidas en los test pretendemos tomar una decisión acerca de dónde puede ser clasificado un individuo en algún sentido, y hacer comparaciones entre sujetos a través del conocimiento de sus diferencias individuales.

9 G-estudio; recoge los datos. Es el estudio que se lleva a cabo para analizar las condiciones de medición, con las fuentes de variabilidad de interés. Se determinan las facetas del diseño.

9 D-estudio; reúne datos con el propósito de tomar decisiones o extraer conclusiones. Se toman decisiones en base a los datos proporcionados por el instrumento de medida.

- Teoría de la generalizabilidad de la aptitud-

Page 62: Metodología

Tema 38. Validez Ione Esquer Terrazas

Concepto de validez

9 La validez del test se refiere a qué es lo que el test mide y cómo lo mide. 9 Un test es válido si cumple su objetivo de realizar bien la medida de aquello para lo que se construyó. 9 Por validez también se entiende el grado en que mide o predice algún criterio de interés. 9 Un test es válido cuando las correlaciones entre las puntuaciones verdaderas y pronosticadas es alta.

¾ Validez de contenido

Se pretende determinar si el contenido del test es una muestra representativa del rasgo o conducta que quiere medirse. Se consideran la representatividad del dominio, en cuanto a que los elementos del test cubran o representen

adecuadamente el contenido, y la especificación del dominio o de la relevancia del contenido, en cuanto a que incluya todos los aspectos de interés.

La validez de contenido se determina a través de juicios subjetivos, no existen procedimientos ni índices estadísticos adecuados para estimarla.

x La validez aparente. Validez de sillón. Se establece cuando una persona examina el test y concluye que éste mide el rasgo de

interés. De no tenerla, provocan una escasa cooperación de los sujetos en la realización del test.

x La validez lógica o validez muestral. Atiende a la relevancia y la representatividad del dominio de comportamientos que van a ser medidos por el test.

¾ Validez de criterio

Indica cual es la eficacia del test en la predicción de algún tipo de comportamiento futuro del sujeto en situaciones específicas. La validez relativa al criterio se juzga como el grado de relación entre el test que actúa como predictor y otra variable de interés que actúa como criterio.

La validez en relación con la longitud del test

Si rxx la fiabilidad del test inicial y Rxx la fiabilidad de ese test al multiplicar por k su longitud, se tiene que la validez inicial, se ve modificada pasando a tomar el valor Rxy.

Variaciones del coeficiente de validez

9 Coeficiente de determinación; Rxy2, el cuadrado del coeficiente de validez expresa la proporción de la varianza del

criterio que se puede predecir a partir del test y que es menor que el coeficiente de fiabilidad del predictor. Sería la varianza común entre un test y un criterio. 9 Coeficiente de alienación; es la raíz cuadrada de la diferencia a uno del coeficiente de terminación.

Coeficiente de validez rxy=0,90, tiene un coeficiente de determinación rxy2= 0,81. El 81% de la varianza del criterio es pronosticable mediante el test. Coeficiente de alienación es K= 0,43 y que la varianza asociada al error en la predicción es el 43% de la varianza total. 9 Coeficiente de valor predictivo; es el complemento a uno del coeficiente de alienación. 1 – K. Explica la probabilidad o

porcentaje de seguridad en el pronóstico.

Validez y homogeneidad de la muestra Cuanto menor sea la variabilidad de los elementos del grupo sobre el que se calcule el coeficiente de correlación, menor será el coeficiente y, por lo tanto, la validez.

x El coeficiente de validez de una variable X con respecto a una medida y como valor absoluto de la correlación.

x La variable predictora es la variable X que toma los valores de las puntuaciones en el test

La variable criterio es la variable que se predice, la variable Y. La validez es simétrica para la validez de X con respecto a Y, y de Y con respecto a X.

x En la validez predictiva transcurre un periodo de tiempo entre la medición del predictor y del criterio y en ese periodo se produce algún tipo de intervención en los sujetos. La validez concurrente implica la recogida de ambos tipos de medidas al mismo tiempo, o al menos en momentos contiguos. La validez postdictiva o retrospectiva nos permite estimar el grado en que un individuo poseyó un rasgo determiando en el pasado.

- Validez-

Page 63: Metodología

Tema 38. Validez Ione Esquer Terrazas

¾ Validez de constructo/ conceptual /estructural

Intenta clarificar en qué medida la respuesta observada en los tests tiene un determinado significado, valorando el grado en

que la relación empírica de las pruebas es consistente con este significado. El coeficiente de validez viene dado por las relaciones entre las variables observadas y algún constructo teórico, o variable

latente de interés. Se pueden estudiar analizando las correlaciones observadas en otros tests que a su vez mantienen altas correlaciones con el

constructo.

El establecimiento de la validez de constructo requiere; x Validez convergente. Que ese test presente una correlación apreciable con otros tests que sean teóricamente relevantes. x Validez discriminante. Es necesario que no correlacione con otros tests con los que la teoría indique que no debe estar

relacionado. Para establecer la validez de constructo es imprescindible cubrir las etapas;

1) Formulación de una definición teórica del constructo 2) Verificación experimental de esas relaciones 3) Inferencia y explicación que dé sentido a la validez de constructo de una cierta medición o de un test en particular

Entre los métodos propuestos para establecer relaciones entre constructos están; el análisis factorial, cluster, matrices multimétodo multirasgo de Campbell y Fiske.

9 Validez multimétodo-multirrasgo Indicado para casos en que se consideran dos o más rasgos que se van a evaluar por dos o más métodos. Los coeficientes de validez convergente vendrán dados por las correlaciones entre las medidas del mismo constructo usando diferentes métodos. Los coeficientes de validez discriminante vendrán dados por las correlaciones entre medidas de diferentes constructos, usando el mismo método de medida o correlaciones entre diferentes constructos usando distintos métodos (se espera que sean bajos).

Resumen –VALIDEZ- ¿Qué es lo que mide y cómo lo mide?

¿Mide el test lo que pretende medir?

x Validez de contenido; análisis racional del contenido (subjetivo) V.Lógica o muestral; representatividad, relevancia V.Aparente

x Validez de constructo, estructural o conceptual; análisis con métodos

estadísticos del significado teórico. V. del rasgo; estructura interna del constructo y su manifestación

en indicadores. V.Nomológica; relaciones con otros contenidos.

o V.Convergente; correlación con variables relevantes alconstructo.

o V.Discriminante; ausencia de correlación con variables con las que no debería correlacionar.

Utilidad para predecir otras variables (Variables de interés o criterio)

x Validez de criterio o empírica; eficiencia del test en predicción Rxy= coeficiente de validez. Rxy2= coeficiente de determinación.

V. predictiva; x-lapso tiempo-y V.concurrente; x+y al tiempo V.posdictiva-retrospectiva; y-lapso tiempo-x

Page 64: Metodología

Ione Esquer. Psicometria

VALIDEZ Exactitud con la que el test mide las características para las que está diseñado. Permite discriminar a los sujetos.

Cuál es el nivel de eficacia del test en la predicción de un tipo de comportamiento del sujeto en el futuro.

Coeficiente de validez Grado de relación entre el test y otra variable de interés que pretenda predecir (criterio). Tres tipos de validez;

¾ V.Concurrente; medidas de test y criterio se toman al mismo tiempo.

¾ V.Predictiva; transcurre un tiempo y durante este intervalo se produce un cambio

¾ V.postdictiva o retrospectiva. Medición del criterio antes del test.

Validez empírica / Al criterio / Predictiva

Relaciones que un test tiene con las investigaciones de ese campo. Los constructos no son medibles directamente.

¾ Relaciones observadas en otros test que a su vez tiene correlaciones con el constructo ; validez convergente.

¾ No debería tener correlación con otros test con los que la teoría no debería estar correlacionado, se denomina ; validez discriminante.

Validez factorial Análisis factorial; procedimiento estadístico dirigido a identificar rasgos de conducta. Si los ítems se agrupan en forma indicada en la teoría.

¾ Las correlaciones del test con cada factor se denomina ;validez factorial. x Análisis factorial exploratorio. No se conoce la estructura interna al conjunto

de variables. x Análisis factorial confirmatorio. Se parte de una hipótesis de la estructura de

las variables.

Validez multimétodo- multirasgo (validez convergente-discriminante) Correlación con variables relacionadas y deferir con las que no está relacionado. Campbell y Fiske crearon matrices para evaluar los dos tipos de validez.

Validez de constructo / Estructural

Si el test es una muestra representativa de los conceptos o dominios (Rasgos, aptitudes, etc) que se quieren medir. Procedimiento estadístico; acuerdo interjueces.

La validez de contenido tiene dos aspectos básicos;

Representatividad de dominio. Que los elementos del test representen adecuadamente el contenido a evaluar.

Especificación del dominio o relevancia del contenido. incluyan aquellos aspectos de interés para la evaluación.

Dos tipos de validez de contenido; ¾ Validez aparente. La que se establece en virtud

del juicio subjetivo después de examinar a simple vista un test.

¾ Validez lógica o muestral. Validez de contenido en sí.

Validez de contenido

9 Validez y fiabilidad; formulas de atenuación. La validez de un test, siempre será menor que su fiabilidad. La correlación entre ambas es simétrica. La formula de corrección por atenuación calcula el valor de la validez corrigiendo los errores del test y criterio.

9 Validez y longitud del test Aumentando la longitud aumentamos la fiabilidad. Pero hasta un límite. Podemos utilizar la formula Spearman-Brown para estimarlo.

9 Validez y heterogeneidad de la muestra Cuanto más heterogénea sea la muestra, mayor será el coeficiente de validez.

9 Estimación de criterio. Conveniente que en la predicción de criterios reales se empleen varios test.

Otros coeficientes relacionados con la validez Coeficiente de determinación

Proporción de la varianza de criterio que puede estimarse con el test. Varianza común entre test y un criterio. Proporción entre puntuaciones de los sujetos en un criterio , a partir de un test.

Coeficiente alineación Proporción de varianza en el pronóstico que es atribuible al error. Inseguridad o azar. (La predictiva es parte de este).

Coeficiente de valor predictivo Porcentaje o probabilidad de seguridad en el pronóstico.

Page 65: Metodología

Tema 39. Teoría de la respuesta al ítem o modelos del rasgo latente Ione Esquer Terrazas

¾ Teoría de la respuesta al ítem

Los orígenes de estos modelos pueden encontrarse en Lawley, pero el primer estudio formal y la introducción del término

rasgo latente lo realizó Lazarsfeld. Es posible predecir probabilísticamente la respuesta de cualquier individuo a cualquier ítem, aún cuando no existen datos

acerca de cómo individuos similares hubieran resuelto ítems análogos. Las funciones de respuesta al ítem establecen las relaciones, matemáticamente formalizadas, de cómo depende cada

respuesta de un cierto nivel o grado de probabilidad o aptitud en el rasgo considerado. La función de información del test constituye un indicador de los errores de medida del test.

En la teoría del rasgo latente hay cuatro conceptos principales;

x Dimensionalidad del espacio del rasgo; un rasgo o variable latente está compuesto por varias dimensiones o componentes, de manera que cualquier individuo puede ser descrito en un rasgo determinado los valores que alcanza en las dimensiones que lo compone.

x Independencia local; dado un grupo de sujetos, todos caracterizados por el mismo vector de aptitud, las distribuciones condicionadas de las puntuaciones de los ítems a los valores del vector son todas mutuamente independientes.

x Curva característica del ítem; curva de regresión de los valores esperados en un ítem sobre la variable aptitud. Relaciona la probabilidad de éxito en un ítem con la aptitud medida por el conjunto de los ítems, o el test que los contiene.

x Parámetros de la curva característica del ítem; dificultad, discriminación y adivinación conjetura o pseudoazar. La diferencia principal entre el modelo clásico y los del rasgo latente (Lord) es que la relación entre el puntuaje observado y el rasgo o aptitud en la teoría clásica es de tipo lineal (X=V+e) mientras que en los diversos modelos de la TRI las relaciones son funciones de tipo exponencial, principalmente logísticos.

- Teoría de la respuesta al ítem o modelos del rasgo latente-

Page 66: Metodología

Tema 40. Análisis de los ítems y principios de construcción de test Ione Esquer Terrazas

¾ Análisis de la dificultad y discriminación de los ítems en la TRI

x El índice de dificultad de un ítem refleja el grado de dificultad de un ítem, entendido como la dificultad para su resolución

correcta por parte de los sujetos de l amuestra. El ID está comprendido entre 0 (máxima dificultad) y 1 (mínima dificultad).

x El poder discriminativo del ítem (varianza del ítem) viene dada por la proporción de aciertos. El poder discriminativo de un ítem será máximo cuando alcanza en ítems dicotómicos p=q=0,50. La varianza de las puntuaciones de un ítem oscila entre 0 y 0,25.

¾ Índice de discriminación

Diferencia sujetos eficaces e ineficaces en el test en cuestión. Basados en la correlación.

x Índice de homogeneidad; sujetos con puntuaciones elevadas en el test acertarán el ítem. Correlación entre la puntuación del ítem y la total del test al que pertenece.

- Análisis de los ítems y principios de construcción de test-

Page 67: Metodología

Ione Esquer. Psicometria

Tª del RASGO LATENTE o Tª de RESPUESTA AL ITEM

Las relaciones pueden ser funciones de tipo exponencial (no lineal como la TCT)

¾ Modelos de error binomial

Presuponen que la puntuación observada se corresponde con el número de respuestas correctas en el test, formado éste por ítems independientes entre sí y de igual dificultad.

¾ Modelos de Poisson

Se ajustan a la función de probabilidad para una distribución de Poisson. Adecuados para test con gran número de ítems.

¾ Modelos de ojiva normal

No es más que una curva acumulada de distribución normal. Cada ítem tendrá una curva diferente a media que varían los parámetros a y b.

¾ Modelos logísticos

Modelo logístico de Rasch; parte de la base de que todos los ítems del test, tienen idéntico poder discriminante (factor a) y por tanto, la única variación que puede existir es atendiendo al factor (b).

Modelos

A cada sujeto se le asigna un parámetro individual ɽ que expresa el rasgo, siendo e objetivo del test, poder estimar el valor de dicho parámetro.

El parámetro ɽ es desconocido, por lo que se denomina variable latente. Cuatro supuestos principales;

1) Dimensionalidad Modelos unidimensinales; 1 sola aptitud/ rasgo es necesario para explicar la actuación de un sujeto en un test.

2) Independencia local La probabilidad de que un individuo responda de manera correcta a un ítem no queda afectada por las respuestas dadas a otros ítems.Presupone; independencia de ítems e interdependencia entre examinados.

3) Curva característica del ítem Curva de regresión q se establece entre la respuesta al ítem y el nivel de aptitud. Función probabilística creciente. Cada ítem tendrá su propia curva. Tres parámetros. Invarianza de los parámetros del ítem (inherentes al item); B o dificultad del ítem. Cantidad de aptitud necesaria

para resolver ese ítem con éxito. A o discriminación del ítem. Discriminación entre los

suj. q tienen una aptitud inferior al ítem, y los q. tienen superior.

C o adivinación. Probabilidad de acertar solo por azar.

4) Escala de aptitud. Aptitud y puntuación verdadera no son conceptos totalmente equivalentes.

Conceptos básicos 9 Orígenes; trabajos de

Lawley.

9 Primer estudio formal aportando el término rasgo latente fue creado por Lazarfeld.

9 Tª de la respuesta al ítem (TRI) de Lord y Rasch.

Obj; especificar la relación entre las puntuaciones empíricas de los suj. en un test y una característica o rasgo observable q. se supone es la responsable de dichas puntuaciones.

La fiabilidad de la prueba se llama –> función de información.

Relaciona la información que puede proporcionarnos un test en función del nivel de aptitud.

Inversa de la varianza de error.

Constituye un indicador de los errores de medidas del test.

Función de información del test

Page 68: Metodología

Tema 41. Escalamiento Ione Esquer Terrazas

¾ Métodos de escalamiento

Se conoce como escalamiento al campo de la psicometría que tiene por objetivo fundamental la construcción de escalas de medida e incluye todos los procedimientos necesarios para su elaboración.

9 Modelos de escalamiento; proporcionan reglas que permiten asignar los números a los objetos para elaborar una escala de medida.

9 Métodos de escalamiento; procedimientos utilizados para aplicar las reglas del modelo.

x Métodos de escalamiento centrados en los sujetos Se pueden dividir en;

1) Aptitudes; Teoría de los tests 2) Actitudes; Métodos de respuesta

a. Técnica de Likert b. Diferencial semántico

Métodos de respuesta

Se llaman así puesto que los sujetos evalúan cada uno de los estímulos en función de la opinión que les merece o del sentimiento que les provoca.

9 Técnica de Likert o Se trata de escalar a los sujetos a lo largo de un continuo de actitud, en función de las puntuaciones

obtenidas en la escala. Las variaciones observadas en las respuestas son debidas a diferencias individuales respecto a la actitud medida.

o Desde el punto de vista de la medición, la técnica de Likert asume un nivel de medida ordinal. o Los sujetos son ordenados en la escala en función de su posición favorable/Desfavorable respecto a la

actitud medida. Principios;

a) Es posible estudiar dimensiones de actitud a partir de un conjunto de enunciados que operen como reactivos para los sujetos.

b) Los individuos pueden situarse en la variable de actitud desde un punto más favorable al más desfavorable

c) La valoración de los sujetos en la variable en actitud no supone una distribución uniforme sobre un continuo de actitud.

9 Diferencial semántico de Osgood

La tarea de los sujetos será evaluar un determinado concepto a través de una serie de escalas bipolares , ahora bien, el concepto a medir dependerá de la investigación que se vaya a realizar y de su objetivo concreto.

x Métodos de escalamiento centrados en los estímulos

o Se trata de un modelo que está basado en las diferencias que hay entre los sujetos a la hora de percibir los estímulos

(variabilidad perceptual de los sujetos) e incluso en las diferencias perceptivas producidas en un mismo sujeto, cuando se le presentan los estímulos en distintas ocasiones, y por otra parte, en la limitación que tienen los sujetos para percibir la diferencia de magnitud entre dos estímulos.

o Siempre es posible encontrar dos de ellos cuya diferencia sea tan pequeña que no pueda ser percibida por el observador. o La respuesta del sujeto, en cualquier caso, ante la presentación de los estímulos será una repuesta subjetiva, puesto que

deberá emitir un juicio (método de juicio).

Métodos de elaboración de escalas psicofísica Las que resultan de la asignación de valores escalares a estímulos que varían a lo largo de un continuo físico. Tipo de escalas de la psicofísica (Fechner y Stevens).

Métodos de elaboración de escalas psicológicas Las que resultan de la asignación de valores escalares a estímulos que varían a lo largo de un continuo psicológico. Grado de racismo de un conjunto de enunciados (Thrustone).

Así en función de la tare tenemos;

9 Métodos de juicio absoluto o categórico; método de los intervalos aparentemente iguales y Método de los intervalos sucesivos derivados de la ley del juicio categórico de Thrustone.

9 Métodos de juicio comparativo; método de las combinaciones binarias utilizado por Thrustone en su ley del Juicio comparativo.

- Escalamiento-

Page 69: Metodología

Tema 41. Escalamiento Ione Esquer Terrazas

x Métodos de clasificación centrados en las respuestas

Se escalan tanto los estímulos como los sujetos, por lo que se asignan valores a ambos (aproximación centrada en la respuesta). Las variaciones en la respuesta de los sujetos se deben a diferencias entre los estímulos y a diferencias entre los sujetos en cuanto a su actitud personal frente a los estímulos.

Métodos de respuesta categórica. De acuerdo – en desacuerdo, acierto-fallo, etc. Escalogram de Guttman.

Métodos de respuesta comparativa. Comparar dos o más estímulos entre sí y luego ordenarlos según las preferencias mostradas por el sujeto. Modelos de Coombs. 9 Escalograma de Guttman

Es un método de escalamiento unidimensional que permite medir o escalar estímulos/objetos (ítems) y sujetos. El modelo está basado en la idea de que es posible ordenar los estímulos de manera que si un sujeto responde correctamente a un estímulo concreto, lo hará también a todos los que estén situados por debajo de dicho estímulo en la escala establecida. Nos proporciona escalas ordinales.

9 El modelo de Coombs

Está basado en el análisis de los datos de elección preferencial y por la tanto, la ordenación de los estímulos se hará en función de la mayor o menor preferencia que muestren los sujetos hacia ellos. Se le conoce también como modelo de despliegue, ya que permite, utilizar un modelo geométrico de despliegue para la comprensión visual de la estructura de los datos.

Page 70: Metodología

Ione Esquer. Psicometria

LA MEDICIÓN PSICOFÍSICA

Métodos de estimación cuantitativa

Ø Escala de Guttman Escalograma. Establecer un valor par una variable continua, y solo un atributo subyacente. La segunda pregunta cierra un poco el campo de la primera. Son deterministas y de distribución monótonas. Centrado en la respuesta a ítems dicotómicos. Valores escalares tanto a los sujetos como a los estimulos. Medida ordinal.

Ø Escalas de Thurstone Comienza con la selección de 100-200referentes teóricos del tópico, y se van reduciendo. Son probabilísticas y de distribución no monótonas. Centradas en los estímulos o métodos de juicio. Método de escalamiento psicológico. Dos leyes; ley de juicio comparativo y ley de juicio categórico.

Ø Escalas de Coombs Determinismo. Modelo de despliegue. Centrado a las respuestas.

Métodos de estimación directa

Extraen estimaciones cuantitativas acerca de la magnitud del atributo de las personas y su respuesta.

Ø Escalas Likert Medir actitudes y conductas. Son probabilísticas y monótonas. Centrados en los sujetos. Medida ordinal. Escala sumativa.

Ø Escala visual análoga Definir el fenómeno, determinar 2valores extremos y opuestos y luego unir los extremos con una línea.

Ø Escala semántico diferencial El suj. Califica cada ítem de una lista de pares de adjetivos opuestos. El suj. tiene q. señalarse en ese continuo. Conceptos y escalas bipolares. Significado afectivos de los estímulos. 3 dimensiones; valorativa, potencia y actividad.

Métodos de cuantificación subjetiva;

1) Métodos de estimación subjetiva. Base de que los individuos objeto de estudio, están preparados para realizar las operaciones necesarias que dan como resultado la escala de medida.

2) Método del error promedio. Aplicar 2 E; uno tiene valor fijo, el 2º puede ser manipulado.

3) Métodos de confusión. Las personas no responden siempre тa los E. Al aplicar тE pueden confundirse los efectos de estos.

4) Método de los cambios mínimos / diferencias mínimamente perceptibles Momento en el que el suj. es capaz de captar diferencias de E.

5) Método de orden por rangos. Los suj deben ordenar una serie de E q. se le presentan.

6) Método de comparaciones binarias. Se presentan al suj. E de 2 en 2, realizando todas las combinaciones posibles.

7) Métodos de estimación subjetiva. Los suj. pueden emitir juicios de razón, para construir las escalas.

8) Escalas de clasificación. Se presentan una serie de categorías ordenadas, y tiene q. ir clasificando los E que se le aplican, en la categoría q. considere adecuada.

Métodos de escalamiento psicofisiológico

Medida de las sensaciones a través de la medida de los

estimules físicos que las produce.

Fechner. Máximo representante.

Stevens. Desarrolla la “Ley de potencial”. Fenómenos observados por la psicofísica;

x Umbral absoluto; intensidad necesaria de un estimulo para que provoque un E .en un organismo.

x Umbral diferencial; intensidad necesaria para q. un organismo detecte la diferencia de estimulación.

x Igualdad; determinar si 2estimulos son =

x Igualdad de E; determinar la igualdad de intervalos de estimulación

x Igualdad de razones; además de igualdad de E, es necesario determinar el cero absoluto.

x Orden; relación ordinal entre un conjunto de estímulos

x Clasificación de estímulos.

Se pueden distinguir dos tipos de escalas;

1) Escalas deterministas Cada ítem un grado determinado de atributo. No error.

2) Escalas probabilísticas Se cuentan con mayores niveles de probabilidad. Si error.

Atendiendo a la relación existente entre los тítems, tenemos dos escalas;

a) Escalas monótonas La contestación de los ítems, implican la contestación afirmativa de ítems anteriores.

b) Escalas no monótonas Los ítems solo representan una cantidad determinada del atributo.

Según como se combinen estas dos formas, tenemos diferentes métodos;

.

ESCALAS PSICOMÉTRICAS