Variables

6
Procedimientos descriptivos M. A. Martinez-Gonzalez, J. de irala Estévez 2.1. Tipos de variables 2.1.1. Variables y bases de datos La práctica totalidad de las tareas de investigación exigen que se realice una fase de recogida de datos. Estos datos son la materia prima de la Bioestadística. Los datos se resumen mediante una serie de números que se calculan a partir de los datos iniciales. A estos nuevos números, que, de algún modo, extraen la información importante que está en los datos, se les denomina índices estadísticos. A las cualidades o cantidades recogidas de cada individuo se les llama variables, porque varían de un sujeto a otro (Aurman Y BLAND, 1999). Resulta básico e imprescindible saber distinguir los diferentes tipos de variables que existen según las escalas que se utilizan para medirlas. Conocer esta distinción con claridad previene muchos de los errores más frecuentes en la aplicación e interpretación de los procedimientos que se irán estudiando en otros capítulos (GREENHALGH, 1997). ¿Qué tipos de datos son los que se suelen recoger? Supongamos que se desea evaluar la efectividad de un programa dirigido a conseguir que los fumadores dejen de fumar y que el estudio comprende a 200 sujetos, que fueron asignados al azar (aleatoriamente) bien a recibir un programa especial de intervención o bien a no recibirlo (grupo control). De cada sujeto se recogerán —entre otros— los datos presentados en la Tabla 2.1. Lo que se presenta en la Tabla 2.1 viene a ser como un "diccionario" o "cabecera" de una base de datos. Incluye la información pertinente para comprender adecuadamente lo que significara en adelante cada número en esa base de datos. A la derecha entre paréntesis se ha indicado el nombre que se le va a dar a cada variable. Junto con la definición de cada una, aparecen además los códigos que puede tomar cada dato de esta variable. Así, por ejemplo, una variable es el sexo y otra la edad. Se suele buscar un nombre abreviado (no más de ocho letras) para referirse a cada variable, así, con

description

explica las diferentes variables en una investigacion

Transcript of Variables

Page 1: Variables

Procedimientos descriptivos

M. A. Martinez-Gonzalez, J. de irala Estévez

2.1. Tipos de variables

2.1.1. Variables y bases de datos

La práctica totalidad de las tareas de investigación exigen que se realice una fase de recogida de datos. Estos datos son la materia prima de la Bioestadística. Los datos se resumen mediante una serie de números que se calculan a partir de los datos iniciales. A estos nuevos números, que, de algún modo, extraen la información importante que está en los datos, se les denomina índices estadísticos. A las cualidades o cantidades recogidas de cada individuo se les llama variables, porque varían de un sujeto a otro (Aurman Y BLAND, 1999).

Resulta básico e imprescindible saber distinguir los diferentes tipos de variables que existen según las escalas que se utilizan para medirlas. Conocer esta distinción con claridad previene muchos de los errores más frecuentes en la aplicación e interpretación de los procedimientos que se irán estudiando en otros capítulos (GREENHALGH, 1997). ¿Qué tipos de datos son los que se suelen recoger?

Supongamos que se desea evaluar la efectividad de un programa dirigido a conseguir que los fumadores dejen de fumar y que el estudio comprende a 200 sujetos, que fueron asignados al azar (aleatoriamente) bien a recibir un programa especial de intervención o bien a no recibirlo (grupo control). De cada sujeto se recogerán —entre otros— los datos presentados en la Tabla 2.1.

Lo que se presenta en la Tabla 2.1 viene a ser como un "diccionario" o "cabecera" de una base de datos. Incluye la información pertinente para comprender adecuadamente lo que significara en adelante cada número en esa base de datos. A la derecha entre paréntesis se ha indicado el nombre que se le va a dar a cada variable. Junto con la definición de cada una, aparecen además los códigos que puede tomar cada dato de esta variable.

Así, por ejemplo, una variable es el sexo y otra la edad. Se suele buscar un nombre abreviado (no más de ocho letras) para referirse a cada variable, así, con

Page 2: Variables

ocho o menos letras, el ordenador guarda el nombre siempre igual. Por ejemplo "SEXO", "EDAD". "INICIO". etc. Los datos se suelen guardar en un fichero que contiene filas y columnas.

Cada fila suele corresponder a un individuo y cada columna a una variable. Al conjunto completo de las variables de todos los individuos se le llama base de datos. La Tabla 2.2 recoge una base de datos.

Tabla 2.1. Ejemplo de variables contenidas en una base de datos (diccionario o "cabecera" de la base de datos)

Es evidente que encontrar el número 1 en la variable "SEXO" no tiene el mismo significado que encontrar ese mismo número en la variable "NUMCIG". En el caso de la variable "SEXO", el número 1 es un indicador o una especie de nombre que le damos a todos los individuos de sexo masculino y que se llama código (viene a ser como una "etiqueta"). En cambio, en la variable "NUMCIG" el numero 1 sería una cantidad real, ya que correspondería exactamente a fumar 1 cigarrillo al día. Por eso decimos que la variable "SEXO" es una variable cualitativa o categórica, en cambio la variable "NUMCIG" es una variable cuantitativa. Las variables cualitativas o categóricas están "medidas" en una escala nominal, aunque se les asignen códigos numéricos, los números son en realidad una "traducción" de sus nombres. La escala de las variables cuantitativas corresponde a la de los valores reales de los números que toman.

Page 3: Variables

Tabla 2.2. Base de datos del programa de abandono del tabaco (contenido de la base de datos)

Una diferencia fundamental entre ambas escalas es que encontrar, por ejemplo, el número 20 en la columna de la variable "NUMCIG” corresponde a un valor que es exactamente la mitad de cuando encontramos el número 40 y que también vale exactamente el doble que cuando encontramos el número 10. En cambio, cuando figura el número 2 en la variable "SEXO" no supone que una mujer valga el doble que un varón, pues hubiese dado lo mismo codificar a los hombres con un 1 y a las mujeres con un 0.

Otras variables de esta base de datos como "EDAD", "PESO" y "TALLA" también son cuantitativas, y, por lo tanto, los datos que aparecen en ellas corresponden realmente a números. Pero también hay más variables cualitativas además de "SEXO", como son, por ejemplo las variables "GRUPO" y "ENFERM".

A su vez, dentro de las variables cuantitativas o realmente numéricas encontramos dos posibilidades: las que admiten cualquier valor dentro de un intervalo (continuas), sin más restricción que los aparatos de medida, y las que solo pueden tomar números enteros (discretas). El "PESO" o la "TALLA" son variables cuantitativas continuas, ya que un individuo puede tener un peso que tome cualquier valor entre 80 y 81 kg, pudiendo pesar, por ejemplo, realmente 80,3333693 kg y lo mismo podría decirse de la talla. En cambio, otras variables como "INTENTOS" solo pueden tomar números enteros. Nadie puede realmente haber intentado dejar de fumar 1,333333693 veces (entiéndase la coma como un separador de decimales, no de millares, ni de millones). A estas otras variables que solo pueden tomar valores numéricos aislados se les llama variables cuantitativas discretas.

Pero todavía nos queda otro tipo de variables que están en una situación intermedia, en una especie de tierra de nadie. Se trata de variables como el grado

Page 4: Variables

de disnea ("DISNEA") o el interés en dejar de fumar ("INTERES). En este tipo de variables se puede decir que un grado 2 de disnea es más intenso que un grado 1, pero nunca puede interpretarse como que una disnea grado 2 sea exactamente el doble de intensa que la disnea de grado 1. Este tipo de variables se llaman ordinales, y su uso es muy frecuente en medicina. Por ejemplo, se puede clasificar el dolor en ausente/ leve/ moderado/intenso y darle respectivamente los códigos 0/1/2/3 a cada categoría.

También se puede "medir" así la respuesta a un tratamiento asignándole, por ejemplo, el código -1 a los que empeoran, el 0 a los que quedan igual, el +1 a los que mejoran algo y el +2 a los que mejoran mucho. Otro campo donde suelen utilizarse también variables ordinales es el de las determinaciones analíticas, y así, por ejemplo, para evaluar si un paciente tiene glucosa en orina ("glucosuria") se puede cuantificar: 0 / + / ++ /+++

2.1.2. Variables cualitativas o categóricas nominales

Se denominan así aquellas cuyos posibles valores se refieren a una característica o cualidad que la persona posee o no posee. Los posibles valores son excluyentes, lo cual se observa claramente en variables como el sexo, ser asignado a un grupo de tratamiento, haber tenido un infarto... y todas aquellas en las cuales la respuesta se limita a un grupo o clase, o simplemente pueda ser un sí o un no.

Para su medición usamos escalas nominales, donde los valores son identificados con palabras. Una escala nominal solo permite clasificar, pero no ordenar o jerarquizar. Solo permiten operaciones de igualdad o desigualdad. Esto quiere decir que si representamos los posibles valores que puede tomar una escala nominal por letras (A, B, C,...), podemos decir que A es distinta de B, pero no que es mayor o menor. Si hay una posible gradación o jerarquización de los valores o categorías (unos son mayores que otros) entonces la escala no es nominal sino ordinal (véase más abajo).

A veces los posibles valores de una variable cualitativa o categórica pueden estar predeterminados de antemano, asignando un código numérico ("etiqueta") a cada categoría. A este proceso se le llama codificación.

En general, este tipo de variables sólo permiten operaciones de igualdad o desigualdad. Distinguimos dos tipos de variables cualitativas o categóricas nominales:

— Dicotómicas o binarias: sano/enfermo, expuesto/no expuesto, hombre/mujer.

— Politómicas (con varias categorías): grupo sanguíneo (A/B/0/AB), cierto tipo de tratamiento (A/B/C).

Page 5: Variables

2.1.3. Variables cualitativas ordinales

Son aquellas cuyos posibles valores se encuentran jerarquizados y ordenados. El tipo de escala utilizado se denomina ordinal. Se pueden realizar con estas variables no solo operaciones de igualdad y desigualdad, sino también operaciones de orden (ordenar los diferentes valores). Ejemplos de estas variables serían el grado de disnea, el grado de dolor, la intensidad del hábito tabáquico medida en la siguiente escala: nunca fumador / ex fumador / fumador activo.

2.1.4. Variables cuantitativas

Hablamos de variables cuantitativas cuando los números utilizados para codificarlas realmente equivalen con exactitud a los verdaderos datos. Los datos son realmente numéricos. Existen los siguientes tipos de variables cuantitativas:

Discretas: solo pueden tomar valores numéricos aislados. Sus valores son finitos y coinciden con números enteros. Ejemplos dares son: número de hijos, número de intervenciones previas, número de intentos para dejar de fumar... Permiten operaciones de igualdad-desigualdad y orden ("rango"), pero también operaciones algebraicas.

Continuas: son numéricas y además pueden teóricamente valer cualquier cantidad intermedia entre dos posibles valores. Es decir, teóricamente podrían tomar valores con un número de decimales que tiende al infinito. Permiten todas las operaciones hasta ahora comentadas, y se miden en escala de razón. Ejemplos: edad, peso, talla, tensión arterial... Sin embargo, en la práctica todos los datos que teóricamente son continuos acaban tratándose como discretos porque los instrumentos de medida son limitados.

Page 6: Variables

2.1.5. Categorización de una variable cuantitativa

Puede realizarse una transformación de una variable cuantitativa y pasarla a una escala ordinal, creando así unos datos híbridos entre ordinales y cuantitativos. A este proceso se le suele llamar categorización de una variable. Consiste en que una determinada variable que inicialmente poseía características de cuantitativa porque sus valores estaban expresados en números, se pasa a considerar como cualitativa ordinal (a incluso como nominal en cierto sentido), de modo que los valores individuales se colapsan formando solo unos pocos grupos o categorías que engloban a un rango de los valores anteriores. Por ejemplo, si en la base de datos presentada al principio de este capítulo se quisiera categorizar el hábito tabáquico, podríamos crear tres categorías, como muestra la Tabla 2.3:

Tabla 2.3. Ejemplo de transformación de una variable cuantitativa (número de cigarrillos/día) en una variable cualitativa ordinal (categorización).

Se obtendrá una nueva variable “FUMADOR" que solo contiene tres posibles valo-res (1, 2 6 3). Téngase en cuenta que en el ejemplo utilizado todos eran fumadores. Valdrá 1 para los que fuman menos de 20 cigarrillos, 2 para los que fuman entre 20 y 39, y valdrá 3 para los que fuman 40 o más. Hemos pasado de una escala de razón' a otra de tipo ordinal. Este proceso, aunque a veces es práctico, siempre supone perder información y, desde luego, nunca se debe recoger la información en una escala ordinal si se puede hacer en una escala de razón. Es mejor recoger siempre las variables con la máxima precisión y detalle posibles (cuanto más "cuantitativas", mejor) y solo después categorizar si resulta conveniente por el tipo de análisis estadístico que se desee realizar.

En la tabla 2.4. Se resumen los distintos tipos de variables.

Tabla 2.4. Tipos de variables.

Tipo de variable Utilidad: sirve para Cualitativa nominal Clasificar Cualitativa ordinal Jerarquizar Cuantitativa discreta Contar Cuantitativa continua Medir

Variable Antigua = NUMCIG Variable nueva = FUMADOR

1-19 1 20-39 2 40-maximo 3