Post on 28-Sep-2015
description
TEMA 5. Descripcion de series temporales
1 Introduccion
Una serie temporal es una serie estadstica cuyos valores se observan a lo largo del tiempo, por
ejemplo a lo largo de das, semanas, meses, estaciones, anos, etc.
Los valores se denotaran por Y1, Y2, Y3, etc. Por ejemplo, si se observa una cantidad a lo largo de
los meses, y se empieza en Enero de 2001, Y1 sera el valor observado para Enero de 2001, Y2 para
Febrero de 2001,..., Y15 sera el valor para Marzo de 2002, y as sucesivamente.
Ejemplo 1.1 La tienda online de una papelera, abierta el 1 de Abril de 2002 ha registrado las
siguientes ventas por trimestre (miles de EUROS),
2002 2003 2004 2005
------------------------------------------------
Trimestre 1 -- 18.7 22.9 30.4
Trimestre 2 15.1 22.6 26.3 32.1
Trimestre 3 8.3 14.0 18.5 24.2
Trimestre 4 20.3 24.8 28.7 --
------------------------------------------------
2 Componentes de una serie temporal
Usualmente, una serie temporal es la resultante de la interaccion de varios factores,
(a) Tendencia secular. Es el comportamiento basico de la serie, a largo plazo. Se denotara por
Ts.
(b) Variaciones estacionales. Son alteraciones que se repiten de forma periodica y que estan
relacionadas con el problema considerado. Se denotara por Ve.
Ejemplo 2.1 En la observacion de la produccion de un producto agrario, habra una in-fluencia decisiva de la estacion (Primavera, Verano, Otono, Invierno). Aqu la palabra
estacional estara precisamente referida a la estacion astronomica.
En la observacion de los precios a lo largo de los anos, cada mes tiene unas particularidadesque los hacen variar de forma distinta. Aqu la palabra estacional se referira a los meses.
Denotaremos por r al numero de estaciones, en sentido amplio. Si son estaciones as-
tronomicas o trimestres del ano, sera r = 4, si son meses, r = 12, si son das de la semana,
r = 7, etc.
1
(c) Variaciones cclicas. Es una componente de la serie que recoge oscilaciones periodicas de
mayor amplitud que las anteriores. Por ejemplo, ciclos bursatiles, ciclos economicos en los que
se dan de forma alternada etapas de prosperidad y de depresion, cambios en la moda,.... Su
estudio escapa al objetivo de este curso.
(d) Variaciones accidentales. Son cambios imprevistos en la serie de datos. Por ejemplo, un
pedido inesperado a una empresa es una variacion accidental en las ventas de esa empresa, una
huelga es una variacion accidental en la serie de transportes de pasajeros de un aeropuerto,
una ola de calor en una serie de temperaturas, etc.
En el siguiente grafico se ha representado la serie del Ejemplo 1.1. Recordemos que los datos son
trimestrales, es decir tenemos 4 observaciones por ano, r = 4. En este grafico se puede apreciar
la componente estacional (hay un patron similar en las ventas que se repite de ano a ano). En el
grafico se ha esbozado tambien lo que sera la tendencia de la serie, justificaremos en los siguientes
apartados como obtener aproximaciones a esta componente.
2.1 Modelos
Podemos considerar principalmente dos modelos o formas de mezclarse las componentes anteriores,
Modelo Aditivo.Y = Ts + Ve + Vc + Va
Modelo Multiplicativo.Y = Ts Ve Vc Va
Observacion. En la practica para proponer un modelo para una serie de datos, es util el grafico
de la serie.
2
Un modelo multiplicativo es adecuado si en ese grafico observamos que la amplitud de la oscilacionde la componente estacional aumenta con la tendencia. En el Ejemplo 2.2 se puede observar de forma
clara este hecho.
En cambio, un modelo aditivo sera adecuado si en el grafico de la serie observamos que laamplitud de la oscilacion de la componente estacional se mantiene aproximadamente constante con
la tendencia.
Ejemplo 2.2 En la siguiente tabla se ha recogido la entrada de turistas en millones en una determi-
nada region durante 7 anos. Los datos son trimestrales: Primavera, Verano, Otono, Invierno (r=4).
En el grafico de la serie se aprecia claramente la componente estacional y como la amplitud de la
oscilacion de esta componente aumenta con la tendencia. Por tanto, un modelo multiplicativo sera
adecuado.
En nuestro desarrollo supondremos que el modelo es multiplicativo, es decir, que el resultado
final procede de mezclar las componentes mediante multiplicacion o producto.
Nos proponemos los siguientes
OBJETIVOS: Estudiar una serie temporal de forma descriptiva, haciendo aflorar la tendencia
secular, es decir, el comportamiento basico de la serie, y las variaciones estacionales, que son las que
mas influencia pueden tener a corto y medio plazo.
3
3 Metodologa
La metodologa que seguiremos se divide en varias fases, en cada una de las cuales se van separando o
aislando las distintas componentes. Finalmente, se pueden realizar predicciones del valor que tendra
la serie en estaciones futuras.
3.1 Investigacion de la Tendencia Secular
Promediaremos, con la media aritmetica, las observaciones agrupandolas en grupos de r valores
consecutivos. Las cantidades obtenidas se denominan medias moviles. Estos valores se pueden
considerar como una primera aproximacion de la tendencia. Segun r sea par o impar, el metodo
vara un poco.
Si r es impar: Se hace el promedio directamente y se asigna al instante o estacion intermedio. Si r es par: Se hace el promedio, pero los resultados no corresponden exactamente a las estaciones,es decir, no estan centrados, por lo que a continuacion se promedian otra vez de dos en dos. Veamos
estas dos situaciones en el siguiente ejemplo.
Ejemplo 3.1 Calculo de las medias moviles para el caso de das de la semana, es decir, r = 7, osea, impar; y para estaciones astronomicas, o sea, r = 4, esto es, par.
Y Medias Moviles Centradas Y M.M.No Cent. M.M. Centradas
-----------------------------------------------------------------------------------------------
Lunes 1
Martes 2 P 5
Miercoles 2 V 3
Jueves 3 (1+2+2+3+5+2+2)/7 = 2.43 O 1 11/4=2.75 (2.75+3.00)/2=2.875
Viernes 5 (2+2+3+5+2+2+2)/7 = 2.57 I 2 12/4=3.00 (3.00+3.00)/2=3.000
Sabado 2 (2+3+5+2+2+2+2)/7 = 2.57 P 6 12/4=3.00 (3.00+3.25)/2=3.125
Domingo 2 (3+5+2+2+2+2+3)/7 = 2.71 V 3 13/4=3.25 (3.25+3.25)/2=3.250
Lunes 2 (5+2+2+2+2+3+3)/7 = 2.71 O 2 13/4=3.25 (3.25+3.25)/2=3.250
Martes 2 (2+2+2+2+3+3+6)/7 = 2.86 I 2 13/4=3.25 (3.25+3.50)/2=3.375
Miercoles 3 (2+2+2+3+3+6+3)/7 = 3.00 P 6 14/4=3.50
Jueves 3 (2+2+3+3+6+3+1)/7 = 2.86 V 4
Viernes 6
Sabado 3
Domingo 1
------------------------------------------------------------------------------------------------
Notese que para los das, como r = 7 que es impar, se han promediado de 7 en 7 asignando directamente al da
correspondiente. Por ejemplo, al primer Jueves se le asigna la media de Lunes, Martes, Miercoles, Jueves, Viernes,
Sabado y Domingo.
Por el contrario, para las estaciones, tenemos r = 4 que es par. Entonces las primeras medias moviles correspon-
deran a instantes intermedios y por ello se dice que no estan centradas. Por ejemplo al promediar Primavera (P),
Verano (V), Otono (O) e Invierno (I), el resultado correspondera a un punto intermedio entre Verano y Otono. Por
ello hay que volver a promediar, ahora de dos en dos, para centrar.
4
3.2 Investigacion de las Variaciones Estacionales
Dividiremos los datos originales por sus correspondientes medias moviles (donde sea posible). Seguida-
mente promediaremos los valores obtenidos para cada una de las estaciones, empleando la media
aritmetica. Obtendremos as r valores que denotaremos s1, s2,..., sr. Llamemos S a su suma total.
Finalmente calculamos las cantidades,
ei =r
S si = si
sque representan la variacion estacional aportada por cada estacion. Estas cantidades se denominan
ndices de variacion estacional.
Multiplicando por cien se obtienen estas cantidades como porcentajes, quizas mas faciles de inter-
pretar en algunas ocasiones.
3.3 Calculo de la Tendencia Secular
Ya hemos visto que la tendencia secular esta implcita en las medias moviles. Para su calculo
concreto eliminamos la estacionalidad de la serie original, divididiendo los datos originales por
las variaciones estacionales, ei, (suponiendo que el modelo es multiplicativo) . Obtenemos as
una serie de valores que se denomina serie desestacionalizada y que supondra una aproximacion
de la tendencia, mejor que la dada por las medias moviles.
Mediante un ajuste de regresion de la serie desestacionalizada, sera posible plasmar la tendencia
en una recta del tipo tendencia = b t + a, donde tendencia representa la tendencia secular y tel tiempo, y donde a y b se calculan como se ha visto en el tema anterior de regresion y correlacion
(tema 4).
3.4 Predicciones
Es posible predecir el valor de la serie para una estacion futura. Para ello se siguen los siguientes
pasos,
(a) Se predice la tendencia en dicha estacion, a partir de la recta de regresion que representa dicha
tendencia. Para ello se sustituye la t en tendencia = b t + a, por el instante del tiempocorrespondiente a la estacion donde se quiera realizar la prediccion.
(b) El valor obtenido se multiplica por la variacion estacional, ei, correspondiente a la estacion
donde se quiera la prediccion, es decir se estacionaliza la prediccion. El resultado es la prediccion
buscada. Esta prediccion sera mas o menos fiable dependiendo del ajuste de la recta y del
perodo de tiempo transcurrido. Obviamente sera mas fiable una prediccion a dos anos vista
que a 15 anos vista.
NOTA: En el documento denominado Ejemplo completo de series temporales, se desarrolla
lo anterior con todo detalle. Se recomienda estudiar el tema y dicho documento de forma paralela.
5
4 Problemas
1. Estudie la evolucion de los datos proporcionados, apoyandose en la representacion grafica de los
mismos, y calcule las medias moviles.
Cuatrimestres\Anos 1890 1891 1892 18931o 20 30 10 30
2o 10 20 30 20
3o 10 10 20 30
2. Las ventas trimestrales online de una fabrica de calzado expresadas en miles de euros, para los
anos 2012, 2013 y 2014 fueron las siguientes:
Trimestres \ Anos 2012 2013 20141o 150 155 160
2o 165 170 180
3o 125 135 140
4o 170 165 180
Suponiendo un modelo multiplicativo:
(a) Obtenga la serie de tendencia por el metodo de las medias moviles.
(b) Obtenga los ndices de variacion estacional por el metodo de la razon a la media movil.
(c) Desestacionalice con dichos ndices la serie observada.
(d) Obtenga la tendencia lineal ajustando mediante una recta por el metodo de mnimos cuadrados.
Representela graficamente.
(e) Estime las ventas que se realizaran en cada trimestre de 2016. Estudie la fiabilidad de las
predicciones.
3. Suponiendo un modelo multiplicativo y que los ndices de variacion estacional son respectiva-
mente 1.02, 1.20, 1.10, 0.68 para las distintas estaciones del ano, desestacionalice la siguiente serie
temporal relativa al numero de incidencias registradas en un servicio tecnico informatico entre 2005
y 2008:
6
Estaciones\Anos 2005 2006 2007 2008Primavera 8 7 9 10
Verano 10 11 12 13
Otono 9 8 9 10
Invierno 5 4 6 5
4. El numero de paginas web cerradas por no cumplir la legislacion vigente, a lo largo de los tres
cuatrimestres de los anos 2009, 2010 y 2011, fueron:
Cuatrimestres\Anos 2009 2010 20111o 6 10 14
2o 12 15 25
3o 4 7 12
Suponiendo un modelo multiplicativo:
(a) Obtenga los ndices de variacion estacional.
(b) Desestacionalice la serie observada yt.
(c) Calcule la tendencia general aplicando el metodo de mnimos cuadrados. Estudie la adecuacion
del ajuste.
(d) Prediga el numero de paginas web que se cerraron en cada cuatrimestre de 2013.
7
5 Utilizacion en R
5.1 Entrada de datos
Introducimos los datos del Ejemplo 1.1
datos1 = c(15.10,8.30,20.30,18.70,22.60,14.00,24.80,22.90,
26.30,18.50,28.70,30.40,32.10,24.20)
datos1
## [1] 15.1 8.3 20.3 18.7 22.6 14.0 24.8 22.9 26.3 18.5 28.7 30.4 32.1 24.2
Creamos la serie temporal con el comando ts(data,frequency,start) donde: data es la serie de datos,
frequency es el numero de estaciones, y start es un vector cuyas componentes indican el ano y la
estacion de inicio, respectivamente.
serie1=ts(data=datos1,frequency=4,start=c(2002,2))
serie1
## Qtr1 Qtr2 Qtr3 Qtr4
## 2002 15.1 8.3 20.3
## 2003 18.7 22.6 14.0 24.8
## 2004 22.9 26.3 18.5 28.7
## 2005 30.4 32.1 24.2
5.2 Descomposicion de la serie en componentes
El comando decompose almacena en una lista informacion relacionada con las componentes de una
serie temporal que siga un modelo determinado (en nuestro caso multiplicativo)
componentes=decompose(serie1,type=c("multiplicative"))
La serie de medias moviles centradas ha quedado almacenada en el valor trend.
mmcent=componentes$trend
mmcent
## Qtr1 Qtr2 Qtr3 Qtr4
## 2002 NA NA 16.5375
## 2003 18.1875 19.4625 20.5500 21.5375
## 2004 22.5625 23.6125 25.0375 26.7000
## 2005 28.1375 NA NA
8
Los ndices de variacion estacional han quedado almacenados en el valor figure.
varest1=componentes$figure # Indice para cada estacion
varest1
## [1] 1.1262295 0.7030354 1.1398804 1.0308547
Los ndices de variacion estacional repetidos para cada ano han quedado almacenados en el valor
seasonal.
varest2=componentes$seasonal # Indice para cada estacion repetidos para cada a~no
varest2
## Qtr1 Qtr2 Qtr3 Qtr4
## 2002 1.1262295 0.7030354 1.1398804
## 2003 1.0308547 1.1262295 0.7030354 1.1398804
## 2004 1.0308547 1.1262295 0.7030354 1.1398804
## 2005 1.0308547 1.1262295 0.7030354
5.3 Calculo de la tendencia secular
Serie desestacionalizada
serie_des=serie1/varest2 #serie desestacionalizada
serie_des
## Qtr1 Qtr2 Qtr3 Qtr4
## 2002 13.40757 11.80595 17.80889
## 2003 18.14029 20.06696 19.91365 21.75667
## 2004 22.21457 23.35226 26.31447 25.17808
## 2005 29.49009 28.50218 34.42217
Para calcular la recta de tendencia tendremos en cuenta que la serie de instantes de tiempo no viene
dada en R como T = {1, 2, 3, 4, ..., 14} sino como T = {2002.25, 2002.50, 2002.75, 2003.00, ..., 2005.50}
Time=time(serie_des)#Me da los tiempos en los que ha sido medida la serie
Time
## Qtr1 Qtr2 Qtr3 Qtr4
9
## 2002 2002.25 2002.50 2002.75
## 2003 2003.00 2003.25 2003.50 2003.75
## 2004 2004.00 2004.25 2004.50 2004.75
## 2005 2005.00 2005.25 2005.50
La tendencia secular es la recta tendencia = a + b t donde a y b son los coeficientes de la rectade regresion de la serie desestacionalizada:
rYT=lm(serie_des~Time) #recta de regresion
rYT
##
## Call:
## lm(formula = serie_des ~ Time)
##
## Coefficients:
## (Intercept) Time
## -11485.744 5.743
coef=as.vector(rYT$coefficients) #extraigo los coeficientes
coef
## [1] -11485.743626 5.742901
a=coef[1]
b=coef[2]
a
## [1] -11485.74
b
## [1] 5.742901
5.4 Representacion grafica de la serie
Pintamos la serie y su tendencia. Para configurar el grafico tendremos en cuenta que lty es el tipo
de lnea, col el color de la lnea e ylim el rango.
10
plot(serie1,type="l",ylim=c(min(serie1),max(serie1)))
par(new=TRUE) #comando para hacer un plot encima de otro
plot(a+b*Time,type="l",lty=2,col=2,ylab="",ylim=c(min(serie1),max(serie1)))
Time
serie
1
2002.5 2003.0 2003.5 2004.0 2004.5 2005.0 2005.5
1015
2025
30
Time
2002.5 2003.0 2003.5 2004.0 2004.5 2005.0 2005.5
1015
2025
30
5.5 Predicciones
Seleccionamos un instante t donde queremos realizar la prediccion. Por ejemplo, el trimestre siguiente
al ultimo de nuestra serie.
11
t=length(serie1)+1
serie1 termina en el tercer trimestre. El trimestre siguiente a predecir sera el cuarto, por lo que la
estacion y el instante de tiempo a utilizar en la prediccion seran frec = 4 y t = 2005.75.
frec=4
t=2005.75
tsecular=a+b*t #calculo la tendencia secular
prediccion=tsecular*varest1[frec] #predigo
12