DATATUR. SISTEMA DE INFORMACIÓN DE ESTADÍSTICAS …

20
Estudios Turísticos, n." 142 (1999), pp. 37-56 Instituto de Estudios Turísticos Secretaría de Estado de Comercio, Turismo y Pymes DATATUR. SISTEMA DE INFORMACIÓN DE ESTADÍSTICAS TURÍSTICAS Jorge Rubio Navarro y Jesús Quereda Rubio* Resumen. Este artículo describe el proyecto realizado en el Instituto de Estudios Turísticos para el desarrollo del Sistema de Información de Estadísticas Turísticas (en adelante DATATUR). El Instituto de Estudios Turísticos dispone de un enorme volumen de información estadística procedente fundamentalmente de sus dos es- tadísticas Frontur y Familitur, así como de la reelaboración de fuentes secundarias procedentes de otros organismos nacionales, autonómicos e internacionales. Todos estos datos tanto internos como los procedentes de fuentes externas se encuentran dispersos por la organización en formato digital, texto, documental, gráficos o imágenes, con lo que se hace imprescindible crear una plataforma común capaz de concentrar toda la información disponible. Esto se traduce en un gran "almacén de datos para el sector turístico" que sería el punto de inicio de una "nueva explotación de la in- formación, orientada al conocimiento y a la toma de decisiones". El proyecto consiste en la creación de un banco de datos estadístico mediante la utilización de las técnicas de la llamada Inteligencia Em- presarial o Bussines Inteligence constituyendo, en terminología de la citada tecnología, un Data Warehouse en todas sus fases. DATATUR permitirá entre otros, la explotación de la información del Sistema de Indicadores Económicos para el análisis del Turismo de- finido por el Instituto de Estudios Turísticos. I. INTRODUCCIÓN El Sistema de Información de Estadísti- cas Turísticas DATATUR, se constituye como un gran Almacén de Datos Estadísti- cos con un carácter principal de consulta y extracción de los mismos para su análisis con herramientas diseñadas para tal fin. Este Almacén o Banco de Datos tiene que considerar los datos estadísticos en sí mis- mos, así como todos los registros de notas documentales necesarios para su correcto entendimiento. El Objetivo final del proyecto es por tanto la construcción e implantación de un Sistema de Información de Estadísticas Tu- rísticas (en adelante DATATUR) que inte- gre de forma armoniosa datos estadísticos y datos documentales. Tiene que cubrir las si- guientes funciones: • Conservar y mantener al día los datos estadísticos, complementados con las correspondientes informaciones docu- mentales para su correcta utilización. • Facilitar un sistema de actualización ágil y libre de errores. • Cubrir las demandas externas de infor- mación coyuntural turística. • Alimentar de forma automática las pu- blicaciones e informes periódicos que elabora el IET. * Jorge Rubio Navarro. Subdirector Adjunto del Instituto de Estudios Turísticos (IET). Jesús Quereda Rubio. Jefe de Servicio de Análisis Sectoriales del IET. 37

Transcript of DATATUR. SISTEMA DE INFORMACIÓN DE ESTADÍSTICAS …

Estudios Turísticos, n." 142 (1999), pp. 37-56Instituto de Estudios Turísticos

Secretaría de Estado de Comercio, Turismo y Pymes

DATATUR. SISTEMA DE INFORMACIÓNDE ESTADÍSTICAS TURÍSTICAS

Jorge Rubio Navarro y Jesús Quereda Rubio*

Resumen. Este artículo describe el proyecto realizado en el Instituto de Estudios Turísticos para el desarrollo del Sistema de Informaciónde Estadísticas Turísticas (en adelante DATATUR).

El Instituto de Estudios Turísticos dispone de un enorme volumen de información estadística procedente fundamentalmente de sus dos es-tadísticas Frontur y Familitur, así como de la reelaboración de fuentes secundarias procedentes de otros organismos nacionales, autonómicose internacionales.

Todos estos datos tanto internos como los procedentes de fuentes externas se encuentran dispersos por la organización en formato digital,texto, documental, gráficos o imágenes, con lo que se hace imprescindible crear una plataforma común capaz de concentrar toda la informacióndisponible. Esto se traduce en un gran "almacén de datos para el sector turístico" que sería el punto de inicio de una "nueva explotación de la in-formación, orientada al conocimiento y a la toma de decisiones".

El proyecto consiste en la creación de un banco de datos estadístico mediante la utilización de las técnicas de la llamada Inteligencia Em-presarial o Bussines Inteligence constituyendo, en terminología de la citada tecnología, un Data Warehouse en todas sus fases.

DATATUR permitirá entre otros, la explotación de la información del Sistema de Indicadores Económicos para el análisis del Turismo de-finido por el Instituto de Estudios Turísticos.

I. INTRODUCCIÓN

El Sistema de Información de Estadísti-cas Turísticas DATATUR, se constituyecomo un gran Almacén de Datos Estadísti-cos con un carácter principal de consulta yextracción de los mismos para su análisiscon herramientas diseñadas para tal fin.Este Almacén o Banco de Datos tiene queconsiderar los datos estadísticos en sí mis-mos, así como todos los registros de notasdocumentales necesarios para su correctoentendimiento.

El Objetivo final del proyecto es portanto la construcción e implantación de unSistema de Información de Estadísticas Tu-rísticas (en adelante DATATUR) que inte-

gre de forma armoniosa datos estadísticos ydatos documentales. Tiene que cubrir las si-guientes funciones:

• Conservar y mantener al día los datosestadísticos, complementados con lascorrespondientes informaciones docu-mentales para su correcta utilización.

• Facilitar un sistema de actualizaciónágil y libre de errores.

• Cubrir las demandas externas de infor-mación coyuntural turística.

• Alimentar de forma automática las pu-blicaciones e informes periódicos queelabora el IET.

* Jorge Rubio Navarro. Subdirector Adjunto del Instituto de Estudios Turísticos (IET).Jesús Quereda Rubio. Jefe de Servicio de Análisis Sectoriales del IET.

37

Jorge Rubio Navarro y Jesús Quereda Rubio

• Permitir el acceso a la información, sutabulación, representación gráfica ynavegación por los datos así cómo suposterior tratamiento mediante herra-mientas de análisis final.

• Definir y desarrollar los procesos decarga de información en el Sistema detal manera que queden integrados enlos actuales procedimientos de genera-ción de datos estadísticos del IET.

Para el desarrollo del banco de datos es-tadístico, se utilizarán las técnicas de la lla-mada Inteligencia Empresarial o BussinesInteligence constituyendo, en terminologíade la citada tecnología, un Data Warehouseen todas sus fases.

Se pretende en primer lugar incorporar lamultiplicidad de tablas estadísticas deriva-das de la explotación de las encuestas pro-pias del IET, así como todos los productosestadísticos identificados que permita ela-borar el Sistema de Indicadores Económi-cos especificado por el IET.

El sistema de información debe permitirtambién acceder, con la definición de dere-chos y accesos bien diferenciados a las dis-tintas bases de datos (datos primarios y da-tos agregados), una vez eliminadas todas lasinformaciones y referencias de los titularesa fin de salvaguardar el secreto estadístico.

Siendo el objetivo principal del proyectoel diseño de un Sistema de Información deEstadísticas Turísticas, el IET dispone en laactualidad de una Base de Datos Documen-tal con más de 65.000 referencias y de unSistema de Información Geográfica (SIG)

para el Análisis del Turismo, que se preten-den integrar y ampliar en el Sistema de In-formación.

La nueva estrategia de desarrollo estadís-tico en el área de turismo incluye no solouna política de transparencia metodológicasino, también, una actitud de puertas abier-tas en cuanto a la accesibilidad a la riquezade información que es posible suministrar.

Por tanto, el Sistema de Información deEstadísticas Turísticas debe permitir comoflujo de salida a parte de otros (informes ypublicaciones periódicas), la difusión de lainformación elaborada a partir de sus basesde datos en los sistemas web internet, intra-net y extranet del IET, definiendo los nive-les de acceso adecuados.

II. ENTORNO ADMINISTRATIVO YFUNCIONAL

El Instituto de Estudios Turísticos (IET),depende directamente de la Secretaría deEstado de Comercio Turismo y de la Peque-ña y Mediana Empresa del Ministerio deEconomía y Hacienda. Su función princi-pal, dentro de la Administración Generaldel Estado es la investigación, el análisis ydifusión de los factores económicos y so-ciológicos del turismo.

El Instituto de Estudios Turísticos (IET)además de ser un órgano de elaboración yde producción de datos, tiene entre sus fun-ciones la de difundir información sobre el

38 Estudios Turísticos, n.° 142 (1999)

DATATUR. Sistema de información de estadísticas turísticas

turismo entre el sector turístico público yprivado, otros departamentos de la adminis-tración española, los organismos regionalesexistentes en cada una de las 19 Comunida-des- ciudades Autónomas, la red de 27 Ofi-cinas de Turismo de España en el extranje-ro, la Unión Europea y otros OrganismosInternacionales.

En materia de estadísticas de turismo elIET desde 1996 diseña y gestiona dos opera-ciones estadísticas básicas sobre la demandaturística ("Movimientos Turísticos en Fronte-ra" y "Movimientos Turísticos de los Españo-les" -Frontur (1) y Familitur (2), respecti-vamente-) que cuantifican mensualmente losflujos de viajes y viajeros nacionales e inter-nacionales y analizan su comportamiento.Además realiza mensualmente re-explota-cion y análisis de fuentes secundarias: En-cuesta de Ocupación Hotelera (EOH) e índi-ce de Precios de Consumo ( IPC) del INE,Ingresos y pagos por turismo de la Balanzade Pagos que permite el seguimiento coyun-tural de las principales macromagnitudes tu-rísticas. Por otra parte ha diseñado un Pro-grama de Trabajo para la creación de unSistema de Indicadores Nacionales para elanálisis de la economía del turismo con elobjetivo de elaborar las Cuentas Satélite delTurismo de España (3) (CST-E).

La importancia que representa el turis-mo en la economía de nuestro país y las pre-visiones de crecimiento de esta actividad anivel mundial y fundamentalmente en Es-paña han acelerado la demanda de informa-ción de carácter estadístico que permitamedir de forma rigurosa el impacto del tu-rismo en la economía y conocer su evolu-

ción a fin de diseñar estrategias políticas yempresariales.

El Instituto de Estudios Turísticos difun-de los datos estadísticos a través de sus pu-blicaciones oficiales y a través del servidorweb de información sobre estudios y esta-dísticas del turismo. Desde octubre de 1997ha recibido, en sus primeros 20 meses deexistencia, cerca de 70.000 accesos. El ser-vidor web permite las consultas on line alCentro de Documentación Turística de Es-paña y el acceso a otros centros de informa-ción similares.

III. ENTORNO TECNOLÓGICO

El IET ha desarrollado en los últimos dosaños un sistema capaz de soportar la gestióny difusión de su información. Este sistematiene tres objetivos claros:

• Gestionar un gran volumen de infor-mación. Las dos operaciones estadísti-cas de las que es responsable el IET,han generado en sus años de vida unagran cantidad de datos, tales como fi-cheros de datos primarios, ficheros defuentes secundarias al IET, ficheros dedatos resultado de la explotación esta-dística, etc.

• Integrar las distintas fuentes de infor-mación externas e internas. Ha sidonecesario establecer los mecanismosadecuados de transformación de losdistintos ficheros de datos, a fin de quepuedan ser utilizados por parte del per-

Estudios Turísticos, n.° 142 (1999) 39

Jorge Rubio Navarro y Jesús Quereda Rubio

sonal investigador, con los estándaresinformáticos definidos en el IET.

• Posibilitar la rápida difusión de los re-sultados. Es imprescindible hoy en díadisponer de las herramientas adecua-das para la difusión de datos mediantela utilización de las nuevas tecnologíasde la información. En este sentido elIET ha desarrollado servidores Web deinternet, intranet y extranet, que admi-nistra y alimenta directamente.

El sistema informático del IET está for-mado por cuatro grandes subsistemas:

• TURSET. Sistema de Gestión y consul-ta de las estadísticas de turismo. Es unsistema considerado de gestión internaen el IET. Su función principal es la deservir de repositorio de todas las tablasestadísticas generadas mes a mes en laoperación estadística Frontur. Graciasa él es posible localizar cualquier tablao conjunto de tablas correspondientesal plan de explotación Frontur.

• SIGTUR (4). Sistema de informacióngeográfica para el análisis del turismo.

• SISTEMA DOCUMENTAL DELCDTE. Base de datos de referencias bi-bliográficas. Tiene más de 65.000 refe-rencias documentales informatizadasen nueve catálogos, y más de 400 títu-los de revistas especializadas, de lasque se hace vaciado de artículos.

• SERVICIOS INTERNET. Sistemapara la difusión de las estadísticas y es-tudios del turismo.

El IET ha desarrollado las infraestructu-ras de red necesarias por una parte para lapropia gestión interna y el trabajo de los in-vestigadores y por otra para las comunica-ciones con otros organismos y empresascon los que se relaciona.

El IET dispone de una red privada consus propios servidores que dan soporte a lasaplicaciones y ficheros utilizados por elpersonal de gestión e investigador. Hay quedestacar, por su importancia, el servidor decorreo electrónico utilizado para el correointerno y para el correo internet, el servidorde la base de datos documental SABINI, ylos servidores Web para intranet/extranet einternet.

El IET a su vez está integrado en la redprivada de datos que dispone la Secretaríade Estado de Comercio Turismo y de laPyme (SECTYP), mediante esta red se tieneacceso directo a las Oficinas Españolas deTurismo en el extranjero (OETS), a las Ofi-cinas de Comercio (OFCOME) y a los dis-tintos organismos de la SECTYP (ICEX,Servicios Centrales, etc). Toda la red de laSECTYP comparte el mismo sistema de co-rreo electrónico (5) (cerca de 2000 buzonesinternos), así como un plan de Direcciona-miento de red IP propio (Diseñado a partirde las especificaciones del MAP), la red dela SECTYP tiene su propia intranet de lacuál forman una parte importante los infor-mes y datos proporcionados por el IET. Estared está considera la mayor red privada in-ternacional que tiene la Administración Es-pañola.

Aparte de pertenecer de forma activa a lared de la SECTYP, la red del edificio de

40 Estudios Turísticos, n.° 142 (1999)

DATATUR. Sistema de información de estadísticas turísticas

TURESPAÑA tiene un enlace permanentede alta velocidad (Frame Relay de 2 Mb)con infovía-plus, que provee de acceso deentrada / salida a la red internet.

Para evitar los posibles problemas de se-guridad que conlleva el acceso a internet, seha configurado un servidor cortafuegos (Fi-rewall), que establece tres zonas de red dis-tintas: La red privada, donde se ubican losservidores principales y las estaciones detrabajo, la red DMZ o zona desmilitarizada,en donde se ubican los servicios internet ac-cesibles por los usuarios externos y la ZonaInternet. Mediante esta configuración, sólose permite el acceso de usuarios de la zonainternet a la zona DMZ, y se evita cualquieracceso prohibido de la zona internet a la redprivada.

IV. DESCRIPCIÓN FUNCIONALDEL SISTEMA

El Sistema de Información de Estadísti-cas Turísticas tendrá como núcleo principallos datos e indicadores producidos en elÁrea de Estudios e Investigación del IET ensus dos operaciones estadísticas Frontur yFamilitur, los datos que gestiona en la ac-tualidad la aplicación TUR_SET , los datosde las fuentes estadísticas identificadas enel IET y los datos documentales necesariospara la correcta explotación del DATATUR.Para la construcción del Sistema de Infor-mación de Estadísticas Turísticas (DATA-TUR) es necesario considerar:

1. Diferenciación de dos tipos de datosbien identificados. Datos primariosreferentes a unidades individuales ge-

nerados a partir de las encuestas de lasoperaciones estadísticas Frontur yFamilitur y datos agregados genera-dos en forma de tablas estadísticas apartir de los anteriores. La gran dife-rencia entre los dos tipos se encuentrafundamentalmente en su grado deconfidencialidad, su estructura, nece-sidades de flexibilidad de su explota-ción, herramientas informáticas parasu gestión y vistas lógicas que propor-cionan a sus usuarios.

2. La identificación de dos conjuntos deinformación tan diferenciados hacerecomendable en principio la separa-ción lógica de los mismos en tres ba-ses de datos distintas dentro del DA-TATUR: Base de Datos primarios,Base de Datos de Agregados y unaMetabase (información de múltiplesfuentes internas y externas al IET, ne-cesarias para el análisis del Turismo).

Las dos primeras bases de datos se-rán de tipo relacional, que permita lacaptura y depuración de los datos pri-marios de forma eficiente, y el alma-cenamiento de las tablas de datosagregados definidas en los planes deexplotación de las operaciones esta-dísticas del IET. El análisis de estasbases de datos permitirá definir los fil-tros, realizar operaciones de agrega-ción y desagregación, y utilizar herra-mientas estadísticas para el análisis deseries y multivariables.

Base de Datos de Primarios o mi-crodatos. La información básica alma-cenada corresponde al fichero final de

Estudios Turísticos, n.° 142 (1999) 41

Jorge Rubio Navarro y Jesús Quereda Rubio

datos muéstrales donde los registroshan sido convenientemente anonimiza-dos para garantizar el secreto estadísti-co. La Base de Datos de Primarios per-mitirá al usuario final:

• Realizar las operaciones necesariaspara agregar los datos según los cri-terios que desee.

• Seleccionar bloques de registrosque cumplan determinadas condi-ciones.

• Realizar funciones de cálculo so-bre los bloques de registros selec-cionados.

Para evitar los problemas de confi-dencialidad y otros errores derivadosde la explotación de la Base de Datosde primarios, se realizará:

• Control de las operaciones que se-leccionen un número pequeño deregistros (para guardar la confiden-cialidad al máximo).

• Dar a conocer los errores de mues-treo de la información agregada ob-tenida mediante la explotación delos microdatos.

• Generación de toda la documenta-ción necesaria para que el usuariopueda conocer todos los aspectosmetodológicos y técnicos de la ope-ración estadística en cuestión.

La explotación de la Base de Datosde Primarios quedará restringida al

personal técnico del IET y, sólo oca-sionalmente y por concesión puntualde dicho derecho, por técnicos deotras instituciones, sujetándose ex-presamente a guardar secreto estadís-tico.

Base de Datos de Agregados. Lainformación básica almacenada secorresponderá al fichero de datosagregado obtenido mediante explo-tación estadística de los microdatosy otras fuentes. Los problemas deconfidencialidad y errores de mues-treo no existen en ésta Base de Da-tos, sólo se almacenará aquella in-formación que el IET consideredifundible.

El objetivo último es incorporar alDATATUR cualquier tipo de informa-ción estadística ya elaborada que per-mita conocer la realidad turística y susrelaciones con el resto de las activida-des socioeconómicas.

La tercera a considerar es la Metaba-se, base de datos desarrollada contecnología de Almacén de Datos oData Warehouse DW, orientada alanálisis multidimensional, que secargue principalmente a partir de lasdos bases de datos anteriores, de ladocumentación existente en el IET(estudios e investigaciones de otrosorganismos), de las fuentes de datosexternas al IET en distintos formatos,que gestione la información n-di-mensional de una forma eficiente yflexible, permitiendo su adecuadoanálisis y difusión. Esta Metabase

42 Estudios Turísticos, n.° 142 (1999)

DATATUR. Sistema de información de estadísticas turísticas

con una confidencialidad baja tendríacomo objetivo:

• Análisis y difusión de datos a usua-rios finales.

• Proporcionar a los usuarios unafuente de información integrada.

• Agilizar los procesos de obtenciónde información.

• Proporcionar a los usuarios las he-rramientas necesarias de análisisde datos que les permita ser auto-suficientes.

4. El contenido del DATATUR, quedaestructurado en los siguientes grandessubsistemas:

• el generado por los trabajos decampo de las distintas operacionesestadísticas (datos de encuestas)

• el generado por explotación directade las Encuestas del IET

• el generado por explotación directade datos originales de encuestas nogestionadas por el IET (en este casoes necesario disponer de datos pri-marios originales)

• el constituido por datos estadísticosprocedentes de publicaciones o fi-cheros informáticos, catalogadosen la Base de Datos Documentaldel IET (datos estadísticos deCCAA u otros organismos de inte-rés para el análisis del turismo)

V.

• el subsistema de indicadores eco-nómicos definidos en el proyectoSINTUR (6) del IET

• el subsistema correspondiente a laoperación Empleo (7)

• el subsistema de fuentes secunda-rias necesarias para el análisis delSistema de Indicadores Económi-cos y para el análisis SIG del Turis-mo y Territorio

• el subconjunto de demandas efec-tuadas por usuarios que, ajuicio deladministrador del DATATUR, de-ban guardarse para su posterior ex-plotación.

ESQUEMA CONCEPTUAL.DATATUR

Una vez definidos los productos de in-formación que el sector y las Administra-ciones necesitan y que tienen como ele-mento integrador y núcleo el Sistema deIndicadores para el Análisis del Turismo sedesarrollan los subsistemas de informaciónque lo conforman. El principal de ellos esel almacén de datos para el sector turísticoque integrará los distintos tipos de datostanto procedentes de fuentes internas comoexternas así como sus distintos formatos(digital, texto, gráficos, imágenes, docu-mental etc.). Este almacén de datos será elinicio de una nueva explotación de la infor-mación, orientada al conocimiento y a latoma de decisiones.

Estudios Turísticos, n.° 142 (1999) 43

Jorge Rubio Navarro y Jesús Quereda Rubio

USUARIO FINAL

ANÁLISIS Y DIFUSIÓNDE DATOS.

DECISIONESEIS

INFORMACIÓNDSS

DATOSQUER

METADATOS

ELABORACIÓN, TRANSFORMACIÓN E INCORPORACIÓN

PRODUCTOS DE INFORMACIÓN

Esquema conceptual DATATUR.

QUERY (consultas e informes), enfocado al usuario final no experto. Ofrecería un nivel mínimo de información con consultas ad hoc e infor-mes predefinidos.DSS (nivel de decisión), enfocado a usuarios expertos de nivel medio/alto. Ofrecería un análisis complejo de los datos orientado a la investiga-ción y a las líneas de negocio.EIS (nivel ejecutivo), enfocado a usuarios directivos. Ofrecería acceso a la información estratégica para la toma de decisiones, con datos depu-rados, sumarizados y con perspectiva histórica y que permitirían el análisis predictivo.

44 Estudios Turísticos, n.° 142 (1999)

DATATUR. Sistema de información de estadísticas turísticas

FUENTES DE DATOS NECESARIASPARA LA CONSTRUCCIÓNDEL SISTEMA DE INFORMACIÓNDATATUR

Tal y como se ha dicho anteriormente,DATATUR tendrá cómo núcleo principallos datos primarios, los datos agregados losdatos gestionados por la aplicaciónTUR_SET , los datos de fuentes externas alIET y los datos documentales necesarios. Acontinuación se detallan y se cuantifican es-tas fuentes de datos:

• Datos Gestionados por la aplicaciónTUR_SET: Es una aplicación que sedesarrolló en el IET para permitir queusuarios no informáticos pudieran ob-tener explotaciones estadísticas perió-dicas de la operación de MovimientosTurísticos en Fronteras (Frontur) di-rectamente gestionadas por el propioInstituto.

Además de la obtención de las explota-ciones citadas, la aplicación crea un entornode gestión y consulta de todas las tablas es-tadísticas ligadas a la operación Frontur quefacilita las tareas de usuarios no experimen-tados.

Para realizar los necesarios, y en ocasio-nes complejos, procesos de tratamiento es-tadístico de la información, ésta aplicaciónutiliza el conocido paquete estadísticoSPSS, que ejecuta automáticamente los pro-cesos previamente definidos.

La funcionalidad actual de la aplicaciónTUR_SET tiene que quedar recogida en elSistema de Información de Estadísticas Tu-

rísticas en lo que denominamos bases dedatos de primarios y bases de datos de agre-gados. La tabla siguiente muestra el volu-men actual de tablas gestionadas porTUR SET:

PROCEDIMIENTO

Entrada de viajeros (elevadas)Datos de Avance

Entrada de viajeros (elevadas)Datos Definitivos

Entrada de viajeros (muéstrales)

Explotación D.G.T. -Aforos de la Encuesta

Comportamiento de losvisitantesEncuesta de salidas

Temporada de verano

Temporada de invierno

Total anual

Distribución de Resultados

Tablas de Análisis

Total

Total Registros (aprox. 40 portabla)

N"TABLAS

35

35

15

14

55

62

62

62

31

-

PERIO-DICIDAD

Mensual

Mensual

Mensual

Mensual

Trimestral

Anual

Anual

Anual

Mensual

-

TOTALACTUAL

2.100

2.100

900

840

1 100

310

310

310

1.860

720

10.550

422.000

• Datos de Fuentes estadísticas: Reco-pilación (8) de fuentes estadísticastanto oficiales como privadas, que seconsideran más relevantes para el co-nocimiento y el análisis de la realidadsocio-económica de la economía delturismo y a las que los usuarios pue-den tener acceso. Se incluyen comofuentes estadísticas aquellas operacio-nes que se traducen en la captura y/uordenación de un conjunto de datosestructurados con un fin preciso y quereúne unas mínimas condiciones derigor en el proceso de su obtención ytratamiento. Se distinguen siete tiposdiferentes:

Estudios Turísticos, n.° 142 (1999) 45

Jorge Rubio Navarro y Jesús Quereda Rubio

- Publicaciones de contenido estadís-tico.

- Estadísticas derivadas de registros/procesos administrativos.

- Estadísticas derivadas de encuestas.- Estadísticas derivadas de demandas

de información turística.- Censo o directorio.- Síntesis estadística.- Bases de datos de contenido esta-

dístico.

Las guías de fuentes producidas en elIET incluyen 320 fichas descriptivas defuentes estadísticas. Las fuentes tienen queestar accesibles desde el Sistema de Infor-mación de Estadísticas Turísticas, primero anivel de referencia documental y segundo,es necesario vaciar su contenido en el Siste-ma de Información con la periodicidad deaparición de cada fuente, de tal forma quese puedan localizar y explotar los datoscontenidos en cada una de ellas.

Volumen de datos contenidos en lasfuentes estadísticas:

- Na de fuentes: 320.- Ns de tablas/fuente (media): 200.- N2 de registros por tabla (media): 40.- Periodicidad: mensual como la más

baja.- Registros disponibles (sin tener en

cuenta la periodicidad): 2.560.000.

• EMPLEO (9): El estudio del empleoen el sector Turístico iniciado en elIET dentro del programa SINTUR, in-cluye tres líneas de acción encamina-das a un mejor conocimiento del em-pleo en la industria turística:

- estimar el número de personas emplea-das en el conjunto del año

- precisar el número y tipología de loscontratos realizados a lo largo del año

- conocer las características personales,cualificación laboral y remuneraciónsalarial de los trabajadores ocupados

El estudio del empleo además de permitirelaborar la tabla correspondiente en la futu-ra Cuenta Satélite del Turismo, tiene laenorme potencialidad de servir como basepara el análisis del mercado de trabajo de unconjunto de actividades que hasta fechasmuy recientes no ha encontrado un marcoestadístico de referencia para que la indus-tria turística pueda ser tratada de manera se-mejante a como lo son la agricultura, la in-dustria, o la construcción.

Se trata de un Proyecto que se concreta,en su primera etapa, en la elaboración demás de 20 tablas con datos procedentes deDATATURe fuentes estadísticas elaboradaspor el INE, Ministerio de Trabajo y AsuntosSociales e Instituto de Estudios Fiscales.

La información que se va a utilizar iráalimentando el Sistema de Información deEstadísticas Turísticas DATATUR, servirácomo consulta para abordar posteriores es-tudios sobre la población empresarial delsector turístico, los niveles de cualificaciónlaboral de la fuerza de trabajo asociada alturismo, la especialización territorial de es-tos trabajadores, sus condiciones laborales,y todo un largo conjunto de estudios que elIET va a impulsar una vez que finalice eldesarrollo del DATATUR.

46 Estudios Turísticos, n.° 142 (1999)

DATATUR. Sistema de información de estadísticas turísticas

Se incluyen por su importancia las 10fuentes utilizadas en la operación Empleo:

Fl. Encuesta de Población Activa.

F2. Encuesta de Coyuntura Laboral.

F3. Afiliación de Trabajadores al Siste-ma de Seguridad Social.

F4. Encuesta de Salarios en la Industriay los Servicios.

F5. Empleo, Salarios y Pensiones en lasFuentes Tributarias.

F6. Empresas inscritas en la SeguridadSocial.

F7. Directorio Central de Empresas.

F8. Estadística de Contratos Registrados.

F9. Empresas de Trabajo Temporal.

• Base de datos documental producidaen el IET por el Centro de Documen-tación Turística de España CDTE. ElCDTE tiene 65.000 referencias docu-mentales informatizadas en nueve ca-tálogos, y más de 400 títulos de revis-tas especializadas, de las que se hacevaciado de artículos. El fondo docu-mental está informatizado con el Sis-tema de Automatización de Bibliote-cas SABINI.

La base de datos documental del CDTEtiene que integrarse en el Sistema de Infor-mación de Estadísticas Turísticas de tal for-ma que sea posible localizar cualquier refe-rencia documental relativa al análisis dedatos que realicen los usuarios.

ÁREAS DE ANÁLISISIDENTIFICADAS

El DATATUR tiene que dar solución alos siguientes análisis identificados y queconstituyen el plan estratégico del IET enlos próximos 3 años.

• INDICADORES ECONÓMICOS (10):El sistema de información debe con-templar las diecinueve tareas que elInstituto de Estudios Turísticos consi-dera necesarias para la creación, a unmedio plazo, de un Sistema de Indica-dores para el Análisis del Turismo. Setrata de campos en los que el IET havenido trabajando en los últimos dosaños, bien en su definición o en su im-plantación operativa.

Para ello será necesario definir loscálculos de los indicadores de análisisya definidos por el IET, que permitencuantificar y evaluar el impacto eco-nómico del turismo en la economíanacional, a partir de los datos origenincorporados al sistema. Los indica-dores iniciales a considerar están re-cogidos en la siguiente tabla de formaresumida (11).

Dada la importancia del estudio del em-pleo en el sector turístico, y del análisis delturismo y territorio, se desarrollan a parteestos dos puntos:

• TURISMO Y TERRITORIO. Propor-cionar los datos desagregados necesa-rios para el estudio del fenómenoturístico a un nivel de comunidad autó-

Estudios Turísticos, n.° 142 (1999) 47

Jorge Rubio Navarro y Jesús Quereda Rubio

Descripción del Indicador

Demanda

Entrada de visitantes no residentes

Comportamiento de los visitantes

Viajes y comportamiento turístico de los.españoles

Viajeros alojados en establecimientos colectivos y.ocupaciónhotelera

Empleo en las actividades turísticas

Evolución de los precios turísticos

Previsiones para las temporadas turísticas

Estructura y Actividad Empresarial

Resultados de la actividad de las empresas y establecimientosturísticos

Caracterización empresariales

Actuaciones estratégicas

Infraestructuras Turísticas

Registro de alojamiento turístico de uso colectivo (hoteles,campings,Directorios estadísticos, apartamentos y alojamiento

rural)

Alojamientos no colectivos (segundas viviendas de uso turístico,apartamentos en tiempo compartido)

Otros equipamientos de uso turístico (puertos deportivos, golf,parques temáticos, ...)

Construcción residencial asociada al turismo

Mercados Emisores

Informes sobre el turismo en mercados emisores

Estudio de los mercados potenciales y preferencias de losconsumidores finales

Destinos y Productos Turísticos

Evaluación de la eficiencia de la correspondiente campaña depromoción

Incremento estimado de demanda en destinos o producios

Turismo y Territorio

Indicadores poblacionales

Estructura de alojamientos

Segunda residencia

Equipamientos

Sistemas fuentesrelacionados

FRONTUR

FRONTUR

FRONTUR

FAMILITUR

INE. FRONTUR. FAMILITUR

Datos INE, M° Trabajo, IEF

IPC(INE)

Aena, Informes de las Oets

INE, IEF, Encuestas

Directorios estadísticosINE.CCAA

CCAA, INE y otras encuestas

Asoc. Empresariales, registrosadministrativos

Estadísticas del M° de Fomento

IET, Turespaña

Nuevas encuestas

Fuentes externas

Diversas fuentes del INE, M°Fomento y otros organismos

48 Estudios Turísticos, n.° 142 (1999)

DATATUR. Sistema de información de estadísticas turísticas

noma, provincia o zonas turísticas. Se pre-tende un análisis de:

- Oferta. Las fuentes básicas de in-formación vendrán de los diferen-tes censos o directorios del INE(utilizados para la Encuesta deOcupación Hotelera) y Turespañatales como la guía de hoteles, cam-pings, apartamentos, agencias deviajes, etc.

- Ocupación: La fuente principalserá la Encuesta de Ocupación Ho-telera del INE.

- Gasto: Fuentes a utilizar Frontur,Familitur, datos de encuestas degasto familiar del INE.

- Indicadores: Se desarrollarán indi-cadores en el ámbito territorial, quepermitan estudiar su evolución deforma continua y precisa.

- Otras explotaciones: Cómo prin-cipio general, cualquier indicadoru operación que sea susceptible deser vinculada al territorio, será tra-tada con herramientas SIG. Se ten-drá en cuenta, por tanto, cualquieraspecto metodológico y técnico re-ferente al análisis geoespacial debases de datos multidimensio-nales.

PERFILES DE ACCESO AL SISTEMA

Existen básicamente dos grandes gruposde usuarios de DATATUR, que responden a

diferentes perspectivas sobre la forma deutilización del mismo:

— Usuarios de negocio. Todos aquellosusuarios que acceden a DATATURpara extraer y analizar información es-tratégica del sector turístico.

— Usuarios técnicos. Todos aquellosusuarios que construyen, gestionan ymantienen la información existente enDATATUR.

Vamos a analizar los perfiles de accesoen función de los dos tipos de usuarios:

Usuarios de Negocio. Se han identifica-do los siguientes tipos de acceso y explota-ción de la información

• No tendrán acceso a la Base de Datosde Primarios

• Consultas Libres. Los usuarios queresponden a este perfil analizan la in-formación existente en el DATATURcombinando de forma dinámica dife-rentes perspectivas o variables que in-fluyen en el valor de un determinadodato objeto de análisis. Entre otrasoperaciones se permitirá:

— Visualizar Datos— Agregar en filas o en columnas o en

cabecera:— Estados de una misma característi-

ca, nombrando el nuevo estado ypor sumatorio de los estados com-ponentes de la agregación

— Características por generación me-diante fórmula matemática o porcombinatoria de estados

Estudios Turísticos, n.° 142 (1999) 49

Jorge Rubio Navarro y Jesús Quereda Rubio

— Borrar en filas o en columnas o encabeceras, estados o característi-cas.

— Reordenar en filas o en columnas oen cabecera.

— Desagregar en filas o en columnaso en cabecera.

— Trasponer entre filas, columnas ycabecera.

— Cálculo básico en las variables decontenido de una tabla.

— En relación con dos tablas estadís-ticas:

— Cálculo básico en las variables decontenido de dos tablas

— Insertar, fundir entre dos tablas,añadir estados

— Concatenar, Yuxtaponer entre dostablas, añadir características

— Cálculo pseudo_matricial o tabular

• Sistema de Reporting e Informes pre-definidos. Informes con estructura fijay una periodicidad determinada. Ser-virán para realizar el seguimiento dela evolución del conjunto de indicado-res económicos con una periodicidaddefinida.

• Análisis Predefinidos. Es un tipo deanálisis cuya estructura general puedeestar previamente definida pero per-mite navegar por los datos para poderinvestigar con mayor detalle datos es-pecialmente relevantes o resultadosfuera de lo normal.

• Simulaciones o análisis "what if".Mediante este tipo de análisis se simu-lan situaciones variando el valor de undato determinado para analizar la for-ma en que influye en el resto de varia-bles consideradas.

• Análisis Predictivos. Mediante técni-cas de modelización analítica, se pue-den predecir resultados de las distin-tas acciones contempladas en elDATATUR.

Usuarios Técnicos. Se han identificadolos siguientes tipos de acceso y explotaciónde la información

• Generación de consultas directas a laBase de Datos. Dentro de este perfilse incluyen todos aquellos usuariosque construyen y ejecutan sentenciasSQL directamente sobre las bases dedatos; bien para la creación de infor-mes predefinidos, para la preparaciónde consultas complejas o para la opti-mización manual de consultas conalto coste para la Base de Batos.

• Construcción, Carga y Refresco deDATATUR. Usuarios que realizan lascargas y refresco periódico de los da-tos

• Administración y Gestión de DATA-TUR. Usuarios que realizarán todaslas tareas de administración y gestióndel DATATUR, procedimientos deBack-up, monitorización del rendi-mento, creación y mantenimiento delos perfiles de usuario y niveles de se-guridad y desarrollo de utilidades deprocesos de mantenimiento

• Consulta y extracción de datos de laBase de Datos de Primarios. Usuariostécnicos con funciones en estadísticadel IET.

Con el objeto de facilitar el análisis esta-dístico de la información contenida en Sis-tema de Información Estadísticas Turísticas

50 Estudios Turísticos, n. 142 (1999)

DATATUR. Sistema de información de estadísticas turísticas

con herramientas estándar tipo SPSS u otrasse ha previsto un procedimiento de enlaceque genere la información necesaria para eluso de dichas herramientas.

Los datos del Sistema de InformaciónEstadísticas Turísticas, se actualizarán pormétodos semiautomáticos de importaciónde datos, a partir de fuentes internas (casode Frontur y Familitur) o externas (las de-finidas para cada indicador). Se diseñaránlos procedimientos e interfaces de Extrac-ción, Transformación y Carga de los datosorigen en las distintas bases de datos delDATATUR. Sobre la base de lo anterior, secontempla en la creación de interfaces deusuario para la introducción manual deaquellos datos cuya carga automática no seaviable.

ARQUITECTURA DE DESARROLLOPROPUESTA. DATA WAREHOUSING

Desde la perspectiva de la tecnología infor-mática, el objetivo del data warehousing (12)es la distribución puntual de la informaciónprecisa a las personas adecuadas de la orga-nización. Éste es un proceso siempre conti-nuo, no una única solución, y requiere unplanteamiento distinto al desarrollo de sis-temas transaccionales.

Un data warehouse es una recopilaciónde datos para el soporte en la toma de deci-siones por parte de la dirección de la empre-sa y está orientado al negocio, integrado,variable en el tiempo y no volátil (13). Estosignifica que el data warehouse se focalizaen un concepto del negocio (por ejemplo,las ventas) y no en un proceso del negocio

(por ejemplo, la emisión de facturas), y quecontiene toda la información relevante so-bre el concepto que procede de múltiplessistemas de procesamiento. Esta informa-ción se recoge y se representa a intervalosde tiempo constantes, y no cambia rápida-mente.

Un data warehouse integra datos operati-vos con convenciones de nombres, medi-das, atributos físicos y semánticas coheren-tes. El primer paso para generar el datawarehouse es un proceso de gestión: deter-minar las áreas que deberían ser incluidas ydesarrollar un conjunto de definiciones con-sensuadas.

Para ello, es necesario entrevistarse conlos usuarios finales, analistas de negocio yejecutivos para conocer y documentar el al-cance de los requerimientos de la informa-ción. Únicamente después de un conoci-miento profundo de los aspectos delnegocio, puede traducirse el proceso lógicoa un data warehouse físico.

Después del diseño físico, se disponenlos sistemas para poblar (14) el data ware-house desde los sistemas operativos de for-ma continua. Debido a que las representa-ciones de los datos en los sistemas operativosy en el data warehousing son diferentes, po-blar el data warehouse requiere transformarlos datos: resumirlos, traducirlos, decodifi-carlos, eliminar los datos no válidos, etc. Es-tos procesos deben automatizarse para quepuedan realizarse de forma continua: extraer,transformar y migrar los datos originales conla frecuencia necesaria para satisfacer los re-querimientos de negocio del data ware-housing.

Estudios Turísticos, n.° 142 (1999) 51

Jorge Rubio Navarro y Jesús Quereda Rubio

Los datos en un data warehouse represen-tan información en un largo periodo de tiem-po, y se espera que esta información sea fielen un momento determinado. De hecho, eldata warehouse contiene una larga serie devistas (análisis multidimensional) sobre lasáreas más importantes del negocio.

Finalmente, la información se pone a dis-posición de los analistas y ejecutivos de laempresa para navegar, analizar y realizar in-formes. Como ayuda en la etapa de análisis,pueden utilizarse numerosas herramientas;desde sencillos generadores de informes,hasta herramientas avanzadas de data mi-ning (15) (minería de datos en base a técni-cas de inteligencia artificial, algoritmos es-tadísticos, etc). Sin embargo, las tareas de

análisis llevan a las iteraciones finales delproceso de data warehousing: modificar eldiseño del data warehouse para contenernueva información, mejorar el rendimientodel sistema o permitir nuevos tipos de análi-sis. Con estos cambios, el proceso se iniciade nuevo, y continúa durante toda la vidadel data warehousing.

Un data warehouse siempre incluye varioscomponentes (16), entre los que destacan:

• Fuentes de datos operativas

• Herramientas de diseño/desarrollo

• Herramientas de extracción y trans-formación de datos

"Building- -Using

ManagingData warehouse/data mart design

1Operational

data

1Data

transformationcleansing

1Datamarts

i

Informationdirectory

Usertools

Schema Transform Schedule Replication InfóTublish OLAP

Repository (persistent shared metadata)

Data warehouse management

Data flowMetadata flow

Fuente: Microsoft Data Warehousing Framework

52 Estudios Turísticos, n.° 142 (1999)

DATATUR. Sistema de información de estadísticas turísticas

• Sistema de gestión de base de datos

• Herramientas de acceso y análisis dedatos

• Herramientas de gestión del sistema

Para el desarrollo del Sistema de Infor-mación de Estadísticas Turísticas DATA-TUR, el Instituto de Estudios Turísticos haseleccionado el entorno de desarrollo Mi-crosoft Data Warehousing Framework (17),en base a su propia base de datos SQL Ser-ver 7.0 y OLAP Services, por ser una plata-forma de desarrollo abierta y disponer delas tecnologías necesarias para integrar pro-ductos de diversos fabricantes.

Se van a utilizar las técnicas de desarrollode Data Warehousing aplicadas a la cons-trucción de una banco de datos estadístico(DATATUR).

Para la creación de Data warehouses seutilizan bases de datos multidimensionales.Las bases de datos dimensionales almace-nan hechos relativos a la actividad empresa-rial, como por ejemplo las ventas en pesetasy unidades, en un contexto de dimensionescomo por ejemplo el tiempo, área geográfi-ca, demografía de clientes y productos. Aldescribir y almacenar los datos de estemodo, se pueden realizar consultas 'ad hoc'de alto rendimiento contra los datos.

Tecnologías de accesos a datos, análisisMultidimensional: los tres OLAPs

De forma sintética se puede decir que elanálisis multidimensional (18) consiste en

analizar los hechos económicos o, de otrostipos, desde la perspectiva de sus compo-nentes o dimensiones abarcando tambiénlos diferentes niveles que puedan tener lasrespectivas dimensiones. El análisis ha depoder ser de forma conjunta o individuali-zada. Esto quiere decir que se puede anali-zar a la vez desde la perspectiva de un com-ponente o de un conjunto de ellos.

Para un óptimo análisis, el esquema mul-tidimensional se ha de soportar en bases dedatos específicas llamadas BBDD multidi-mensionales. Estas BBDD almacenan losdatos en matrices o cubos hiperdimensiona-les. Los motores de estas bases de datosconstruyen los totales o agregaciones de losniveles superiores de cada dimensión. Estose hace tanto por motivos de agilidad comoporque las acumulaciones multinivel noacostumbran a ser posibles en grupos SQLpor operaciones.

El análisis multidimensional tiene comoprincipal característica la posibilidad de na-vegar a través de los datos moviéndose ver-ticalmente dentro de una dimensión, sumer-giéndose en los datos o emergiendo hacianiveles superiores, y moviéndose horizon-talmente pasando de una dimensión a otraobteniendo nuevas vistas. Se suelen utilizarlos términos sajones drill down y drillacross respectivamente.

Para al almacenamiento de los datos enformato multidimensional y facilitar un acce-so rápido a los mismos, se utiliza la tecnolo-gía OLAP (19) (On Line Analitical Process).

Existen tres tipos de almacenamiento dedatos dimensionales: OLAP multidimensio-

Estudios Turísticos, n.° 142 (1999) 53

Jorge Rubio Navarro y Jesús Quereda Rubio

Client(MiddleTier)

application

ADOMD

PivotTable Service

Server

RDBMS data sourceROLAP store

Fuente: Microsoft. Arquitectura de servicios OLAP

nal (MOLAP), OLAP relacional (ROLAP)y OLAP Híbrido (HOLAP).

MOLAP utiliza índices comprimidos yun motor de consulta optimizado para elformato de almacenamiento relevante. MO-LAP almacena agregaciones para facilitarun acceso rápido a los datos.

ROLAP almacena agregaciones en unabase de datos relacional operativa en tablasde resumen para acelerar el acceso a los da-tos. Esta técnica puede suponer la utiliza-

ción de mucho espacio en disco y normal-mente no es tan rápida como MOLAP.

HOLAP conserva las tablas de hechos enla base de datos origen y almacena las agre-gaciones siguiendo el modelo MOLAP. Al-gunos expertos opinan que esta solución re-coge las mejores características de MOLAPy ROLAP. No obstante si todas las agrega-ciones necesarias no están almacenadas enel Data Wrehouse, las consultas a nivel dedetalles de transacciones contra la base dedatos origen serán más lentas.

54 Estudios Turísticos, n.° 142 (1999)

DATATUR. Sistema de información de estadísticas turísticas

Local

Excel 9.0

Cube files

ISV Applications

ADO MD

ROLAP cubes

OLE DB for OLAPI

PivotTable Service - O OLE DB

1AnalysisSer ver

Fuente: Microsoft Arquitectura de Desarrollo en base a OLAP server.

La plataforma elegida para el desarrollode DATATUR (Microsoft OLAP server +SQL*Server 7.0) soporta los tres tipos deOLAP.

Las aplicaciones clientes se desarrollaráncon tecnología internet y serán accesiblesvía navegador o explorador. Estas aplica-ciones accederán a las funciones OLAP ser-ver a través del PivotTable service con laespecificación OLE DB para OLAP y elmodelo de datos ActiveX Data Objets Mul-tidimensional (ADO MD).

NOTAS Y BIBLIOGRAFÍA

(1) Estadística de "Movimientos Turísticos enFronteras". Documento de trabajo elaborado por elInstituto de Estudios Turísticos.

(2) Estadística de "Movimientos Turísticos delos Españoles". Documento de trabajo elaborado porel Instituto de Estudios Turísticos.

(3) Cuenta Satélite del Turismo. Marco Concep-tual. Organización Mundial del Turismo (OMT).1999.

(4) Metodología para el desarrollo del Sistemade Información Geográfica para el análisis del Turis-mo. Nota Técnica elaborada por el Instituto de Estu-dios Turísticos.

(5) Plan estratégico para la implantación de MSExchange en la SECTYP. 1998.

(6) Sistema de Indicadores Estadísticos para elAnálisis de la Economía del Turismo SINTUR: Unprograma de trabajo del Instituto de Estudios Turís-ticos para el período 1998-2000. Documento de tra-bajo elaborado por el IET.

(7) Aunque el empleo está contemplado comouno de los Indicadores Económicos dentro de SIN-TUR, la importancia de este estudio justifica la cre-ación de un subsistema exclusivo para él.

(8) Guía de Fuentes Estadísticas para la Econo-mía del Turismo y Fuentes Regionales de Informa-ción Cuantitativa sobre Turismo editadas por el IET.

Estudios Turísticos, n.° 142 (1999) 55

Jorge Rubio Navarro y Jesús Quereda Rubio

(9) Empleo y Turismo: Proyecto de investiga-ción en la perspectiva de la cuenta satélite del turis-mo. Documento de trabajo elaborado por el IET.

(10) Un Sistema de Indicadores para el Análisisdel Turismo: Proyecto de Trabajo. Instituto de Estu-dios Turísticos. Feb. 1999.

(11) Sistema de Indicadores Económicos. Infor-me ejecutivo. Instituto de Estudios Turísticos. Sept.1999.

(12) Joan Tort. La Arquitectura Data Warehousing.Una visión global. Novática mar./abr. 1999 n° 138.

(13) W.H. Inmon. Building the Data Warehouse1992.

(14) Gilí H.S, Rao P.C. Data Warehousing. Laintegración de información para la mejor toma dedecisiones. Prentice Hall, 1996.

(15) D.E. Goldberg. Genetic Algorithms in^se-arch, Optimization, and machine Learning. AddisonWesley, Reading, MA. 1989.

(16) J. Celko. Don't warehouse dirty data. Data-mation, 10 1995.

(17) Estrategia de Data Warehousing de Micro-soft: Una plataforma para mejorar la toma de deci-siones mediante un acceso a datos y un análisis másfácil. Microsoft 1999.

(18) R. Duro. Análisis Multidimensional. Nová-tica mar. / abr. 1999 n° 138.

(19) Chaudhuri, S. Y Dayal, U. An overview ofData Warehousing and OLAP Technology. ACMSIGMOD Record 26.

56 Estudios Turísticos, n.° 142 (1999)