TÍTULODEL PROYECTO: SISTEMA AUTOMATIZADO DE BÚSQUEDA WEB (WEB CRAWLERS) DE PROMOCIONES DE TICKETS...

Post on 26-Jan-2015

20 views 1 download

Transcript of TÍTULODEL PROYECTO: SISTEMA AUTOMATIZADO DE BÚSQUEDA WEB (WEB CRAWLERS) DE PROMOCIONES DE TICKETS...

TÍTULODEL PROYECTO:

“SISTEMA AUTOMATIZADO DE BÚSQUEDA WEB (WEB CRAWLERS) DE PROMOCIONES DE TICKETS AÉREOS Y PORTAL WEB PARA LA AGENCIA DE VIAJES Y TURISMO

MUNDO VALLE”.

Autor: Christian Córdova

1

Agenda

•Introducción.•Objetivo del Proyecto.•Algoritmo•Implementación•Presentación de la Aplicación•Conclusiones.

2

IntroducciónDefinición Web Crawlers

Es un programa que recorre las páginas del World Wide Web de forma metódica y automatizada, las descarga y procesa, comienzan visitando una lista de URL, identifican los hiperenlaces en dichas páginas y los añade a la lista a visitar de manera recurrente de acuerdo a determinado conjunto de reglas.

3

IntroducciónEntre ellos estan las arañas, bots, buscadores, web Crawlers.Algunas de las tareas más comunes de las arañas web están las

siguientes:Crear el índice de una máquina de búsqueda.Analizar los enlaces de un sitio para buscar links rotos.Recolectar información de un cierto tipo, como precios de

productos para recopilar un catálogo.

4

IntroducciónLos tipos de busqueda determinados para trabajar con las arañas web son:

Índices de BúsquedaMotores de BúsquedaMetabuscadores

5

Objetivo General del ProyectoAnalizar, Desarrollar e Implementar el Sistema Automatizado de

Búsqueda Web (Web Crawlers) de promociones de Ticket Aéreos y Portal Web para la Agencia de Viajes y Turismo Mundo Valle Cía. Ltda., mediante la utilización de software libre.

6

Objetivos Específicos Investigar los principios en los que se basan los algoritmos de

búsqueda de datos a través de grandes cantidades de información y seleccionar el más óptimo de ellos para este sistema.

Analizar la administración y funcionamiento de la Agencia.Desarrollar el portal web de la agencia y el pago en líneaImplementar y realizar las pruebas necesarias del sistema para

detectar problemas de rendimiento.

7

Conceptos Generales del Proyecto

8

Programa, que permite encontrar contenidos, archivos, páginas Web y demás recursos.

Desde el punto de vista del usuario no es más que una página Web, desde el punto de vista de una página Web.

9

BUSCADOR

SECUENCIA BÁSICA DE UN BUSCADOR

Pseudo-Algoritmo1. Inicializar las URLs2. Verificar la finalización, agregar a la pila3. Encontrar los enlaces4. Procesar las páginas5. Agregar las URLs a ser procesadas

** la pila contiene una lista para el web crawler de URLs no visitadas con nuevas páginas y enlaces.

11

BÚSQUEDA DE INFORMACIÓN

BÚSQUEDA DE INFORMACIÓN

MODELO MDA- DESARROLLO BASADO EN MODELOS

14

PROCESO DE DESARROLLO DE SISTEMA CON MDA

15

METODOLOGÍA MIDAS-MDA

16

PROCESO DE DESARROLLO DE MIDAS

17

FASES DEL MÉTODO DE INDUCCIÓN POR SIMPLE ENUMERACIÓN

1 Observación.

2 Formulación de Hipótesis

3 Definir Población

4 Selección Muestral

5 Procedimiento

6 Tratamiento Estadístico

7 Comprobación de Hipótesis

8 Conclusiones

18

LA WEB COMO MODELO DE GRAFO DIRIGIDO

19

RECORRIDO DE GRAFO DIRIGIDO

20

REPRESENTACIÓN DE UN SITIO WEB

21

1

2 3

4 5 6

7 8 9 10 11

12 13

POBLACIÓN

22

Ord Nombre

9Búsqueda binaria

recursiva

10Búsqueda por fuerza bruta, combinatoria o

exhaustiva

11 Tablas Hash

12Búsqueda

bidireccional

13Búsqueda por interpolación

14Búsqueda de

Fibonacci

15 Algoritmo de Dijkstra

16 Algoritmo de Johnson

Ord Nombre

17 Búsqueda de Grover

18 Algoritmo de Prim

19Algoritmo de Kruskal

20Algoritmo de

busqueda A*

21 Algoritmos IDA*

22 Poda alfa-beta

23 Algoritmo de Shor

24Algoritmo de

bellman-ford

Ord Nombre

1Búsqueda

secuencial

2Búsqueda secuencial

ordenada

3Búsqueda en profundidad

4 Búsqueda en amplitud

5Búsqueda de coste

uniforme

6Búsqueda en

profundidad limitada

7Búsqueda en

profundidad iterativa

8 Búsqueda binaria

SELECCIÓN DE LA MUESTRA

1 Búsqueda Secuencial

2 Búsqueda secuencial ordenada

3 Búsqueda en profundidad

4 Búsqueda en amplitud

5 Búsqueda de coste uniforme

6 Búsqueda en profundidad iterativa

7Búsqueda por fuerza bruta,

combinatoria o exhaustiva

8 Algoritmo de búsqueda A*

23

DIAGRAMA ESTADÍSTICO DE COMPLEJIDAD

24

COMPLEJIDAD DE LOS ALGORITMOS

25

ACTORES DEL SISTEMA

26

Administrar Usuarios

Administrar Portal Web

Registrarse

Reservar en Línea

Realizar Compra

Consultar Producto

Administrador

Cliente Registrado

Usuario No Registrado

Acceder al Sistema

Administrar Información

DirectivoGenerar Reportes

Agente de Viajes

Gestionar Información BuscadorValidar Usuario Sistema

DIAGRAMA DE CASOS DE USO

27

Pagar Compra

Buscador Turístico

Administrar Usuarios

Administrar Portal Web

Registrarse

Reservar en Línea

Realizar Compra<<include>>

Consultar Producto

Administrador

Cliente Registrado

Usuario No Registrado

Acceder al Sistema

<<include>>

Administrar Información

DirectivoGenerar Reportes

Agente de Viajes

Crear Información

Modificar Información

Eliminar Información

<<include>>

<<include>> <<include>>

Manipulación

Depuración

Interacción

Gestionar Información Buscador

<<include>>

<<include>> <<include>>

Validar Usuario SistemaConfirmar Solicitud de Usuario

<<include>>

ORGANIZACIÓN BÁSICA DEL SISTEMA

28

Cliente

Petición de página

Módulos y Componentes a configurados para mostrarse

ARQUITECTURA MVC

29

Depende de las ordenes del usuario para actuar sobre los datos interactuando con el modelo considerando el si se realiza un cambio en la vista o en el modelo.

Trabaja con los datos y los controla.No necesita conocer cual es el controlador o la vista.

DATOS

DEMANDA

RESPUESTA

SOLICITUD

CONTROLADOR

MODELO VISTA

Es la presentación al usuario a través del modelo.

ENTORNO DE TRABAJO

30

Entorno de PruebasEntorno de Aplicaciones

Entorno de Desarrollo

Desarrollador PHP

Base de Datosde Pruebas

Base de Datosde Aplicaciones

Base de Datosde Desarrollo

Navegador Navegador Navegador

Servidor:WEB

de páginas PHP

IDE de Programación:PhpEdit

Servidor de Tienda Online Servidor de Base de Datos

Servidor de Aplicaciones Web

Servidor de aplicaciones

DESARROLLO DE LA APLICACIÓN

31

Servidor LINUXde MUNDO VALLE

Servidor de Dominios Extras:

godaddy.com

Servidor de Pasarelade Pago:

paypal.com

Servidor de Base de Datos

y Espacio Web:hostgator.com

Servidor de Dominio:

nic.com.ec

VALIDACIÓN DE DATOS

32

DATOS CORRECTOS Una prueba tiene éxito si descubre un defecto.

Prueba de unidad.Prueba de

aceptación.Prueba de

integración.Prueba general al

sistema.

VALIDACIÓN DE DATOSSe evaluaron los parámetros:NavegaciónComponentesConfiguraciónSeguridadDesempeñoResistencia

APLICACIÓN WEB

34

BFS - Breadth First Search

CONCLUSIONESLa aplicación de la norma IEEE 830, permitió comprender y

satisfacer los requerimientos de Mundo Valle, involucrando al personal en todas las etapas del desarrollo de la aplicación.

El cumplimiento de normas y estándares colaboraron para que el desarrollo de este proyecto sea comprensible y fácil entendimiento para modificaciones futuras.

Se logró un aplicativo de alta calidad, confiable y disponible los 365 días del año mediante una interfaz amigable dirigida a los clientes tanto internos como externos de la agencia.

Uso de herramientas de código libre

36

CONCLUSIONESLa implementación de la metodología MIDAS

dirigido por los modelos que son: CIM, PIM y PSM se logró el diseño de la arquitectura enfocada al contenido hipertextual, funcionalidad y navegabilidad .

En la etapa de implantación y pruebas se realizaron actividades de validación y verificación, donde se evaluó la integración, aceptación, diseño, contenido, navegabilidad, función y estructura del portal web;

37

CONCLUSIONESEl método de inducción por simple

enumeraciónEl modelo de negocios de una agencia de

viajes y turismo

38

FIN39