Integrantes: Jorge Herrera M. Carlos Rodríguez R..

Integrantes:

Jorge Herrera M.

Carlos Rodríguez R.

Índice:Resumen ObjetivosDescripción del ProblemaFundamentos TeóricosDiseño e implementación Conclusiones y Recomendaciones

Resumen

Actualmente el sitio web de la universidad no cuenta con un proceso de búsqueda propio que permita obtener resultados de contenidos referentes del sitio de la ESPOL, para lo cual se ha desarrollado un módulo que permita realizar búsquedas en los diferentes contenidos que están publicados en el sitio web de la universidad.

ObjetivosImplementar una opción de búsqueda de calidad

con los contenidos de la página de la ESPOL usando Hadoop como plataforma de procesamiento masivo y escalable de datos.

Optimizar el tiempo de búsqueda utilizando los nodos del cluster de hadoop.

ObjetivosComparar los tiempos de respuesta de las

búsquedas realizadas con Hadoop y el buscador actual que contiene el sitio de ESPOL.

Realizar recomendaciones y sugerencias en la opción de búsqueda a futuro dentro del sitio de ESPOL.

Descripción del ProblemaLa opción de búsqueda de la página

de la ESPOL a pesar de que realiza su función gracias al API de Google, no optimiza sus resultados en las preferencias ni la presenta organizada por algún parámetro implícito como fecha u orden alfabético de las páginas coincidentes con la búsqueda.

FUNDAMENTOS TEÓRICOS

Qué es Hadoop?

HDFS (Hadoop Distributed File System)

Map/Reduce

HadoopPlataforma que permite desarrollar y ejecutar

aplicaciones que procesan grandes cantidades de datos.Modelo distribuido.Alta disponibilidad.Hardware de bajo costo.Alto rendimiento.

Esquema HadoopModelo distribuido

Hadoop CommonsConjunto de librerías y utilidades .jar y scripts.

Interactúa con el sistema de archivos distribuidos.

Gestiona el control de acceso a los nodos del FS.

HDFSSistema de archivos distribuido, escalable y

tolerante a fallos.Escrito en Java.Reduce el impacto de un corte de energía.Nodo primario o "NameNode" que controla

los "DataNodes", donde finalmente se almacenan los datos.

HDFSNamenode

Breplication

Rack1 Rack2

Client

Blocks

Datanodes Datanodes

Client

Metadata opsMetadata(Name, replicas..)(/home/foo/data,6. ..

Block ops

MapReduceframework que nos permite desarrollar las

aplicaciones que son capaces de procesar en paralelo los datos.

Separan los datos de entradaLos datos de entrada son Tareas MAPLos datos de salida del map son enviados

como entradas de Tareas REDUCE.

Map/Reduce

Diseño e Implementación Herramientas:

Entorno de desarrollo: NetBeans IDE 6.9.1Lenguaje: JavaLenguajes de Páginas Web: JSPLenguaje de Scripts: JavaScript

Arquitectura

Diseño e Implementación

Resultados Tiempo Vs Nodos

Nodos Tiempo de búsqueda hadoop

2 16 segundos

4 11 segundos

Tiempo Vs Nodos

2 12 segundos

4 10 segundos

Tiempo Vs Nodos

2 12 segundos

4 9 segundos

ConclusionesHadoop es un framework muy potente y

realmente sencillo de utilizar, sin embargo, debemos tener muy claro que se quiere resolver y no intentar resolver todos nuestros problemas con él.

Se requiere mayor cantidad de nodos y datos para que hadoop pueda ser utilizado de manera eficiente.

RecomendacionesSe recomienda que para futuras pruebas, se debe

extraer la información completa de cada uno de los sitios web de ESPOL y realizar búsquedas más exhaustivas.

También se debe realizar una actualización de las versiones de hadoop para ver las mejoras en el análisis escalable de datos en los diferentes nodos del cluster.

Se recomienda incorporar la opción de búsqueda personalizada de hadoop dentro del sitio web de ESPOL para que los usuarios puedan ver los resultados de su búsqueda más detallada y precisa. Y posiblemente la creación de sesiones para personalizar aun más las búsquedas.

Gracias

Integrantes: Jorge Herrera M. Carlos Rodríguez R..

Documents

Transcript of Integrantes: Jorge Herrera M. Carlos Rodríguez R..

Integrantes: Bosque María A. Castillo María A. García Karlis Rodríguez Marielí.

Integrantes: Verónica Mora Rojas Rosa Ibeth Ocampo García Alfredo Herrera Peralta

Integrantes: Gabriel Centurión Maximiliano Félix Felipe Rodríguez Rodrigo Santana.

Integrantes: Camila Carvajal. Cindy Herrera.

Psicomotricidad. Integrantes: Angélica Rodríguez Antunez Lesly Martínez Saavedra Carmen Daniela Martínez.

El aborto Integrantes del equipo: -Heriberto Rodríguez Chicará -Antonio de Jesús Rodríguez Caballero.

Determinación de Oferta y Demanda Integrantes: Carlos Daniel Nájera Herrera Kevin Martínez Muñoz.

MARIHUANA Integrantes: María Fca Caro Lissette Herrera Cofré Curso: 3° medio A.

INTEGRANTES: Gragnaniello, Cristina Gragnaniello, Cristina Rodríguez, Mariana Rodríguez, Mariana Sammartino, Paula Sammartino, Paula Torrisi, Andrea Torrisi,

Samanta Marcela Rodríguez García Alexia Mayté Herrera García Barbará Rodríguez Ramí rez.

Generador de Kelvin Integrantes: Carlos Sá Arian Martin Kliderth Herrera.

GOBIERNO MILITAR (1973-1990) Integrantes: Priscilla Alcota Celsia Bórquez Patricia Herrera María Reyes.

INTEGRANTES : SandraSandra Rodríguez Rodríguez ...sa6cd00fb9d22b93d.jimcontent.com/download/version...AlbertoAlberto Cornejo Cornejo JarufeJarufe. Se deriva del verbo latino movere,

Vanessa Elizabeth Rodríguez Herrera

LA ERA DE LOS CAUDILLOS EN REP. DOMINICANA -Rafael Herrera Rodríguez -

INTEGRANTES: Tatiana Herrera Agnes Tobar Maria Riquelme Yanira Silva Romina Velásquez Profesor: Carlos Araya.

CURSO: Iniciciativa Empresarial INTEGRANTES: Castro ...€¦ · CURSO: Iniciciativa Empresarial INTEGRANTES: •Castro Eulogio Yassira •De la Cruz Perez Betsy •Herrera Marín

Integrantes: Robinsón Camilo Rodríguez Narváez Diana Milena Velasco Moncayo

Equipo 4 Integrantes : Kenia jazziel cárdenas Ibarra Yahaira Abigail rodríguez Gonzales

EL MERCADO DE LA CERVEZA EN SINGAPUR INTEGRANTES: Jennifer Vargas Jorge Rodríguez Karem Laínez INTEGRANTES: Jennifer Vargas Jorge Rodríguez Karem Laínez.