200776951 Big Data Analytics
-
Upload
anonymous-jpehv73mlz -
Category
Documents
-
view
225 -
download
0
Transcript of 200776951 Big Data Analytics
-
7/22/2019 200776951 Big Data Analytics
1/14
BIG DATA
ANALYTICS
-
7/22/2019 200776951 Big Data Analytics
2/14
BIG DATA ANALYTICS
QUE ES ?
Es el tratamiento y anlisis de unagran cantidad de datos y una gran
variedad de tipos que pueden
estar estructurados.
-
7/22/2019 200776951 Big Data Analytics
3/14
BIG DATA ANAlYTICS
PARA QUE SIRVE ?
Para Entregar informacin con fines
predictivos en poco tiempo es decir, aprenderde lo sucedido y anticipar posibles situaciones
para el futuro, y realizar una planeacin
estratgica de riesgos ms precisa.
-
7/22/2019 200776951 Big Data Analytics
4/14
BIG DATA ANALYTICS
QU TIPOS DE DATOS DEBO EXPLORAR ?
Frecuentemente las empresas se
preguntan: Que informacin es la quese debe analizar?, Sin embargo, la
pregunta debera estar enfocado a:
Que problema se trata de Resolver?
-
7/22/2019 200776951 Big Data Analytics
5/14
BIG DATA ANALYTICS
TIPOS DE DATOS DE BIG DATA
Web and Social Media
Biometrics Machine-to-Machine
Human Generate Big Transaction Data
-
7/22/2019 200776951 Big Data Analytics
6/14
BIG DATA ANALYTICS
TIPOS DE DATOS DE BIG DATA
-
7/22/2019 200776951 Big Data Analytics
7/14
BIG DATA ANALYTICS
COMPONENTES DE UNA PLATAFORMA BIG DATA
Hadoop es la plataforma de
cdigo abierto que tiene el
liderazgo en trminos de
popularidad para analizarenormes cantidades de
informacin.
-
7/22/2019 200776951 Big Data Analytics
8/14
BIG DATA ANALYTICS
HADOOP
Est inspirado en el proyecto de
Google File System y en el paradigmade
programacin MapReduce,(mapper
reducer) para manipular los datos ydistribuirlos a nodos de un clster.
-
7/22/2019 200776951 Big Data Analytics
9/14
BIG DATA AnALYTICS
COMPONENTES DE HADOOP
Hadoop Distributed FileSystem(HDFS) Hadoop MapReduce
Hadoop Common
-
7/22/2019 200776951 Big Data Analytics
10/14
BIG DATA AnALYTICS
HADOOP DISTRIBUTED FILE SYSTEM (HDFS)
Los datos son divididos en el clster de
Hadoop en bloquesy son distribuidas a
travs del clster; para ser ejecutadasen pequeos subconjuntos y esto
provee la escalabilidad necesaria para
el procesamiento de grandes
volmenes.
-
7/22/2019 200776951 Big Data Analytics
11/14
BIG DATA AnALYTICS
HADOOP MAP REDUCE
Proceso map: Toma un conjunto de
datos y lo convierte en otro conjunto
de tuplas (pares de llave/valor). Proceso reduce:obtiene la salida
de map como datos de entrada y
combina las tuplas en un conjunto mspequeo de las mismas.
-
7/22/2019 200776951 Big Data Analytics
12/14
-
7/22/2019 200776951 Big Data Analytics
13/14
BIG DATA ANALYTICS
HADOOP MAP REDUCE
-
7/22/2019 200776951 Big Data Analytics
14/14
BIG DATA ANALYTICS
HADOOP COMMON
Hadoop Common Components son unconjunto de libreras que soportan
varios subproyectos de Hadoop.