BIG DATA + BIOINFORMÁTICA · santiago urrizola big data + bioinformÁtica jornadas de definiciÓn...
Transcript of BIG DATA + BIOINFORMÁTICA · santiago urrizola big data + bioinformÁtica jornadas de definiciÓn...
SANTIAGO URRIZOLA
BIG DATA +BIOINFORMÁTICAJORNADAS DE DEFINICIÓN ESTRATÉGICA DE BIG DATA
I+D
TUBERQ
FLUX IT BIO_
CONTEXTO BIO_
0
1
10
100
1,000
10,000
100,000
1 M
2009 2010 2011 2012 2013 2014 2015200820072006
10 M
$ 50
$ 1,000
$ 10,000
$ 100,000
$ 1 M
$ 10 M
$ 100 M
$ 1 B
$ 10 B
E X I S T E N C I A
COST
O DE
SEC
UEN
CIAC
IÓN
POR
GEN
OMA
(USD
)
TOTA
L DE
GEN
OMA
S SE
CUEN
CIA
DOS
Secuencia genómica total yrevolución de la genómicaCosto por genoma humano Vs. número totalde genomas secuenciados
COSTO POR GENOMA HUMANO PARA SECUENCIA GENÓMICA COMPLETA
NÚMERO TOTAL DE GENOMAS SECUENCIADOS
20200
5
10
15
20
25
30
35
201520102005
ESTI
MACI
ÓNPRONÓSTICO
Información digital global**Zettabytes
0.13ZB
34.6ZB
DATOS CREADOS PROCESAMIENTO DE ANÁLISIS DISPONIBLE
REVOLUCIÓN GENÓMICA + REVOLUCIÓN DE LOS DATOS
Z O N A D E A D O P C I Ó N Y U T I L I Z ACIÓN
Z O NA D E POC
FLUX IT BIO_proteinq.com.ar
tuberq.proteinq.com.ar
TUBERQ
P R O T E I N D A T A B A N K
W O R L D W I D E
National Center for Macromolecular Imaging
Wellcome trust
Institute
SOAPJSON
TXTPUBLIC DATASETSDATOS CURADOS
OPEN DATA
DAAS / BIGDATA TRANSFER / PRIMEROS CORTES Y FILTROS
ANALYZER / VISUALIZATION
A’A
A’’
STORAGE
PIPELINE CRUCE Y ENHANCE,
MULTIPLES LENGUAJESPARADIGMAS:
ETL / GRID / MAPREDUCEBATCH
NEXTGEN MAPRED
NUEVOS ALGORITMOSO AJUSTESpipeline
?>
DE DÍASAHORAS!
200
1
P R O T E I N D A T A B A N K
W O R L D W I D E
National Center for Macromolecular Imaging
Wellcome trust
Institute
SOAPJSON
TXTPUBLIC DATASETSDATOS CURADOS
OPEN DATA
DAAS / BIGDATA TRANSFER / PRIMEROS CORTES Y FILTROS
ANALYZER / VISUALIZATION
A’A
A’’
STORAGE
PIPELINE CRUCE Y ENHANCE,
MULTIPLES LENGUAJESPARADIGMAS:
ETL / GRID / MAPREDUCEBATCH
NEXTGEN MAPRED
NUEVOS ALGORITMOSO AJUSTESpipeline
?>
DE DÍASAHORAS!
200
1
ITERATIVOITERATIVO
FLUX IT 360 TECH RADAR
Z O N A D E A D O P C I Ó N Y U T I L I Z ACIÓN
Z O NA D E POC
Z O NA D E I N
V E S T I G ACIÓN
MERCADO INTERN.
OPEN DATANACIONAL
TRANSFERENCIAACAD. > INDUSTRIA
MEDICINA PERSONALIZADA
WORKSHOP BIOFORMACIÓN DEINFORBIOS
EHR - HEALTH RECORDS
HYBRID STORAGE
DATAVIZ
PIPELINE ORCH.
GRID
SaaS PROPIO
NoSQL PRIVATE CLOUD
POLYGLOTARCHITECTURE
MERCADO LOCAL
FINANCIAMIENTO
NEW PIPE ORCH.
DaaS PROPIO
BIG DATA TRANSFER
GENOMA HUMANO
MACHINE LEARNING
1000 GENOMAS
NEXTGENMAP REDUCE
PUBLIC CLOUD STORAGE
PUBLIC CLOUD PROCESSING
BIG DATA INMOTION
ZONA DE ADOPCIÓN Y UTILIZACIÓN
ZONA DE POC
ZONA DE INVESTIGACIÓN
PÚBLICO-PRIVADOJOINT VENTURE
FLUXIT .COM.AR
MUCHAS GRACIAS!