Abriendo datos

Post on 06-Jul-2015

322 views 1 download

description

Descripción de cómo y para qué abrir datos, y de una iniciativa para hacerlo.

Transcript of Abriendo datos

Abriendo los datos de la administracioacuten

J J Merelohttpsena2info

iquestQueacute hace la

administracioacuten

iquestEn queacute se gasta el

dinero

iquestPor queacute toma ciertas

decisiones

Por ejemplo

iquestCuaacutento dinero se

gasta en

investigacioacuten

Faacutecil 140 megas de

PDFs no indexados

iquestPor queacute

Responsabilidad

Transparencia

Democratizacioacuten

iquestCoacutemo

httpdatagov

httpdatagovuk

httpopendataeuskadinet

Scraping

Datos en HTML o

PDF

Poca estructura

(a mano)

Primera solucioacuten

expresiones regulares

Segunda solucioacuten

Anaacutelisis con libreriacuteas

WWWMechanize

WebScraper

hPricot

scrAPI

Acceso orientado a

objetos a la paacutegina

Pero siempre nos

quedaraacute el DOM

iquestY despueacutes

Datos etiquetados

SQL XML

RDF JSON

Los datos sin

m e t a in fo rm a c ioacuten

sirven de poco

Servir como HTML

REST

Desafiacuteo Abredatos

48 horas de

programacioacuten

6 semanas de

difusioacuten

Software liberado

5000 euro premios

Ganadores

misparadascom e

infocarreteracom

Ah iquestpero el Senado hace algo

Scraping de parte de la informacioacuten

Extraccioacuten de descriptores

Datos ficha personal

httpsena2infopost

Kit de construccioacuten del Senado

DataESSenado En CPAN

Web en PHP (de Rubeacuten Dugo)

Todo en GitHub

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

iquestQueacute hace la

administracioacuten

iquestEn queacute se gasta el

dinero

iquestPor queacute toma ciertas

decisiones

Por ejemplo

iquestCuaacutento dinero se

gasta en

investigacioacuten

Faacutecil 140 megas de

PDFs no indexados

iquestPor queacute

Responsabilidad

Transparencia

Democratizacioacuten

iquestCoacutemo

httpdatagov

httpdatagovuk

httpopendataeuskadinet

Scraping

Datos en HTML o

PDF

Poca estructura

(a mano)

Primera solucioacuten

expresiones regulares

Segunda solucioacuten

Anaacutelisis con libreriacuteas

WWWMechanize

WebScraper

hPricot

scrAPI

Acceso orientado a

objetos a la paacutegina

Pero siempre nos

quedaraacute el DOM

iquestY despueacutes

Datos etiquetados

SQL XML

RDF JSON

Los datos sin

m e t a in fo rm a c ioacuten

sirven de poco

Servir como HTML

REST

Desafiacuteo Abredatos

48 horas de

programacioacuten

6 semanas de

difusioacuten

Software liberado

5000 euro premios

Ganadores

misparadascom e

infocarreteracom

Ah iquestpero el Senado hace algo

Scraping de parte de la informacioacuten

Extraccioacuten de descriptores

Datos ficha personal

httpsena2infopost

Kit de construccioacuten del Senado

DataESSenado En CPAN

Web en PHP (de Rubeacuten Dugo)

Todo en GitHub

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

iquestEn queacute se gasta el

dinero

iquestPor queacute toma ciertas

decisiones

Por ejemplo

iquestCuaacutento dinero se

gasta en

investigacioacuten

Faacutecil 140 megas de

PDFs no indexados

iquestPor queacute

Responsabilidad

Transparencia

Democratizacioacuten

iquestCoacutemo

httpdatagov

httpdatagovuk

httpopendataeuskadinet

Scraping

Datos en HTML o

PDF

Poca estructura

(a mano)

Primera solucioacuten

expresiones regulares

Segunda solucioacuten

Anaacutelisis con libreriacuteas

WWWMechanize

WebScraper

hPricot

scrAPI

Acceso orientado a

objetos a la paacutegina

Pero siempre nos

quedaraacute el DOM

iquestY despueacutes

Datos etiquetados

SQL XML

RDF JSON

Los datos sin

m e t a in fo rm a c ioacuten

sirven de poco

Servir como HTML

REST

Desafiacuteo Abredatos

48 horas de

programacioacuten

6 semanas de

difusioacuten

Software liberado

5000 euro premios

Ganadores

misparadascom e

infocarreteracom

Ah iquestpero el Senado hace algo

Scraping de parte de la informacioacuten

Extraccioacuten de descriptores

Datos ficha personal

httpsena2infopost

Kit de construccioacuten del Senado

DataESSenado En CPAN

Web en PHP (de Rubeacuten Dugo)

Todo en GitHub

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

iquestPor queacute toma ciertas

decisiones

Por ejemplo

iquestCuaacutento dinero se

gasta en

investigacioacuten

Faacutecil 140 megas de

PDFs no indexados

iquestPor queacute

Responsabilidad

Transparencia

Democratizacioacuten

iquestCoacutemo

httpdatagov

httpdatagovuk

httpopendataeuskadinet

Scraping

Datos en HTML o

PDF

Poca estructura

(a mano)

Primera solucioacuten

expresiones regulares

Segunda solucioacuten

Anaacutelisis con libreriacuteas

WWWMechanize

WebScraper

hPricot

scrAPI

Acceso orientado a

objetos a la paacutegina

Pero siempre nos

quedaraacute el DOM

iquestY despueacutes

Datos etiquetados

SQL XML

RDF JSON

Los datos sin

m e t a in fo rm a c ioacuten

sirven de poco

Servir como HTML

REST

Desafiacuteo Abredatos

48 horas de

programacioacuten

6 semanas de

difusioacuten

Software liberado

5000 euro premios

Ganadores

misparadascom e

infocarreteracom

Ah iquestpero el Senado hace algo

Scraping de parte de la informacioacuten

Extraccioacuten de descriptores

Datos ficha personal

httpsena2infopost

Kit de construccioacuten del Senado

DataESSenado En CPAN

Web en PHP (de Rubeacuten Dugo)

Todo en GitHub

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

Por ejemplo

iquestCuaacutento dinero se

gasta en

investigacioacuten

Faacutecil 140 megas de

PDFs no indexados

iquestPor queacute

Responsabilidad

Transparencia

Democratizacioacuten

iquestCoacutemo

httpdatagov

httpdatagovuk

httpopendataeuskadinet

Scraping

Datos en HTML o

PDF

Poca estructura

(a mano)

Primera solucioacuten

expresiones regulares

Segunda solucioacuten

Anaacutelisis con libreriacuteas

WWWMechanize

WebScraper

hPricot

scrAPI

Acceso orientado a

objetos a la paacutegina

Pero siempre nos

quedaraacute el DOM

iquestY despueacutes

Datos etiquetados

SQL XML

RDF JSON

Los datos sin

m e t a in fo rm a c ioacuten

sirven de poco

Servir como HTML

REST

Desafiacuteo Abredatos

48 horas de

programacioacuten

6 semanas de

difusioacuten

Software liberado

5000 euro premios

Ganadores

misparadascom e

infocarreteracom

Ah iquestpero el Senado hace algo

Scraping de parte de la informacioacuten

Extraccioacuten de descriptores

Datos ficha personal

httpsena2infopost

Kit de construccioacuten del Senado

DataESSenado En CPAN

Web en PHP (de Rubeacuten Dugo)

Todo en GitHub

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

Faacutecil 140 megas de

PDFs no indexados

iquestPor queacute

Responsabilidad

Transparencia

Democratizacioacuten

iquestCoacutemo

httpdatagov

httpdatagovuk

httpopendataeuskadinet

Scraping

Datos en HTML o

PDF

Poca estructura

(a mano)

Primera solucioacuten

expresiones regulares

Segunda solucioacuten

Anaacutelisis con libreriacuteas

WWWMechanize

WebScraper

hPricot

scrAPI

Acceso orientado a

objetos a la paacutegina

Pero siempre nos

quedaraacute el DOM

iquestY despueacutes

Datos etiquetados

SQL XML

RDF JSON

Los datos sin

m e t a in fo rm a c ioacuten

sirven de poco

Servir como HTML

REST

Desafiacuteo Abredatos

48 horas de

programacioacuten

6 semanas de

difusioacuten

Software liberado

5000 euro premios

Ganadores

misparadascom e

infocarreteracom

Ah iquestpero el Senado hace algo

Scraping de parte de la informacioacuten

Extraccioacuten de descriptores

Datos ficha personal

httpsena2infopost

Kit de construccioacuten del Senado

DataESSenado En CPAN

Web en PHP (de Rubeacuten Dugo)

Todo en GitHub

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

iquestPor queacute

Responsabilidad

Transparencia

Democratizacioacuten

iquestCoacutemo

httpdatagov

httpdatagovuk

httpopendataeuskadinet

Scraping

Datos en HTML o

PDF

Poca estructura

(a mano)

Primera solucioacuten

expresiones regulares

Segunda solucioacuten

Anaacutelisis con libreriacuteas

WWWMechanize

WebScraper

hPricot

scrAPI

Acceso orientado a

objetos a la paacutegina

Pero siempre nos

quedaraacute el DOM

iquestY despueacutes

Datos etiquetados

SQL XML

RDF JSON

Los datos sin

m e t a in fo rm a c ioacuten

sirven de poco

Servir como HTML

REST

Desafiacuteo Abredatos

48 horas de

programacioacuten

6 semanas de

difusioacuten

Software liberado

5000 euro premios

Ganadores

misparadascom e

infocarreteracom

Ah iquestpero el Senado hace algo

Scraping de parte de la informacioacuten

Extraccioacuten de descriptores

Datos ficha personal

httpsena2infopost

Kit de construccioacuten del Senado

DataESSenado En CPAN

Web en PHP (de Rubeacuten Dugo)

Todo en GitHub

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

Responsabilidad

Transparencia

Democratizacioacuten

iquestCoacutemo

httpdatagov

httpdatagovuk

httpopendataeuskadinet

Scraping

Datos en HTML o

PDF

Poca estructura

(a mano)

Primera solucioacuten

expresiones regulares

Segunda solucioacuten

Anaacutelisis con libreriacuteas

WWWMechanize

WebScraper

hPricot

scrAPI

Acceso orientado a

objetos a la paacutegina

Pero siempre nos

quedaraacute el DOM

iquestY despueacutes

Datos etiquetados

SQL XML

RDF JSON

Los datos sin

m e t a in fo rm a c ioacuten

sirven de poco

Servir como HTML

REST

Desafiacuteo Abredatos

48 horas de

programacioacuten

6 semanas de

difusioacuten

Software liberado

5000 euro premios

Ganadores

misparadascom e

infocarreteracom

Ah iquestpero el Senado hace algo

Scraping de parte de la informacioacuten

Extraccioacuten de descriptores

Datos ficha personal

httpsena2infopost

Kit de construccioacuten del Senado

DataESSenado En CPAN

Web en PHP (de Rubeacuten Dugo)

Todo en GitHub

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

iquestCoacutemo

httpdatagov

httpdatagovuk

httpopendataeuskadinet

Scraping

Datos en HTML o

PDF

Poca estructura

(a mano)

Primera solucioacuten

expresiones regulares

Segunda solucioacuten

Anaacutelisis con libreriacuteas

WWWMechanize

WebScraper

hPricot

scrAPI

Acceso orientado a

objetos a la paacutegina

Pero siempre nos

quedaraacute el DOM

iquestY despueacutes

Datos etiquetados

SQL XML

RDF JSON

Los datos sin

m e t a in fo rm a c ioacuten

sirven de poco

Servir como HTML

REST

Desafiacuteo Abredatos

48 horas de

programacioacuten

6 semanas de

difusioacuten

Software liberado

5000 euro premios

Ganadores

misparadascom e

infocarreteracom

Ah iquestpero el Senado hace algo

Scraping de parte de la informacioacuten

Extraccioacuten de descriptores

Datos ficha personal

httpsena2infopost

Kit de construccioacuten del Senado

DataESSenado En CPAN

Web en PHP (de Rubeacuten Dugo)

Todo en GitHub

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

httpdatagov

httpdatagovuk

httpopendataeuskadinet

Scraping

Datos en HTML o

PDF

Poca estructura

(a mano)

Primera solucioacuten

expresiones regulares

Segunda solucioacuten

Anaacutelisis con libreriacuteas

WWWMechanize

WebScraper

hPricot

scrAPI

Acceso orientado a

objetos a la paacutegina

Pero siempre nos

quedaraacute el DOM

iquestY despueacutes

Datos etiquetados

SQL XML

RDF JSON

Los datos sin

m e t a in fo rm a c ioacuten

sirven de poco

Servir como HTML

REST

Desafiacuteo Abredatos

48 horas de

programacioacuten

6 semanas de

difusioacuten

Software liberado

5000 euro premios

Ganadores

misparadascom e

infocarreteracom

Ah iquestpero el Senado hace algo

Scraping de parte de la informacioacuten

Extraccioacuten de descriptores

Datos ficha personal

httpsena2infopost

Kit de construccioacuten del Senado

DataESSenado En CPAN

Web en PHP (de Rubeacuten Dugo)

Todo en GitHub

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

Scraping

Datos en HTML o

PDF

Poca estructura

(a mano)

Primera solucioacuten

expresiones regulares

Segunda solucioacuten

Anaacutelisis con libreriacuteas

WWWMechanize

WebScraper

hPricot

scrAPI

Acceso orientado a

objetos a la paacutegina

Pero siempre nos

quedaraacute el DOM

iquestY despueacutes

Datos etiquetados

SQL XML

RDF JSON

Los datos sin

m e t a in fo rm a c ioacuten

sirven de poco

Servir como HTML

REST

Desafiacuteo Abredatos

48 horas de

programacioacuten

6 semanas de

difusioacuten

Software liberado

5000 euro premios

Ganadores

misparadascom e

infocarreteracom

Ah iquestpero el Senado hace algo

Scraping de parte de la informacioacuten

Extraccioacuten de descriptores

Datos ficha personal

httpsena2infopost

Kit de construccioacuten del Senado

DataESSenado En CPAN

Web en PHP (de Rubeacuten Dugo)

Todo en GitHub

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

Datos en HTML o

PDF

Poca estructura

(a mano)

Primera solucioacuten

expresiones regulares

Segunda solucioacuten

Anaacutelisis con libreriacuteas

WWWMechanize

WebScraper

hPricot

scrAPI

Acceso orientado a

objetos a la paacutegina

Pero siempre nos

quedaraacute el DOM

iquestY despueacutes

Datos etiquetados

SQL XML

RDF JSON

Los datos sin

m e t a in fo rm a c ioacuten

sirven de poco

Servir como HTML

REST

Desafiacuteo Abredatos

48 horas de

programacioacuten

6 semanas de

difusioacuten

Software liberado

5000 euro premios

Ganadores

misparadascom e

infocarreteracom

Ah iquestpero el Senado hace algo

Scraping de parte de la informacioacuten

Extraccioacuten de descriptores

Datos ficha personal

httpsena2infopost

Kit de construccioacuten del Senado

DataESSenado En CPAN

Web en PHP (de Rubeacuten Dugo)

Todo en GitHub

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

Poca estructura

(a mano)

Primera solucioacuten

expresiones regulares

Segunda solucioacuten

Anaacutelisis con libreriacuteas

WWWMechanize

WebScraper

hPricot

scrAPI

Acceso orientado a

objetos a la paacutegina

Pero siempre nos

quedaraacute el DOM

iquestY despueacutes

Datos etiquetados

SQL XML

RDF JSON

Los datos sin

m e t a in fo rm a c ioacuten

sirven de poco

Servir como HTML

REST

Desafiacuteo Abredatos

48 horas de

programacioacuten

6 semanas de

difusioacuten

Software liberado

5000 euro premios

Ganadores

misparadascom e

infocarreteracom

Ah iquestpero el Senado hace algo

Scraping de parte de la informacioacuten

Extraccioacuten de descriptores

Datos ficha personal

httpsena2infopost

Kit de construccioacuten del Senado

DataESSenado En CPAN

Web en PHP (de Rubeacuten Dugo)

Todo en GitHub

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

Primera solucioacuten

expresiones regulares

Segunda solucioacuten

Anaacutelisis con libreriacuteas

WWWMechanize

WebScraper

hPricot

scrAPI

Acceso orientado a

objetos a la paacutegina

Pero siempre nos

quedaraacute el DOM

iquestY despueacutes

Datos etiquetados

SQL XML

RDF JSON

Los datos sin

m e t a in fo rm a c ioacuten

sirven de poco

Servir como HTML

REST

Desafiacuteo Abredatos

48 horas de

programacioacuten

6 semanas de

difusioacuten

Software liberado

5000 euro premios

Ganadores

misparadascom e

infocarreteracom

Ah iquestpero el Senado hace algo

Scraping de parte de la informacioacuten

Extraccioacuten de descriptores

Datos ficha personal

httpsena2infopost

Kit de construccioacuten del Senado

DataESSenado En CPAN

Web en PHP (de Rubeacuten Dugo)

Todo en GitHub

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

Segunda solucioacuten

Anaacutelisis con libreriacuteas

WWWMechanize

WebScraper

hPricot

scrAPI

Acceso orientado a

objetos a la paacutegina

Pero siempre nos

quedaraacute el DOM

iquestY despueacutes

Datos etiquetados

SQL XML

RDF JSON

Los datos sin

m e t a in fo rm a c ioacuten

sirven de poco

Servir como HTML

REST

Desafiacuteo Abredatos

48 horas de

programacioacuten

6 semanas de

difusioacuten

Software liberado

5000 euro premios

Ganadores

misparadascom e

infocarreteracom

Ah iquestpero el Senado hace algo

Scraping de parte de la informacioacuten

Extraccioacuten de descriptores

Datos ficha personal

httpsena2infopost

Kit de construccioacuten del Senado

DataESSenado En CPAN

Web en PHP (de Rubeacuten Dugo)

Todo en GitHub

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

WWWMechanize

WebScraper

hPricot

scrAPI

Acceso orientado a

objetos a la paacutegina

Pero siempre nos

quedaraacute el DOM

iquestY despueacutes

Datos etiquetados

SQL XML

RDF JSON

Los datos sin

m e t a in fo rm a c ioacuten

sirven de poco

Servir como HTML

REST

Desafiacuteo Abredatos

48 horas de

programacioacuten

6 semanas de

difusioacuten

Software liberado

5000 euro premios

Ganadores

misparadascom e

infocarreteracom

Ah iquestpero el Senado hace algo

Scraping de parte de la informacioacuten

Extraccioacuten de descriptores

Datos ficha personal

httpsena2infopost

Kit de construccioacuten del Senado

DataESSenado En CPAN

Web en PHP (de Rubeacuten Dugo)

Todo en GitHub

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

hPricot

scrAPI

Acceso orientado a

objetos a la paacutegina

Pero siempre nos

quedaraacute el DOM

iquestY despueacutes

Datos etiquetados

SQL XML

RDF JSON

Los datos sin

m e t a in fo rm a c ioacuten

sirven de poco

Servir como HTML

REST

Desafiacuteo Abredatos

48 horas de

programacioacuten

6 semanas de

difusioacuten

Software liberado

5000 euro premios

Ganadores

misparadascom e

infocarreteracom

Ah iquestpero el Senado hace algo

Scraping de parte de la informacioacuten

Extraccioacuten de descriptores

Datos ficha personal

httpsena2infopost

Kit de construccioacuten del Senado

DataESSenado En CPAN

Web en PHP (de Rubeacuten Dugo)

Todo en GitHub

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

Acceso orientado a

objetos a la paacutegina

Pero siempre nos

quedaraacute el DOM

iquestY despueacutes

Datos etiquetados

SQL XML

RDF JSON

Los datos sin

m e t a in fo rm a c ioacuten

sirven de poco

Servir como HTML

REST

Desafiacuteo Abredatos

48 horas de

programacioacuten

6 semanas de

difusioacuten

Software liberado

5000 euro premios

Ganadores

misparadascom e

infocarreteracom

Ah iquestpero el Senado hace algo

Scraping de parte de la informacioacuten

Extraccioacuten de descriptores

Datos ficha personal

httpsena2infopost

Kit de construccioacuten del Senado

DataESSenado En CPAN

Web en PHP (de Rubeacuten Dugo)

Todo en GitHub

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

Pero siempre nos

quedaraacute el DOM

iquestY despueacutes

Datos etiquetados

SQL XML

RDF JSON

Los datos sin

m e t a in fo rm a c ioacuten

sirven de poco

Servir como HTML

REST

Desafiacuteo Abredatos

48 horas de

programacioacuten

6 semanas de

difusioacuten

Software liberado

5000 euro premios

Ganadores

misparadascom e

infocarreteracom

Ah iquestpero el Senado hace algo

Scraping de parte de la informacioacuten

Extraccioacuten de descriptores

Datos ficha personal

httpsena2infopost

Kit de construccioacuten del Senado

DataESSenado En CPAN

Web en PHP (de Rubeacuten Dugo)

Todo en GitHub

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

iquestY despueacutes

Datos etiquetados

SQL XML

RDF JSON

Los datos sin

m e t a in fo rm a c ioacuten

sirven de poco

Servir como HTML

REST

Desafiacuteo Abredatos

48 horas de

programacioacuten

6 semanas de

difusioacuten

Software liberado

5000 euro premios

Ganadores

misparadascom e

infocarreteracom

Ah iquestpero el Senado hace algo

Scraping de parte de la informacioacuten

Extraccioacuten de descriptores

Datos ficha personal

httpsena2infopost

Kit de construccioacuten del Senado

DataESSenado En CPAN

Web en PHP (de Rubeacuten Dugo)

Todo en GitHub

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

Datos etiquetados

SQL XML

RDF JSON

Los datos sin

m e t a in fo rm a c ioacuten

sirven de poco

Servir como HTML

REST

Desafiacuteo Abredatos

48 horas de

programacioacuten

6 semanas de

difusioacuten

Software liberado

5000 euro premios

Ganadores

misparadascom e

infocarreteracom

Ah iquestpero el Senado hace algo

Scraping de parte de la informacioacuten

Extraccioacuten de descriptores

Datos ficha personal

httpsena2infopost

Kit de construccioacuten del Senado

DataESSenado En CPAN

Web en PHP (de Rubeacuten Dugo)

Todo en GitHub

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

Los datos sin

m e t a in fo rm a c ioacuten

sirven de poco

Servir como HTML

REST

Desafiacuteo Abredatos

48 horas de

programacioacuten

6 semanas de

difusioacuten

Software liberado

5000 euro premios

Ganadores

misparadascom e

infocarreteracom

Ah iquestpero el Senado hace algo

Scraping de parte de la informacioacuten

Extraccioacuten de descriptores

Datos ficha personal

httpsena2infopost

Kit de construccioacuten del Senado

DataESSenado En CPAN

Web en PHP (de Rubeacuten Dugo)

Todo en GitHub

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

Servir como HTML

REST

Desafiacuteo Abredatos

48 horas de

programacioacuten

6 semanas de

difusioacuten

Software liberado

5000 euro premios

Ganadores

misparadascom e

infocarreteracom

Ah iquestpero el Senado hace algo

Scraping de parte de la informacioacuten

Extraccioacuten de descriptores

Datos ficha personal

httpsena2infopost

Kit de construccioacuten del Senado

DataESSenado En CPAN

Web en PHP (de Rubeacuten Dugo)

Todo en GitHub

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

Desafiacuteo Abredatos

48 horas de

programacioacuten

6 semanas de

difusioacuten

Software liberado

5000 euro premios

Ganadores

misparadascom e

infocarreteracom

Ah iquestpero el Senado hace algo

Scraping de parte de la informacioacuten

Extraccioacuten de descriptores

Datos ficha personal

httpsena2infopost

Kit de construccioacuten del Senado

DataESSenado En CPAN

Web en PHP (de Rubeacuten Dugo)

Todo en GitHub

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

48 horas de

programacioacuten

6 semanas de

difusioacuten

Software liberado

5000 euro premios

Ganadores

misparadascom e

infocarreteracom

Ah iquestpero el Senado hace algo

Scraping de parte de la informacioacuten

Extraccioacuten de descriptores

Datos ficha personal

httpsena2infopost

Kit de construccioacuten del Senado

DataESSenado En CPAN

Web en PHP (de Rubeacuten Dugo)

Todo en GitHub

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

6 semanas de

difusioacuten

Software liberado

5000 euro premios

Ganadores

misparadascom e

infocarreteracom

Ah iquestpero el Senado hace algo

Scraping de parte de la informacioacuten

Extraccioacuten de descriptores

Datos ficha personal

httpsena2infopost

Kit de construccioacuten del Senado

DataESSenado En CPAN

Web en PHP (de Rubeacuten Dugo)

Todo en GitHub

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

Software liberado

5000 euro premios

Ganadores

misparadascom e

infocarreteracom

Ah iquestpero el Senado hace algo

Scraping de parte de la informacioacuten

Extraccioacuten de descriptores

Datos ficha personal

httpsena2infopost

Kit de construccioacuten del Senado

DataESSenado En CPAN

Web en PHP (de Rubeacuten Dugo)

Todo en GitHub

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

Ganadores

misparadascom e

infocarreteracom

Ah iquestpero el Senado hace algo

Scraping de parte de la informacioacuten

Extraccioacuten de descriptores

Datos ficha personal

httpsena2infopost

Kit de construccioacuten del Senado

DataESSenado En CPAN

Web en PHP (de Rubeacuten Dugo)

Todo en GitHub

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

Ah iquestpero el Senado hace algo

Scraping de parte de la informacioacuten

Extraccioacuten de descriptores

Datos ficha personal

httpsena2infopost

Kit de construccioacuten del Senado

DataESSenado En CPAN

Web en PHP (de Rubeacuten Dugo)

Todo en GitHub

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

Kit de construccioacuten del Senado

DataESSenado En CPAN

Web en PHP (de Rubeacuten Dugo)

Todo en GitHub

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

Futuro

In c i e r t o

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33

Es o e s t o d o

Muc h a s g ra c ia s

  • Slide 1
  • Slide 2
  • Slide 3
  • Slide 4
  • Slide 5
  • Slide 6
  • Slide 7
  • Slide 8
  • Slide 9
  • Slide 10
  • Slide 11
  • Slide 12
  • Slide 13
  • Slide 14
  • Slide 15
  • Slide 16
  • Slide 17
  • Slide 18
  • Slide 19
  • Slide 20
  • Slide 21
  • Slide 22
  • Slide 23
  • Slide 24
  • Slide 25
  • Slide 26
  • Slide 27
  • Slide 28
  • Slide 29
  • Slide 30
  • Slide 31
  • Slide 32
  • Slide 33