Elementos ETL - Kettle Pentaho

Post on 25-May-2015

1.488 views 25 download

Transcript of Elementos ETL - Kettle Pentaho

Transform

Realizado por: Valeria HaroWilson Pérez

Agenda

IntroducciónElementosBibliografía

INTRODUCCIÓN

Son herramientas que nos permiten realizar transformaciones de datos.

Estos ayudan a los ingresos y la carga de datos información desde los archivos externos para que puedan ser procesados.

TRANSFORM

Add checksum

Este paso calcula las sumas de comprobación para uno o más campos en el flujo de entrada y añade esto a la salida como un nuevo campo.

Resultados

configuración

Add Constant

Este paso añade un campo constante al flujo.

Add sequence

Este paso sólo agrega un valor de secuencia.

Configuración

Resultados

Add xml

El paso de la columna XML permite codificar el contenido de una serie de campos en una fila en XML. Este XML se añade a la fila en la forma de un campo de cadena.

Configuración

Resultados

Calculator

Crea nuevos campos mediante la realización de cálculos matemáticos.

Configuración

Resultados

Concat files

Se utiliza para concatenar varios campos en un solo campo destino.

Configuración

Resultados

Replace in string

Reemplazar todas las apariciones de una palabra en una cadena con otra palabra.

Configuración

Resultados

Number range.

Crea ciertos rangos basados en un campo numérico

Configuración

Resultados

Select Values

Selección, cambio de nombre, cambio de tipos de datos y la configuración de la longitud y la precisión de los campos.

Select Values

Set field Values

Remplaza los campos de una columna por otra.

Set field Values

Sort rows

Ordena las filas basándose en los campos especificados y si deben ser ordenados en orden ascendente o descendente.

Sort rows

Split field to row

Permite dividir una fila que contiene un campo delimitado en múltiples filas nuevas. 

La fila original no se entrega de resultado. 

Split field to row

String operations

Aplicar las operaciones, tales como el recorte, relleno y otros, para el valor de cadena.

String operations

String cut

Permite cortar parte de una subcadena. Si el campo designado está fuera de rango, se devuelve blanco.

Unique rows

Unique rows

Elimina las filas duplicadas de las entradas.

Unique rows

Value Mapper

Mapea de un valor a otro. 

Value Mapper

Flow

Dummy

Permite visualizar la salida de datos. 

Filter Rows

Permite filtrar los datos de un flujo mientras cumplan alguna condición

Filter Rows

Case

Append streams

Append streams

Stream lookup

Stream lookup

Merge Join

Merge Join

Combination lookup/update

Dimension lookup/update

Dimension lookup/update

Dimension lookup/update

Web services lookup

Web services lookup

Web services lookup