Open Business Intelligence

La red del Business Intelligence

Asocia una Dimensión de Tiempo usando Herramientas ETL

Buenas tardes a Todos, 


Soy nuevo en el foro y actualmente estoy en una búsqueda de conocimiento, a día de hoy, estoy leyéndome la Metodología HEFESTO y gracias a ello ya he avanzado mucho, hasta ahora ya programe un trabajo junto a tres transformaciones que me agregan los datos a una base de datos, ya tengo lista la tabla FACTS y las dimensiones(CLIENTE,EQUIPO,SERVICIO).

Hasta el momento todo muy bien, pero mi duda viene al memento de trabajar con la dimensión tiempo.!

En la consulta origen de donde saco la información, están las fechas donde se realizaron los servicios, por cliente, a que equipo y que servicio se ejecutó.

Buscando en los ejemplos de Spoon o Kettle de Pentaho, me encontré con un ejemplo llamado "Populate Date Dimension", el cual crea fechas.

Esto me genera una duda, al parecer este ejemplo se usa de forma genérica para para cualquier proceso.

Mi duda radica, en como usar esta tabla?, debo usar Kettle o Spoon, para reemplazar las fechas de mis datos por un id de una fecha equivalente de este ejemplo "Populate Date Dimension"?

Es decir:

Que en el ejemplo se crea una tabla masiva con 40.000 campos, los cuales son fechas y cada campo tiene un ID, debo entonces de alguna forma comparar la fecha de mis datos, con la fecha del ejemplo y agregar un campo con el ID correspondiente a mi fecha?

La verdad estoy perdido en este punto, y agradecería que me dieran una luz al respecto....


Muchas gracias a todos y un saludo desde Colombia.

Etiquetas: Asocia, Dimension, ETL, Kettle, Pentaho, Spoon, Tiempo

Visitas: 1748

Responde a esto

Respuestas a esta discusión

Hola Julián, cómo estás?

Qué bueno que te haya sido útil HEFESTO. Por cierto en uno de los pasos se explica como poblar la dimensión Tiempo.

En esta misma red, en el grupo de PDI he publicado algo que te puede ayudar: ver...

Hay muchas maneras de estructurar y poblar la dimensión tiempo, pero lo más común es lo siguiente:
* se crea en la tabla de hechos la clave tiempo que tendrá el formato yyyymmdd.
* se crea la tabla de dimensión tiempo, la cual tiene su clave (yyyymmdd) y sus atributos.
* se cargan datos en la tabla de hechos.
* se cargan datos en la dimensión tiempo, "desde" la fecha menor ingresada en la tabla de hechos, "hasta" la fecha mayor. En el link que te pasé recién se puede apreciar bien este detalle, en el procedure de carga.

Saludos.
Muchas Gracias Bernabeu,

Después de ver paso a paso lo que hice, logré llegar a esa conclusión.

Una vez creada la dimensión tiempo y poblada con las 40.000 fechas, solo me dije a mi mismo, claro, solo debo elegir como clave en la tabla de hechos la fecha de mis datos, eso sí, deben corresponder los formatos y listo, con eso ya tendría listo los datos para hacer mi primer cubo.

Yo la verdad no he terminado de leerme la metodología HEFESTO, me he dejado llevar por el impulso y la emoción de ir haciendo el proceso mientras lo voy entendiendo.

Ya en este momento, estoy tratando de hacer un cubo con el Scheme Workbench, ya lo tengo con sus dimensiones y todo, solo me falta el campo de los miembros calculado(no se como es la sintaxis de la dormula, ni cual sería la variable, si el nombre de una dimensión o el campo de la tabla de hechos)..... Y me imagino que para que el cubo funcione debo hacer un Query MDX.


Voy a continuar leyendo la metodología HEFESTO.



Gracias por tu ayuda.


Bernabeu R. Dario dijo:
Hola Julián, cómo estás?
Qué bueno que te haya sido útil HEFESTO. Por cierto en uno de los pasos se explica como poblar la dimensión Tiempo.
En esta misma red, en el grupo de PDI he publicado algo que te puede ayudar: ver...

Hay muchas maneras de estructurar y poblar la dimensión tiempo, pero lo más común es lo siguiente:
* se crea en la tabla de hechos la clave tiempo que tendrá el formato yyyymmdd.
* se crea la tabla de dimensión tiempo, la cual tiene su clave (yyyymmdd) y sus atributos.
* se cargan datos en la tabla de hechos.
* se cargan datos en la dimensión tiempo, "desde" la fecha menor ingresada en la tabla de hechos, "hasta" la fecha mayor. En el link que te pasé recién se puede apreciar bien este detalle, en el procedure de carga.

Saludos.

Responder a debate

RSS

Distintivo

Cargando…

© 2019   Creado por Emilio.   Tecnología de

Emblemas  |  Reportar un problema  |  Términos de servicio