- Tiempo de lectura: 9 minutos
- Problema: los entornos industriales generan datos de morfología variable, dificultando su gestión y tratamiento
- Observación: existen tecnologías y diseños orientados a optimizar el tratamiendo de este tipo de datos
- Propuesta: estudiar una posible integración de los conceptos sobre Data Lakes en los entornos de Big Data industrial
En este artículo quiero revisar un concepto que está ganando fuerza, y que está siendo también fuente de una interesante controversia; los sistemas de gestión de datos denominados Data Lakes.
Definición
Lo primero es identificar con exactitud a qué nos estamos refiriendo. La primera alusión al término se le atribuye a James Dixon, quien lo describió con la siguiente analogía en su blog: «If you think of a datamart as a store of bottled water – cleansed and packaged and structured for easy consumption – the data lake is a large body of water in a more natural state. The contents of the data lake stream in from a source to fill the lake, and various users of the lake can come to examine, dive in, or take samples.» Leer más