A estas alturas son muchas las empresas que han iniciado procesos de transformación digital, o están en proceso de hacerlo. Es probable que ya tengas a tu disposición diferentes datos de tu producción, tu proceso, o de las máquinas que comercializas, y estés intentando obtener un valor a través del estudio de los mismos. A estas alturas ya sabrás que necesitas hacer un análisis de datos efectivo que te permita llegar a los objetivos planteados. Por eso, en este nuevo artículo voy a tratar los puntos que considero más relevantes a la hora de acometer un proyecto de análisis de datos.
Recordemos que en el artículo “Por qué no todas las plataformas pueden habilitar tu negocio digital” ya traté la importancia estratégica de la elección de tecnologías, en esta ocasión me centraré en la ejecución del proyecto de análisis. El objetivo de este artículo no es tratar de forma exhaustiva todos los pasos que conforman un proyecto de este tipo, sino mencionar aquellos puntos que muchas veces se dan por hechos, o que incluso se ignoran, pero que pueden hacer que un proyecto sea exitoso o no. Además, voy a ser muy específico y me voy a centrar en los proyectos de análisis de datos en entornos industriales, ya que ese es mi ámbito de conocimiento.
Pues bien ¿cuáles son esas 6 claves?
- Respetar la especificidad de cada sector
- Evitar la indefinición; es nuestra enemiga
- Entender la relación entre el Analista y el Experto del Dominio
- Crear un lenguaje común y alinear objetivos
- Identificar oportunidades (descubrimiento)
- Lograr las mejoras (optimización)
Veamos pues, punto por punto, cuáles son los aspectos a los que tenemos que prestar especial atención, y cuáles son los errores que se deben evitar:
1.-Respetar la especificidad de cada sector
Existen importantes diferencias entre los trabajos de análisis de datos que se abordan en diferentes sectores. No es lo mismo un proyecto para banca, seguros, salud… que industria. Cada sector requiere incorporar al análisis nociones de conocimiento que son específicas de su ámbito.
Pongamos un ejemplo. Hay una parte importante del trabajo de ingeniería de datos que está relacionado con la calidad de los datos. Por un lado está el cómo analizarla; un equipo de trabajo no especializado en industria no tendrá el conocimiento para poder interpretar ciertas variaciones en los valores leídos como ruido estático proveniente de un cableado incorrecto del bus de campo, por poner un ejemplo basado en situaciones reales. Por otro lado está cómo mejorarla; un equipo de trabajo no especializado en industria difícilmente puede recomendar la sustitución de unos sensores y buses de campo para incorporar el estandar IOLink, poniendo de nuevo un ejemplo basado en situaciones reales.
En ocasiones puede ser interesante experimentar con conocimientos trasversales entre diferentes sectores, pero si lo que queremos es maximizar la probabilidad de tener un buen resultado en un proyecto industrial de análisis de datos, es conveniente trabajar con un equipo especializado.
2.-La indefinición es nuestra enemiga
Existen ciertos movimientos que afirman que es posible introducir un volumen de datos en una “olla a presión” matemática, sin aportar mayores indicaciones, y que de ahí obtendremos resultados en forma de predicciones, optimizaciones, etc. El principal argumento es que el conocimiento específico del entorno introduce ruido, malas prácticas, suposiciones, etc. que afectan a la probabilidad de hacer un hallazgo relevante. No estamos hablando de técnicas de aprendizaje no supervisado, sino al hecho de acometer un proyecto de optimización realizando un trabajo estrictamente matemático sobre los datos, evitando la “contaminación” que pueda provenir desde los Expertos del Dominio, y, por tanto, sin tener una definición clara sobre el problema a resolver. En mi opinión, este enfoque no es el óptimo para el sector industrial.
Llevamos más de una década trabajando en proyectos de análisis de datos en entornos industriales, y hemos aprendido que para poder interpretar adecuadamente los datos capturados en una planta industrial es imprescindible contar con el apoyo del Experto. Este hecho es especialmente relevante al trabajar con la calidad de los datos, ya que el Experto es una pieza fundamental para acometer los cambios necesarios para mejorar dicha calidad (ej. modificación de sensores, instalación de nuevos buses de campo, modificación de ciertos cálculos en autómatas, etc.). El Experto tiene además un rol muy importante, y es el de definir bien el problema al que nos enfrentamos.
Hoy en día ningún ser humano es capaz de vencer a un programa informático de ajedrez. Los algoritmos matemáticos son muy buenos resolviendo todas las posibles combinaciones de jugadas, y esto se debe a que se trata de un problema a resolver bien definido y acotado. Es lo que se les da bien a los ordenadores. Al trabajar con técnicas de Aprendizaje Automático hemos visto que cuanto más precisa sea la definición del problema, mejores resultados obtenemos.
La semana que viene continuaremos revisando el resto de puntos, veremos por qué es tan importante entender la relación entre el Analista y el Experto del Dominio, cómo lograr que el todo equipo esté alineado hacia un mismo objetivo a través de la creación de un lenguaje común, veremos cómo identificar las oportunidades y cómo desplegar las mejoras que finalmente puedan lograr un impacto significativo y cuantitativo en nuestro negocio.
Si quieres saber si tu estrategia no solo es «factible» sino también viable y rentable, te recomiendo que solicites nuestro cuestionario «del 4.0 al 4.1» de 20 preguntas que te servirá para obtener nuestro diagnóstico inicial sin coste, que estoy seguro te ayudará a determinar si estás tomando las decisiones adecuadas.