Data Preparation

Podemos comparar Data Preparation con la selección de productos de óptima procedencia para preparar con excelencia una receta de cocina: sin buenos productos no es posible llegar a una preparación memorable - y nadie espera pedir un plato o comida para recibir un producto final medio, ¿No es cierto?

Con el tratamiento de datos no es muy diferente. Se realiza un pre-procesamiento de estos datos, donde se recogen de sus respectivas fuentes, son sanitizados y tratados, con la finalidad de perfeccionar la calidad, para que al final del proceso sean consistentes y sean utilizados en el apoyo de decisiones estratégicas de negocio.

Es justamente esta consistencia que vuelve a la práctica de Data Preparation una herramienta tan poderosa, después de todo es lo que va a unir diversas fuentes de datos y proporcionar insights de negocios relevantes. Este proceso puede ser laborioso para quien todavía tiene sus datos sin tratamiento, pero ciertamente es muy compensatorio. Dedicar un tiempo exclusivamente para evaluar las fuentes y setups de datos ahora, hará que en el futuro, en un proyecto que involucre analytics, no sea necesario hacer esta evaluación, disminuyendo así el tiempo de ejecución de proyectos futuros.

Guiándose por los principios de Data Governance y resguardándose con actividades de muestreo, herramientas de profiling, visualizaciones y el compromiso de todos los equipos interesados, es posible desarrollar un proyecto eficiente de Data Preparation, que genere datos concretos y en los cuales los usuarios y equipos involucrados puedan confiar.