Data Preparation

Podemos comparar o Data Preparation com a seleção de produtos de ótima procedência para preparar uma receita com excelência: sem bons produtos não é possível chegar em uma preparação memorável  - e ninguém espera pedir um prato ou refeição para receber um produto final médio, não é mesmo?

Com o tratamento de dados não é muito diferente. É feito um pré-processamento destes dados, onde eles são recolhidos de suas respectivas fontes, higienizados e tratados, com a finalidade de aperfeiçoar a qualidade, para que no final do processo eles estejam consistentes e sejam utilizados no apoio de decisões estratégicas de negócio.

É justamente esta consistência que faz com que o Data Preparation seja uma ferramenta tão poderosa, afinal é quem irá unir diversas fontes de dados e fornecer insights de negócios relevantes. O processo pode ser trabalhoso para quem ainda tem os dados sem tratamento, mas certamente é muito compensatório. Dedicar um tempo exclusivamente para avaliar as fontes e setups de dados agora irá fazer com que futuramente, em um projeto que envolva analytics, não seja necessário fazer esta avaliação, diminuindo o tempo de execução de projetos futuros.

Guiado pelos princípios de Data Governance e resguardado por atividades de sampling, ferramentas de profiling, visualizações e o comprometimento de todas as equipes interessadas, é possível desenvolver um projeto eficiente de Data Preparation, gerando dados concretos e nos quais os usuários e equipes envolvidas podem confiar.