PREPARACIÓN DE DATOS

FASE DE PREPARACIÓN DE DATOS


Finalizada la fase de recolección de los datos, se procede al alistamiento de los datos para la posterior construcción del cubo de datos. La fase de preparación de datos consta de las siguientes etapas: 
1. Selección de datos: se seleccionan los datos de la fase anterior, utilizando como criterio de selección la calidad de los datos en cuanto a completitud y consistencia. 
2. Limpieza de los datos: se optimiza la calidad de los datos mediante la aplicación de técnicas que eliminen datos paralizantes, valores fuera de rango y caracteres extraños; algunas de estas técnicas son: normalización de datos, discretización de campos numéricos y tratamiento de valores ausentes. 
3. Estructuración de los datos: se realizan operaciones de alistamiento sobre los datos, las cuales generan nuevos atributos a partir de los ya existentes y transforman los valores de los ya existentes. 
4. Integración de los datos: se crean nuevas estructuras que unifican los datos, para esto se fusionan tablas que contengan atributos diferentes de un mismo objeto y se generan nuevos campos y registros que resuman los actuales. 
5. Formateo de los datos: se realizan transformaciones sintácticas de los datos sin modificar su significado, esto se consigue mediante la reordenación o ajuste de los campos y registros de las tablas; también se eliminan comas, tabuladores, caracteres especiales, máximos y mínimos para las cadenas de caracteres.

Comentarios

Entradas populares de este blog

RECOLECCIÓN DE LOS DATOS

LEVANTAMIENTO DE REQUERIMIENTOS