FASE DE PREPARACIÓN DE DATOS
FASE DE PREPARACIÓN DE DATOS
Finalizada la fase de recolección de los datos, se procede al alistamiento
de los datos para la posterior construcción del cubo de datos. La fase de
preparación de datos consta de las siguientes etapas:
1. Selección de datos: se seleccionan los datos de la fase anterior,
utilizando como criterio de selección la calidad de los datos en cuanto a
completitud y consistencia.
2. Limpieza de los datos: se optimiza la calidad de los datos mediante
la aplicación de técnicas que eliminen datos paralizantes, valores fuera de
rango y caracteres extraños; algunas de estas técnicas son: normalización
de datos, discretización de campos numéricos y tratamiento de valores
ausentes.
3. Estructuración de los datos: se realizan operaciones de
alistamiento sobre los datos, las cuales generan nuevos atributos a partir
de los ya existentes y transforman los valores de los ya existentes.
4. Integración de los datos: se crean nuevas estructuras que unifican
los datos, para esto se fusionan tablas que contengan atributos diferentes
de un mismo objeto y se generan nuevos campos y registros que resuman
los actuales.
5. Formateo de los datos: se realizan transformaciones sintácticas
de los datos sin modificar su significado, esto se consigue mediante la
reordenación o ajuste de los campos y registros de las tablas; también se
eliminan comas, tabuladores, caracteres especiales, máximos y mínimos
para las cadenas de caracteres.

Comentarios
Publicar un comentario