
Motivos de una mala calidad de datos en un MDM y cómo identificar los datos erróneos
- Posted by admin
- On 2 agosto, 2019
Las distintas fuentes de datos, los errores personales como pueden ser los tipográficos, las cargas y descargas de datos son focos de errores en la unificación de datos que generan en una mala calidad de datos. Es ahí donde debemos prestar especial atención para lograr unos datos limpios que nos proporciones una información correcta que nos sirva para tomar las decisiones acertadas.
Los 4 principales errores de la pérdida de calidad de los datos:
Datos externos
Es habitual incorporar de forma automática en nuestros sistemas de información datos externos que no sean revisados correctamente. Esto genera grandes problemas de calidad de datos
Datos de Entrada
La incorporación de información de forma manual es una de las principales fuentes de errores que afectan de forma directa a la calidad de los datos. Tanto los errores personales como tipográficos o el ruido en la comunicación son los principales responsables de dichos errores.
Errores de carga
Durante la carga de datos de los sistemas transaccionales se suelen producir múltiples errores que afectan de forma directa a la calidad de los datos
Migraciones
Las migraciones de datos son uno de los puntos críticos y deben ser revisados en profundidad para pulir la información ya que muchas veces se incorporan datos obsoletos, con distintos formatos, duplicidades..
Podemos clasificar los errores más comunes durante las migraciones en tres:
• Información incompleta:
Cuando hay campos de datos que no se han cargado o no están completos.
• Sintaxis:
El formato de los datos y su representación suelen dar problemas en las cargas y descargas de los datos ya que las distintas fuentes suelen tener formatos distintos
• Semántica:
Las duplicidades, símbolos que un sistema no traduce o no identifica. Es importante prestar atención a los distintos valores de los datos en cada fuente para una correcta sincronización.
¿Cómo identificar los datos errados?
La identificación de los datos con fallos suele ser una tarea sencilla. Existen dos alternativas para detectar dichos errores:
a) Verificación Manual
Con este método se pueden en teoría identificar los errores principales. Para ello hay verificar todos los campos y valores de la fuente original y ahí analizar que datos son correctos y cuales no.
b) Análisis Automático:
Utilizan tanto el software como la habilidad del analista de calidad de datos para detectar los errores. Éstas se pueden aplicar a:
❖ Transacciones que están ocurriendo.
❖ Bases de Datos que están cambiando.
❖ Bases de Datos en producción, periódicamente.
Las técnicas analíticas bien aplicadas, identifican suficientes errores para dar una idea clara del estado de calidad de datos. Sin embargo un programa continuo de mejora de la calidad de los datos, logra unos mejores resultados y es la que recomendamos desde Decidata.
0 Comments