Los maestros de datos han sido reconocidos como uno de los tipos de información empresarial más importantes a gestionar. Las organizaciones van en la dirección correcta al implementar sistemas de gestión de maestro de datos (MDM) para tomar el control de datos críticos como clientes, productos, empleados, proveedores, materiales, ubicaciones, etc.

La principal ventaja de esta arquitectura es su capacidad para proporcionar una vista completa y precisa de toda la empresa, a menudo denominada “Vista de 360 ​​grados” o “Vista única de la verdad”  para varios dominios de datos maestros.

Como lo menciona Prash Chandramohan en su artículo “factores clave en la arquitectura de una solución de datos maestros”.  Cuando una empresa está implementando un centro de MDM, quiere decir que está construyendo un sistema que tendrá una huella en todos los departamentos y líneas de negocios de la organización.

¿Por qué implementar una solución de Maestro de Datos?  

La razón más citada para implementar MDM es reducir los datos sucios en la organización. La limpieza de datos es un proceso difícil, repetitivo y engorroso. La política y la naturaleza de los datos y los silos que existen en la organización pueden sumarse al lío para hacerlo aún más desafiante.

Prash Chandramohan, en su mismo artículo menciona que un papel importante durante el inicio de implementación de un maestro de datos es el del arquitecto de la solución: el que debe tener la imagen completa de la solución que involucra aplicaciones y tecnologías para la creación de perfiles, la limpieza de datos, la consolidación, el enriquecimiento, la duplicación y la sincronización, que son ingredientes clave de la receta de MDM. 

No se puede construir una casa sin un plano. Lo mismo se aplica a las implementaciones de MDM. Establecer la base adecuada y diseñar la solución teniendo en cuenta los objetivos a largo plazo es crucial.

5 factores clave en una solución de Maestro de Datos

Prash Chandramohan señala los cinco factores clave que un arquitecto de soluciones debe tener en cuenta durante el diseño del centro de MDM. 

  1. Elaboración de perfiles de datos para comprender el estado actual de la calidad de los datos
  2. Mecanismos de integración de datos  para consolidar los datos
  3. Diseño de un repositorio de datos maestros extensible
  4. Robusta funcionalidad de coincidencia de datos y supervivencia
  5. Sincronización perfecta de datos maestros

1.- Elaboración de perfiles de datos:

En primer lugar se necesita a alguien que pueda determinar en qué parte los datos están sucios. Las herramientas de creación de perfiles de datos hacen eso por ti. La creación de perfiles de datos no solo brindan información extremadamente útil sobre la calidad de los datos, sino que también ayudan a descubrir las características subyacentes y las discrepancias asociadas con los datos.

2.- Mecanismos de integración de datos para consolidar los datos

Si bien la creación de perfiles de datos ayuda a determinar las reglas requeridas, las herramientas de integración de datos realmente transforman los datos. Ayudan a aplicar numerosas reglas para que se pueda alcanzar un estado intermedio de limpieza de datos.

Prash Chandramohan menciona que históricamente, las herramientas de integración de datos han ayudado a las empresas a recopilar, transformar y cargar datos de manera eficiente y eficaz durante fusiones y adquisiciones, o durante la optimización de diferentes departamentos. Cuando se trata de implementaciones de MDM, estas herramientas juegan un papel crucial, ya que pueden “hacer o deshacer” el establecimiento de un centro de MDM.

3.- Diseño de un repositorio de datos maestros extensible

Un modelo de datos flexible es una característica clave de la gestión de maestro de datos que elija. Dependiendo del dominio implementado, habrá cambios en el modelo. Chandramohan recomienda que se elija estas modificaciones con cuidado, teniendo en cuenta el uso a largo plazo de los elementos de datos.

Las implementaciones multidominio se han vuelto muy comunes recientemente. Por lo general, se necesita implementar al menos dos o tres dominios juntos (cliente-ubicación-cuenta, cliente-ubicación-producto, producto-ubicación, etc.). Lo que Chandramohan recomienda es considerar un enfoque que admita una gestión más sencilla de estos dominios y las complejas relaciones entre ellos.

La seguridad es otro aspecto importante de la solución. Dado que MDM es una solución para toda la empresa, debe admitir la integración con los registros de seguridad existentes de la organización.

4.- Robusta funcionalidad de coincidencia de datos y supervivencia

Un motor de coincidencia aproximada potente y efectivo es imprescindible para eliminar datos duplicados o redundantes. El primer desafío es determinar si hay coincidencias. Averigüe la definición comercial de ‘una coincidencia’ en su organización. Para definir esto, Chandramohan recomienda elaborar una lista de elementos críticos que son necesarios para la coincidencia. A continuación, debe asignar pesos a estos elementos. Por ejemplo, una coincidencia de número de teléfono tiene más peso que una coincidencia de nombre o una coincidencia de fecha de nacimiento. 

La supervivencia de los datos es otro rompecabezas importante. Prash recomienda encontrar las mejores respuestas para las siguientes preguntas cuando fusione dos o más registros duplicados:

  • ¿Qué elementos de datos sobreviven cuando se realice la fusión?
  • ¿Cómo sincronizar estos datos con los sistemas de origen para que todos los que producen los datos conozcan este cambio?
  • ¿Cómo manejar escenarios cuando se fusionan dos no duplicados?.

5.- Sincronización perfecta de datos maestros

Los arquitectos dedican mucho tiempo a la integración del sistema. No hay excepciones aquí. La gestión de maestro de datos debe integrarse a la perfección con una variedad de aplicaciones. Ya sea el sistema responsable de la entrada de datos, el almacén de datos o el sistema de inteligencia comercial, MDM debe llevar la información correcta a la persona correcta en el momento correcto.

Prash Chandramohan recomienda considerar los siguientes puntos:

  • Automatización y sincronización rápida de datos que aseguran que se mantenga una mayor calidad de datos entre transiciones.
  • Cuando se consolidan registros duplicados, encuentra una manera de sincronizar esta actualización con las fuentes mientras aún existen. Para mostrar el valor agregado por MDM, deberá permitir la comunicación bidireccional entre MDM y las fuentes existentes de datos maestros.
  • Se debe pensar en la frecuencia con la que los datos fluyen hacia las aplicaciones posteriores, como el almacén de datos empresarial, la inteligencia comercial y los mercados de datos. Aunque la mayoría de estas aplicaciones necesitan cambios delta al menos una vez al día, algunas pueden requerir actualizaciones en tiempo real.
  • Disponibilidad de elementos de datos clave para los usuarios comerciales y administradores de datos para un análisis más profundo.
  • Saber qué tipo de mecanismo de transferencia de datos se ajusta a un punto de integración de datos determinado es fundamental. 

Hay muchos casos en los que las soluciones tienen una arquitectura deficiente y por lo tanto agregan más tiempo y esfuerzo para aprovechar todo el potencial de MDM. Es indispensable contar con un equipo especializado y con experiencia en esta área. Si estás buscando realizar un proyecto de gestión de datos, puedes contactarnos para tener una demo personalizada.

 


Artículo original: revista Hub Designs

Blog Origigianl: Prash Chandramohan. http://www.mdmgeek.com. five-key-factors-in-architecting-a-master-data-solution. 2013

Deja un comentario

This site uses Akismet to reduce spam. Learn how your comment data is processed.