En la actualidad, el mundo atraviesa una etapa de transformación denominada ‘Era Digital’ en donde la tecnología toma un papel importante. Dentro de las empresas, la transformación se ha evidenciado en el cambio de sistemas informáticos para manejar información, promocionar y vender productos y servicios de una manera más ágil y sin necesidad de la presencialidad. Sin embargo, la información que las empresas almacenan puede verse fragmentada y distribuida entre distintas fuentes según el tipo y uso que se le pueda dar; he aquí la necesidad de contar con un proceso de Match and Merge.

La fragmentación de la información puede ocurrir cuando los departamentos poseen fuentes de datos independiente haciendo necesario que la información sea replicada mediante la implementación de procesos que pueden fallar, ocasionando que la integridad de la información se vea comprometida. 

Esto puede generar que cada una de las partes que hace uso de su fuente tenga información adicional o incompleta respecto a otra. Por ello, surge la necesidad del proceso denominado Match and Merge, que busca unificar la información de todas las fuentes para obtener registros completos y con los datos más actuales

¿Qué debo considerar para tener un proceso de Match and Merge adecuado?

Es esencial el involucramiento de los principales actores y dueños de la información que tienen el conocimiento para definir reglas que permitan: controlar la calidad de los datos, emparejar los registros iguales o similares y escoger los campos y datos más relevantes. 

También es necesario mantener un control a lo largo del proceso mediante el uso de reportes y dashboards que permitan evaluar el proceso. Y contacto con una fuente externa y verificada, que funcione como una fuente de enriquecimiento.

Proceso de Match and Merge 

1.- Diagnóstico de la Calidad de datos

Una de las primeras actividades para realizar se enfoca en evaluar la calidad de los datos mediante la aplicación de reglas que deben ser definidas con los principales usuarios de la información, estas reglas van a ser aplicadas a cada dato que se tenga de cada uno de los registros. La razón de esta evaluación es evitar que datos que puedan estar erróneos sigan avanzando en el proceso, ya que pueden afectar a las fases posteriores. También permite obtener estadísticas que conduzcan a valorar la posibilidad de realizar campañas para completar o actualizar los datos existentes con el fin de que la información que entre en el proceso se encuentre correcta.

2.- Definición de reglas 

Con esto en mente, avanzamos hacia el proceso de Match cuyo objetivo es emparejar todos los registros que resulten similares o iguales y con este resultado realizar el Merge, que tomará la información más completa o actualizada de cada campo para cada registro con el fin de unificarla en lo que se denomina un registro dorado. 

Para lograrlo es necesario el establecimiento de reglas que permitan cumplir con el objetivo del proceso, por ejemplo: se enlazaran los registros que posean la misma identificación y se tomará aquel dato que posea la fecha de actualización más próxima a la fecha actual. Una buena práctica es definir las reglas de manera clara y precisa, con toda la información que sea necesaria para poder aplicarla, tomando en cuenta el objetivo que es conseguir un registro dorado, completo y actualizado.

Adicionalmente, es posible agregar una fuente de datos externa que proporcione información completa, veraz y actualizada; con el fin de que los datos que se tomen de dicha fuente aporten a la generación del registro dorado. 

3.- Verificación de reglas 

Finalmente, es conveniente manejar una serie de reportes a lo largo de todo el proceso que permitan verificar que las reglas aplicadas están siendo efectivas y que se está logrando el objetivo. 

Para ello, una buena práctica es tener reportes que brinden: 

  • estadísticas de los datos que cumplen las reglas de calidad, 
  • estadísticas de la cantidad de registros totales, la cantidad de emparejamientos, 
  • estadísticas de los registros que componen cada una de las relaciones,
  • estadísticas de los datos que conforman el conjunto final de resultados, 

Estos reportes deben ser definidos de acuerdo con la necesidad del negocio y el objetivo que se tiene en la unificación de los datos.

El proceso de Match and Merge permitirá que todas las distintas fuentes de información contengan los mismos datos y que estos se encuentren actualizados. Es necesario que los dueños de la información se involucren de manera proactiva en el proceso, desde la generación de reglas hasta la revisión de las estadísticas y reportes, con el fin de que el proceso se retroalimenta y sea mejorado según las necesidades del negocio y de la información.

Si deseas obtener más información sobre el proceso de Match and Merge y las buenas prácticas que se pueden aplicar, solicite un Demo en nuestra página.


Bibliografía:

Llamas, J. (2021, mayo 11). Era digital. Retrieved from economipedia: https://economipedia.com/definiciones/era-digital.html

Deja un comentario

This site uses Akismet to reduce spam. Learn how your comment data is processed.