Gobierno de Datos
En los últimos años, el entorno corporativo, acostumbrado a hablar y escuchar muchos términos financieros /gerenciales, ha sido testigo de una avalancha de jerga técnica como Analytics, Inteligencia
Artificial, Data Lake, Deep Learning y Bots de Chat, entre otros.
La transformación digital definitivamente ha cambiado la forma en que las empresas manejan cuestiones de precios que, hasta ahora, se han considerado inversiones de alto riesgo y más asociadas con la ciencia ficción que con los negocios en el mundo corporativo.
¿Por qué sucedió esto? Puedes preguntar.
Porque una larga línea de casos de éxito ha demostrado que la Inteligencia Artificial y la Ciencia de Datos no solo son las últimas palabras de moda, sino que proporcionan resultados valiosos.
Incluso los “adoptantes tardíos” necesitan adaptarse a esta nueva realidad o se quedarán atrás.
Sin embargo, después de toda la emoción generada por este nuevo mundo de la IA, muchas preguntas siguen abiertas sobre cómo entrar en este nuevo campo de campaña publicitaria con éxito y de manera sostenible, asegurándonos de que no nos unimos a una canoa que se hunde en medio de un Data Lake.
Muchas preguntas siguen abiertas sobre cómo entrar en este nuevo campo de campaña publicitaria con éxito y de forma sostenible, asegurándonos de que no nos unimos a una canoa que se hunde en medio de un lago de datos.
En este punto, comenzamos a enfrentarnos a muchas otras jergas, como MVP (Viable Minimum Product) y POC (Proof of Concept), que fueron diseñados originalmente para permitir el desarrollo continuo del producto y probar nuevas ideas antes de la adopción masiva.
Aunque terminan siendo utilizados para proyectos a corto plazo sin ningún tipo de base real, nunca se convertirán en productos sostenibles.
Sin embargo, si se utilizan correctamente, estos métodos nos permiten medir la verdadera calidad del camino que estamos siguiendo para lograr nuestros objetivos y fracasar rápidamente, o al menos aprender rápidamente, aplicando la famosa Metodología Agile.
Así, nacen muchos otros términos, tales como “squads”, “hubs”, “icebox”, “labs”, entre otros
En este artículo, nos gustaría señalar un término más a menudo olvidado y evitado, que, aunque se considera el patito feo de este nuevo mundo de la IA, debe tenerse en cuenta y destacarse, Gobierno de datos.
La Gobernanza de Datos no es un problema nuevo, ha existido durante algún tiempo, pero en la nueva era del Big Data, la negligencia puede conducir a un Gran Problema.
Aquí hay algunos consejos rápidos sobre cómo tratar con el gobierno de datos y algunos puntos a tener en cuenta (y tal vez en un post-it en su escritorio).
¿Vamos a hablar sobre seguridad?
Al pensar en la Recopilación de Datos, es importante pensar siempre en la ciberseguridad, ya que cada canalización de datos que conecta el almacén de datos a sus orígenes de datos (dispositivos IoT, bases de datos externas, …).
Puede requerir amplios permisos de firewall que inicialmente pueden acelerar su proyecto haciéndolo más “Agile”, pero también haciéndolo más vulnerable a los ataques cibernéticos, tanto internos como externos.
Trabajar junto con su equipo de ciberseguridad y construir las DMZ (Zonas Desmilitarizadas) es una necesidad para cualquier proyecto exitoso relacionado con los datos
De hecho, la misma preocupación se aplica no sólo a la colección, sino también al consumo posterior por grupos especiales y paneles predictivos y prescriptivos.
La gestión de identidades, incluso mediante procesos manuales, y el acceso a cuentas y servicios de usuario son fundamentales para evitar la exposición inconsciente de información a audiencias que incluso autenticadas no deben ser autorizadas.
Además, las discusiones sobre el GDPR (General Data Protection Regulation) que abordan directamente la especialización de la protección de datos personales también son extremadamente relevantes en la gestión de la IA, ya que el usuario debe dar su consentimiento previo para el tratamiento de sus datos personales, por lo que es necesario adaptar los sistemas de usuario final que eventualmente se conviertan en fuentes de datos para análisis avanzados.
¿Cómo puedo almacenar mis datos?
En lugar de seguir los rebaños, adoptar todo tipo de lagos de datos, como tecnologías, comprender sus casos de uso, comenzar con “por qué” en lugar de “qué” es un factor importante para determinar la tecnología de repositorio de datos en su estrategia de gobierno de datos.
El uso de un lago de datos para casos de uso que requieren esquemas rígidos o el uso de una base de datos tradicional para almacenar datos no estructurados conduce a la ineficiencia y al aumento de los costos. Sólo “creer” en alguna tecnología y mencionar una jerga dos veces al día no es garantía de éxito.
Es importante que su grupo de trabajo pueda tener una visión clara de los casos de uso y así identificar las reglas de uso.
Además, siempre vale la pena estudiar su propio legado, la reutilización, porque a menudo no es una cuestión de revolución, sino de evolución de la gestión de datos.
Como ejemplo, los historiadores a menudo funcionan bien para el mundo de las series temporales industriales y el tema en lugar de reemplazar se vuelve complementario, integrando.
Un punto muy relevante para los repositorios también es sobre el catálogo de diccionarios/datos, de lo contrario, por ejemplo, su Data Lake puede convertirse en un pantano de Big Data.
Además, siempre vale la pena estudiar su propio legado, la reutilización, porque a menudo no es una cuestión de revolución, sino de evolución de la gestión de datos.
Contratos
Por contrato, nos referimos a la relación entre entidades, estableciendo el nivel de confianza entre las partes con sus deberes y derechos.
Es posible que los orígenes de datos se utilicen como base de datos para modelos de IA y que estén bajo la gestión de un departamento diferente.
No ignore este hecho, identifique a personas responsables, configure foros, empatice, comprenda los problemas de rendimiento de acceso, trate el Acuerdo de Nivel de Servicio (SLA) y el Acuerdo de Nivel de Operación (OLA).
Peopleware:
Su equipo necesita al menos un administrador de datos, un arquitecto de datos y un cliente potencial de calidad de datos.
Data Steward (administrador de datos): el punto focal para problemas relacionados con los datos para un tema en particular.
Responsable de mapear los nuevos datos que se van a adquirir, asegúrese de que el proyecto cumple con las regulaciones de datos, diseñar formas de medir la calidad de los datos y también supervisar el uso de datos.
Data Quality Lead: responsable de supervisar y garantizar la estabilidad y continuidad del entorno de almacenamiento de datos.
Comprueba rutinariamente la calidad y la integridad de los datos.
Bueno, en este momento, esperamos que aprecie y entienda a fondo que Data Governance es una base fundamental para una transformación digital saludable y sostenible en su organización.
Esperamos que haga un buen uso de toda la información anterior y disfrute de la transformación digital en su lugar de trabajo.
Discover the: VALE