¿Dónde están tus datos sensibles? Cómo descubrirlos y protegerlos con Purview

César Oviedo
Feb 8
4 min read

Updated: May 11

Una de las preguntas mas incomodas para cualquier organizacion es tambien una de las mas importantes: ¿sabemos realmente donde estan nuestros datos sensibles? La respuesta suele ser mas compleja de lo que parece. Los datos sensibles no viven solamente en bases de datos corporativas o sistemas core. Tambien aparecen en archivos exportados, reportes, lakehouses, carpetas compartidas, modelos semanticos, notebooks, documentos, correos, aplicaciones de negocio y, cada vez mas, en soluciones de inteligencia artificial.

Por eso, proteger datos sensibles ya no puede tratarse como una actividad aislada de seguridad o cumplimiento. Tiene que convertirse en una capacidad operativa que conecte gobierno de datos, privacidad, seguridad, auditoria y arquitectura. Microsoft Purview puede ser una pieza clave, pero solo cuando se implementa con una estrategia clara de riesgo, clasificacion, etiquetas, politicas y adopcion.

Idea central: descubrir datos sensibles no es el final del camino. Es el inicio de un modelo de proteccion, uso responsable y monitoreo continuo.

Figura 1. De datos ocultos a datos protegidos.

El problema: la organizacion no protege lo que no ve

Muchas empresas tienen controles de acceso, politicas de privacidad y herramientas de seguridad, pero aun asi mantienen zonas oscuras donde los datos sensibles circulan sin suficiente visibilidad. Esto ocurre porque el dato se mueve mas rapido que los controles tradicionales: se copia, se transforma, se exporta, se consume en dashboards, se comparte en archivos y se reutiliza para nuevos casos de analitica o AI.

El riesgo real no esta solamente en que exista informacion sensible. El riesgo aparece cuando no se conoce donde esta, quien la usa, con que finalidad, bajo que nivel de permiso y con que evidencia de control. En ese punto, la organizacion pierde capacidad para responder ante incidentes, auditorias, solicitudes regulatorias o evaluaciones de privacidad.

Datos sensibles: no todo se reduce a PII

Cuando se habla de datos sensibles, muchas personas piensan automaticamente en informacion personal identificable. Eso es correcto, pero incompleto. Una estrategia madura debe considerar varias categorias de sensibilidad: datos personales, datos financieros, informacion regulada, secretos tecnicos, credenciales, propiedad intelectual, informacion contractual, datos de salud, datos de menores, informacion comercial sensible y cualquier dato que pueda generar impacto si se expone, manipula o usa fuera de contexto.

La clasificacion debe responder a dos preguntas: que tan sensible es el dato y que tan expuesto esta. Un dato altamente sensible pero muy controlado representa un riesgo distinto a un dato moderadamente sensible que se comparte masivamente sin trazabilidad.

Figura 2. Matriz de sensibilidad vs. exposicion.

Como ayuda Microsoft Purview

Microsoft Purview integra capacidades que permiten conocer, clasificar, proteger y monitorear datos. En el ambito de gobierno, Purview Data Map y Unified Catalog ayudan a inventariar activos, capturar metadatos, conectar glosario, owners, linaje y contexto de negocio. En el ambito de informacion protegida, Purview Information Protection permite trabajar con tipos de informacion sensible, clasificadores, etiquetas de sensibilidad y politicas que ayudan a proteger el contenido donde vive o se mueve.

La potencia esta en conectar estas capacidades. Un escaneo aislado puede encontrar columnas o archivos sensibles, pero un modelo operativo completo debe transformar ese hallazgo en decision: asignar owner, validar criticidad, aplicar etiqueta, restringir acceso, activar DLP cuando corresponda, monitorear actividad y documentar evidencia.

Figura 3. Capacidades de Purview para gestionar datos sensibles.

El error mas comun: empezar por etiquetas sin modelo de riesgo

Uno de los errores mas frecuentes es crear una taxonomia de etiquetas demasiado compleja antes de tener claridad sobre los riesgos que se quieren controlar. El resultado suele ser baja adopcion, usuarios confundidos y controles inconsistentes. Una etiqueta solo es util si las personas entienden cuando usarla y si, ademas, esta conectada con consecuencias operativas: proteccion, restriccion, auditoria o aprobacion.

Otro error es clasificar todo sin priorizar. El volumen de hallazgos puede ser tan grande que el equipo pierde foco. Lo recomendable es empezar por dominios o fuentes de alto impacto: clientes, finanzas, recursos humanos, datos regulatorios, modelos semanticos ejecutivos o datasets usados por soluciones de AI.

Figura 4. Errores comunes y enfoque correcto.

Un modelo practico en cinco decisiones

Para implementar proteccion de datos sensibles con criterio empresarial, conviene tomar cinco decisiones antes de escalar la tecnologia:

• Definir que categorias de sensibilidad importan para la organizacion y como se traducen en una taxonomia simple.

• Identificar fuentes, dominios y procesos donde la exposicion puede generar mayor impacto.

• Asignar responsables de negocio y seguridad para validar hallazgos y decidir acciones.

• Conectar clasificacion y etiquetas con politicas reales: acceso, DLP, monitoreo, retencion o excepciones.

• Medir reduccion de riesgo, no solamente cantidad de activos escaneados o etiquetas aplicadas.

Roadmap sugerido de 90 dias

Una implementacion efectiva no tiene que intentar cubrir todo el ecosistema desde el inicio. El enfoque correcto es incremental: seleccionar datos criticos, descubrir donde estan, clasificar los hallazgos, aplicar controles y demostrar mejora medible.

Figura 5. Roadmap de 90 dias para proteger datos sensibles con Purview.

Que medir para saber si funciona

Las metricas deben reflejar impacto operativo. Por ejemplo: porcentaje de activos criticos clasificados, fuentes con datos sensibles descubiertas, hallazgos sin owner, datasets sensibles sin etiqueta, accesos excesivos corregidos, politicas DLP activadas, incidentes investigados, reduccion de exposicion y tiempo de respuesta ante auditoria.

La madurez no se demuestra con mas etiquetas, sino con mejor control. Una organizacion madura puede responder con evidencia: donde estan sus datos sensibles, quien los usa, como se protegen, que excepciones existen y como se monitorea el cumplimiento.

Conclusion

En el mundo actual, los datos sensibles se mueven entre cloud, plataformas analiticas, herramientas de productividad y soluciones de AI. La respuesta no puede ser solo bloquear, ni tampoco confiar ciegamente en que los usuarios sabran que hacer. La respuesta es visibilidad, clasificacion, proteccion proporcional al riesgo y monitoreo continuo.

Microsoft Purview puede ayudar a construir esa capacidad, pero el exito depende de conectar tecnologia con gobierno de datos, seguridad, privacidad y responsabilidad de negocio. La pregunta ya no es si existen datos sensibles. La pregunta clave es si la organizacion sabe donde estan, que riesgo representan y que controles los protegen.