Las organizaciones tienen cada vez más dificultades para proteger la información estratégica, como la propiedad intelectual y los secretos comerciales. De hecho, los sistemas de seguridad de datos tradicionales se diseñaron principalmente para identificar y proteger tipos de datos estructurados, como los datos de identificación persona (PII), la información sanitaria y los datos de pago. Esos sistemas tienen dificultades para comprender los datos no estructurados, en particular los documentos, ya que se centran en elementos de datos discretos en lugar de en el contexto más amplio o el propósito de la información. Les resulta difícil identificar los documentos empresariales confidenciales a menos que esos documentos se ajusten a patrones predefinidos.
Los clasificadores impulsados por IA están cambiando las reglas del juego. Estos clasificadores utilizan grandes modelos de lenguaje (LLM) entrenados con grandes conjuntos de datos de documentos empresariales. Con este entrenamiento, aprenden a reconocer tipos de documentos complejos, como secretos comerciales, formularios médicos, documentos de cumplimiento y acuerdos legales. Los clasificadores impulsados por IA van más allá de las simples palabras clave. Utilizan el contexto y la comprensión semántica para categorizar los documentos según la función empresarial y la intención. A medida que entrenan con más datos de la empresa, estos clasificadores de aprendizaje automático se adaptan al lenguaje, la estructura y los flujos de trabajo propios de la organización. Desarrollan continuamente su capacidad para identificar dónde reside la información crítica y cómo se mueve. Esto permite a las empresas adoptar estrategias de protección de datos más precisas y proactivas.
¿Qué son los clasificadores preentrenados?
Los clasificadores preentrenados de Proofpoint ofrecen una forma eficaz de identificar y proteger documentos estratégicos. Estos incluyen código fuente, documentos contables y fiscales, archivos de empleados, acuerdos y contratos. Nuestros clasificadores impulsados por IA se optimizan con LLM que categorizan los documentos en tiempo real. Al combinar modelos de IA de código abierto con algoritmos propietarios y un proceso que le permite validar los resultados, Proofpoint puede identificar el objetivo de un documento y categorizarlo con una confianza del 85 % o superior.
Puede utilizar clasificadores de LLM preentrenados en políticas DLP para proteger contenido nuevo o previamente ignorado, sin necesidad de una clasificación previa. Esto ahorra tiempo y esfuerzo. Cuando se combinan con la comparación de patrones, los clasificadores LLM también ayudan a reducir los falsos positivos. Por ejemplo, con Proofpoint Enterprise DLP, puede permitir que su equipo de RR. HH. comparta documentos sensibles internamente, al mismo tiempo que elimina automáticamente los permisos si esos documentos se comparten fuera del equipo.
Las alertas enriquecidas con LLM también ayudan a los analistas a clasificar e investigar los incidentes más rápidamente. Por ejemplo, si se activa una alerta por una correspondencia de patrones de documentos nacionales de identidad, Proofpoint Enterprise DLP puede identificar si el documento está relacionado con el impuesto sobre la renta, un formulario de paciente o una solicitud de crédito.
Sin embargo, los clasificadores de LLM preentrenados pueden presentar limitaciones. Debido a que se basan en datos empresariales estáticos y etiquetas fijas, no se adaptan bien a las amenazas en constante evolución, ni a los cambios en los contextos empresariales, ni a los fines de los documentos. Pueden pasar por alto señales sutiles, lo que da lugar a clasificaciones erróneas o falsos positivos. Por eso los clasificadores de aprendizaje automático se están volviendo esenciales.
Figura 1: Clasificador de IA preentrenado para un extracto bancario en la categoría de documentos "Accounting-Tax" (Contabilidad/Impuestos).
¿Qué son los clasificadores de aprendizaje automático?
Los clasificadores de aprendizaje automático de Proofpoint están diseñados para identificar información nueva o única para su organización. Se adaptan continuamente observando las interacciones en tiempo real, los patrones de acceso y el contexto del comportamiento. Esto permite una clasificación de datos más precisa, dinámica y resiliente, con una intervención humana mínima.
Basándose en clasificadores de LLM previamente entrenados, los clasificadores de aprendizaje automático refinan dinámicamente sus propios modelos mediante la observación de los patrones de datos ocultos de una organización. Mediante el uso de la IA generativa, pueden predecir y nombrar automáticamente nuevas categorías de datos y documentos, como nuevos formatos de datos de identificación personas (PII) o nuevos artículos de investigación.
Este enfoque impulsado por IA permite a nuestra solución de seguridad de los datos mejorar continuamente la precisión de la clasificación en función del contexto de los datos en directo, lo que reduce los falsos positivos y las lagunas de cobertura. Y debido a que se integra perfectamente con Proofpoint Enterprise DLP y Proofpoint Data Security Posture Management, no solo clasifica el contenido sensible, sino que también aplica protecciones adaptables en tiempo real. Estas protecciones incluyen la revocación de privilegios de acceso excesivos o la notificación de categorías de documentos o datos de alto riesgo. De esta forma, obtendrá una defensa totalmente automatizada y escalable contra la filtración de datos y la exposición de datos.

Figura 2: Clasificador de IA de aprendizaje y nomenclatura automáticas para domiciliaciones bancarias, una subcategoría dentro de la categoría "Bank Statement" (Extracto bancario).
¿Cómo ayudan los clasificadores de aprendizaje automático a encontrar el equilibrio justo entre innovación y privacidad?
Los clasificadores de aprendizaje automático aprenden de patrones de comportamiento e indicios contextuales sin exponer contenido sensible. Al compartir únicamente información anonimizada o agregada, reducen los riesgos de privacidad y mejoran la precisión de la clasificación. Este enfoque ofrece una protección de datos adaptable que no compromete la confidencialidad ni el cumplimiento normativo.
¿Cómo ayuda el enfoque unificado de seguridad de los datos impulsado por IA de Proofpoint?
La clasificación de datos y documentos impulsada por IA es el primer paso esencial hacia una seguridad y un cumplimiento de datos más inteligentes y basados en agentes. Funciona como el sistema sensorial de su empresa, permitiendo a los agentes de seguridad automatizados (el sistema nervioso) ver, comprender y responder a los riesgos. Al dar sentido a los datos, estos clasificadores permiten a los agentes de seguridad actuar con inteligencia y precisión.
Sin una clasificación precisa, los agentes de IA no tienen el contexto necesario para aplicar las políticas, detectar anomalías o responder a las amenazas. Los clasificadores de IA resuelven esto identificando información sensible, como los datos de identificación personal (PII), la información sanitaria, los datos de pago, el código fuente y los documentos nuevos o únicos para su organización, en aplicaciones cloud, endpoints, correo electrónico y espacios de almacenamiento. Permiten la categorización y etiquetado en tiempo real. Esto orienta las acciones posteriores, como el bloqueo de las transferencias de archivos de riesgo, la revocación accesos, la remisión de incidentes internos o la aplicación del cifrado.
A medida que los entornos se vuelven más complejos y dinámicos, la clasificación impulsada por IA puede evolucionar para gestionar petabytes de datos y millones de archivos y mensajes. Pueden proporcionar información continua a los sistemas de seguridad agénticos. A su vez, los agentes de IA pueden ajustar las políticas y respuestas en función de la confianza, la gravedad y la correspondencia normativa de la clasificación. Esto contribuye a garantizar el cumplimiento de marcos como el Reglamento General de Protección de Datos (RGPD), la Ley sobre portabilidad y responsabilidad de los seguros de salud (Health Insurance Portability and Accountability Act, HIPAA) la Ley de Privacidad del Consumidor de California (California Consumer Privacy Act, CCPA), sin una reconfiguración manual constante.
Así como el cuerpo no puede reaccionar ante el peligro sin estímulos sensoriales, la seguridad autónoma de los datos no puede funcionar sin entender qué datos y documentos protege. La clasificación impulsada por IA proporciona la visión y la concienciación que permiten a los agentes de seguridad y cumplimiento actuar de manera rápida, precisa y a gran escala.
Más información
Para obtener más información sobre nuestros clasificadores impulsados por IA y las soluciones de seguridad de los datos de Proofpoint, vea el webinar Defend Data Innovations.