Революционная классификация данных: CipherTrust DDC интегрирует машинное обучение для повышения безопасности

Всесторонний анализ решения Thales для обнаружения и классификации данных на основе машинного обучения

В стремительно развивающейся датасфере, где, по оценкам, 80% данных являются неструктурированными, традиционные ручные методы классификации данных устаревают из-за своей трудоемкости и подверженности ошибкам. Thales решает эту проблему с помощью CipherTrust Data Discovery and Classification (DDC) – решения, усовершенствованного моделями машинного обучения (ML). Эти модели играют решающую роль в автоматизации классификации данных, значительно повышая точность и эффективность в сложных гибридных ИТ-средах.

Первым шагом в классификации данных является их обнаружение, что крайне важно для соблюдения глобальных правил защиты данных. CipherTrust DDC эффективно ориентируется в разнообразных хранилищах данных, классифицируя их по степени чувствительности и риска, независимо от того, где они хранятся – в помещениях, на серверах сторонних компаний или в облаке.

Инновационный подход Thales сочетает в себе сопоставление шаблонов и ML для установления значимых связей между разрозненными точками данных. Эта гибридная техника не только находит данные в IT-системах, но и контекстуализирует их, повышая точность классификации. Компонент ML универсален и использует разные модели для различных задач, таких как категоризация и распознавание именованных сущностей (NER).

Система сопоставления шаблонов CipherTrust DDC, работающая на движке GLASS™ от Ground Labs, охватывает широкий спектр типов данных и соответствует многочисленным законам о конфиденциальности данных. Сюда входят личные, финансовые и медицинские данные, а также потенциально скомпрометированная информация вроде закодированных закрытых ключей.

NER, ключевая функция CipherTrust DDC, использует обработку естественного языка (NLP) для извлечения таких сущностей, как имена и даты, из неструктурированного текста, что избавляет от необходимости ручного анализа. Этот процесс отлично масштабируется и адаптируется к различным типам документов и языкам.

Наконец, CipherTrust DDC использует ML для классификации категорий, определяя природу документов, например, финансовых или юридических, на основе их содержания. Такая способность точно классифицировать документы имеет ключевое значение для выявления и защиты персонально идентифицируемой информации (PII).

Ключевые выводы для специалистов по кибербезопасности:

  1. Используй ML в классификации данных, чтобы справиться с растущим объемом и сложностью неструктурированных данных.
  2. Используй гибридные подходы, сочетающие сопоставление паттернов и ML, для комплексного обнаружения и классификации данных.
  3. Используй продвинутые ML-модели, такие как NER, для масштабируемого и эффективного анализа данных.
  4. Обеспечь соблюдение законов о защите данных, используя инструменты, которые охватывают широкий спектр типов данных и правил конфиденциальности.

Ссылка на статью: Классификация данных с помощью машинного обучения в CipherTrust DDC

поделиться публикацией: