Революція в класифікації даних: CipherTrust DDC інтегрує машинне навчання для підвищення безпеки

Комплексний аналіз рішення Thales для виявлення та класифікації даних на основі машинного навчання

У швидко зростаючій сфері даних, де, за оцінками, 80% даних є неструктурованими, традиційні ручні методи класифікації даних стають застарілими через їхню трудомісткість і схильність до помилок. Thales вирішує цю проблему за допомогою CipherTrust Data Discovery and Classification (DDC), рішення, вдосконаленого моделями машинного навчання (ML). Ці моделі мають вирішальне значення для автоматизації класифікації даних, значно підвищуючи точність та ефективність у складних гібридних ІТ-середовищах.

Першим кроком у класифікації даних є виявлення даних, що має вирішальне значення для дотримання глобальних правил захисту даних. CipherTrust DDC ефективно орієнтується в різноманітних сховищах даних, класифікуючи дані на основі чутливості та ризику, незалежно від того, чи зберігаються вони локально, на сторонніх серверах або в хмарі.

Інноваційний підхід Thales поєднує співставлення шаблонів з ML для встановлення значущих зв’язків між розрізненими точками даних. Цей гібридний метод не лише знаходить дані в ІТ-системах, але й контекстуалізує їх, підвищуючи точність класифікації. Компонент ML є універсальним і використовує різні моделі для різних завдань, таких як категоризація та розпізнавання іменованих об’єктів (NER).

CipherTrust DDC, що працює на основі движка GLASS™ від Ground Labs, охоплює широкий спектр типів даних і відповідає численним законам про конфіденційність даних. Сюди входять персональні, фінансові та медичні дані, а також потенційно скомпрометована інформація, наприклад, жорстко закодовані приватні ключі.

NER, ключова функція CipherTrust DDC, використовує обробку природної мови (NLP) для вилучення таких об’єктів, як імена та дати, з неструктурованого тексту, усуваючи необхідність ручного аналізу. Цей процес можна легко масштабувати та адаптувати до різних типів документів і мов.

Нарешті, CipherTrust DDC використовує ML для класифікації за категоріями, визначаючи характер документів, таких як фінансові або юридичні, на основі їхнього змісту. Ця здатність точно класифікувати документи має вирішальне значення для ідентифікації та захисту персональних даних (PII).

Основні висновки для фахівців з кібербезпеки:

  1. Використовуйте ML для класифікації даних, щоб впоратися зі зростаючим обсягом і складністю неструктурованих даних.
  2. Використовуйте гібридні підходи, що поєднують співставлення шаблонів і ML для комплексного виявлення та класифікації даних.
  3. Використовуйте передові моделі ML, такі як NER, для масштабованого та ефективного аналізу даних.
  4. Забезпечте дотримання законів про захист даних, використовуючи інструменти, які охоплюють широкий спектр типів даних і правил конфіденційності.

Посилання на статтю: Класифікація даних за допомогою машинного навчання в CipherTrust DDC

поділитися дописом: