Revolutionierung der Datenklassifizierung: CipherTrust DDC integriert maschinelles Lernen für mehr Sicherheit

Umfassende Analyse der Thales-Lösung für maschinelles Lernen zur Datenerkennung und -klassifizierung

In der schnell wachsenden Datenwelt, in der schätzungsweise 80 % der Daten unstrukturiert sind, werden herkömmliche manuelle Datenklassifizierungsmethoden aufgrund ihrer arbeitsintensiven und fehleranfälligen Natur immer mehr überflüssig. Thales stellt sich dieser Herausforderung mit CipherTrust Data Discovery and Classification (DDC), einer Lösung, die durch Machine Learning (ML) Modelle erweitert wird. Diese Modelle sind entscheidend für die Automatisierung der Datenklassifizierung und verbessern die Genauigkeit und Effizienz in komplexen hybriden IT-Umgebungen erheblich.

Der erste Schritt bei der Datenklassifizierung ist die Datenermittlung, die für die Einhaltung der globalen Datenschutzbestimmungen entscheidend ist. CipherTrust DDC navigiert effektiv durch verschiedene Datenspeicher und klassifiziert die Daten nach Sensibilität und Risiko, egal ob sie vor Ort, auf Servern von Drittanbietern oder in der Cloud gespeichert sind.

Der innovative Ansatz von Thales kombiniert Pattern Matching mit ML, um sinnvolle Beziehungen zwischen unterschiedlichen Datenpunkten herzustellen. Diese hybride Technik lokalisiert nicht nur Daten über IT-Systeme hinweg, sondern kontextualisiert sie auch und verbessert so die Klassifizierungsgenauigkeit. Die ML-Komponente ist vielseitig und nutzt verschiedene Modelle für unterschiedliche Aufgaben wie Kategorisierung und Named Entity Recognition (NER).

Der Musterabgleich von CipherTrust DDC, der auf der GLASS™-Engine von Ground Labs basiert, deckt ein breites Spektrum an Datentypen ab und erfüllt zahlreiche Datenschutzgesetze. Dazu gehören persönliche, finanzielle und gesundheitliche Daten sowie potenziell kompromittierte Informationen wie hart kodierte private Schlüssel.

NER, eine Schlüsselfunktion von CipherTrust DDC, nutzt die Verarbeitung natürlicher Sprache (Natural Language Processing, NLP), um Entitäten wie Namen und Daten aus unstrukturiertem Text zu extrahieren, sodass eine manuelle Analyse nicht mehr erforderlich ist. Dieser Prozess ist hochgradig skalierbar und kann an verschiedene Dokumenttypen und Sprachen angepasst werden.

Schließlich setzt CipherTrust DDC ML für die Klassifizierung von Kategorien ein, um die Art der Dokumente, z. B. Finanz- oder Rechtsdokumente, anhand ihres Inhalts zu bestimmen. Die Fähigkeit, Dokumente genau zu kategorisieren, ist entscheidend für die Identifizierung und den Schutz personenbezogener Daten (PII).

Die wichtigsten Erkenntnisse für Cybersecurity-Fachleute:

  1. Setze ML bei der Datenklassifizierung ein, um die wachsende Menge und Komplexität unstrukturierter Daten zu bewältigen.
  2. Nutze hybride Ansätze, die Mustererkennung und ML für eine umfassende Datenerkennung und -klassifizierung kombinieren.
  3. Nutze fortschrittliche ML-Modelle wie NER für eine skalierbare und effiziente Datenanalyse.
  4. Stelle die Einhaltung der Datenschutzgesetze sicher, indem du Tools einsetzt, die ein breites Spektrum an Datentypen und Datenschutzbestimmungen abdecken.

Link zum Artikel: Datenklassifizierung mit maschinellem Lernen in CipherTrust DDC

Post teilen: