O analiză cuprinzătoare a soluției Thales de descoperire și clasificare a datelor cu ajutorul învățării automate (Machine Learning-Powered Data Discovery and Classification Solution)
În sfera de date în plină expansiune, unde se estimează că 80% din date sunt nestructurate, metodele tradiționale de clasificare manuală a datelor devin învechite din cauza caracterului lor intensiv și predispus la erori. Thales abordează această provocare cu CipherTrust Data Discovery and Classification (DDC), o soluție îmbunătățită cu modele de învățare automată (ML). Aceste modele sunt esențiale în automatizarea clasificării datelor, îmbunătățind semnificativ acuratețea și eficiența în mediile IT hibride complexe.
Primul pas în clasificarea datelor este descoperirea datelor, esențială pentru respectarea reglementărilor globale privind protecția datelor. CipherTrust DDC navighează în mod eficient în diverse depozite de date, clasificând datele în funcție de sensibilitate și risc, indiferent dacă sunt stocate la sediu, pe serverele terților sau în cloud.
Abordarea inovatoare a Thales combină potrivirea modelelor cu ML pentru a stabili relații semnificative între puncte de date disparate. Această tehnică hibridă nu numai că localizează datele din sistemele IT, dar le și contextualizează, sporind precizia clasificării. Componenta ML este versatilă, utilizând diferite modele pentru diferite sarcini, cum ar fi categorizarea și recunoașterea entităților numite (NER).
Potrivirea modelelor CipherTrust DDC, realizată de motorul GLASS™ al Ground Labs, acoperă o gamă largă de tipuri de date și respectă numeroase legi privind confidențialitatea datelor. Acestea includ date personale, financiare și de sănătate, precum și informații potențial compromise, cum ar fi cheile private codificate în hardcoded.
NER, o caracteristică cheie a CipherTrust DDC, utilizează procesarea limbajului natural (NLP) pentru a extrage entități precum nume și date din texte nestructurate, eliminând astfel nevoia de analiză manuală. Acest proces este foarte scalabil și adaptabil la diferite tipuri de documente și limbi.
În cele din urmă, CipherTrust DDC utilizează ML pentru clasificarea categoriilor, determinând natura documentelor, cum ar fi cele financiare sau juridice, pe baza conținutului lor. Această capacitate de a clasifica cu precizie documentele este esențială pentru identificarea și protejarea informațiilor personale identificabile (PII).
Principalele concluzii pentru profesioniștii din domeniul securității cibernetice:
- Adoptați ML în clasificarea datelor pentru a gestiona volumul și complexitatea în creștere a datelor nestructurate.
- Utilizați abordări hibride care combină potrivirea modelelor și ML pentru descoperirea și clasificarea completă a datelor.
- Profitați de modele ML avansate, cum ar fi NER, pentru o analiză scalabilă și eficientă a datelor.
- Asigurați conformitatea cu legile privind protecția datelor prin utilizarea unor instrumente care acoperă o gamă largă de tipuri de date și reglementări privind confidențialitatea.
Link către articol: Clasificarea datelor cu ajutorul învățării automate în CipherTrust DDC