Thales-in Maşın Öyrənməsi ilə dəstəklənən verilənlərin kəşfi və təsnifat həllinin hərtərəfli təhlili
Sürətlə genişlənən məlumat sferasında, məlumatların təxmini 80%-nin strukturlaşdırılmamış olduğu, ənənəvi əl ilə verilənlərin təsnifatı üsulları əmək tutumlu və xətaya meylli təbiətinə görə köhnəlir. Thales bu problemi Machine Learning (ML) modelləri ilə təkmilləşdirilmiş həll olan CipherTrust Data Discovery and Classification (DDC) ilə həll edir. Bu modellər məlumatların təsnifatının avtomatlaşdırılmasında, mürəkkəb hibrid İT mühitlərində dəqiqliyin və səmərəliliyin əhəmiyyətli dərəcədə artırılmasında mühüm əhəmiyyət kəsb edir. .
Məlumatların təsnifatında ilk addım qlobal məlumatların qorunması qaydalarına uyğunluq üçün vacib olan məlumatların kəşfidir. CipherTrust DDC müxtəlif məlumat anbarlarında effektiv şəkildə naviqasiya edir, məlumatların yerli, üçüncü tərəf serverlərində və ya buludda saxlanmasından asılı olmayaraq həssaslıq və risk əsasında təsnif edilir. .
Thales’in innovativ yanaşması fərqli məlumat nöqtələri arasında mənalı əlaqələr yaratmaq üçün model uyğunluğunu ML ilə birləşdirir. Bu hibrid texnika təkcə İT sistemləri arasında məlumatların yerini müəyyən etmir, həm də təsnifat dəqiqliyini artıraraq onları kontekstləşdirir. ML komponenti çox yönlüdür, kateqoriyalara ayırma və Adlandırılmış Varlığın Tanınması (NER) kimi müxtəlif tapşırıqlar üçün müxtəlif modellərdən istifadə edir .
CipherTrust DDC-nin Ground Labs-in GLASS™ mühərriki ilə təchiz edilmiş nümunə uyğunluğu geniş məlumat növlərini əhatə edir və çoxsaylı məlumat məxfiliyi qanunlarına uyğundur. Buraya şəxsi, maliyyə və sağlamlıq məlumatları, eləcə də sərt kodlu şəxsi açarlar kimi potensial təhlükəsi olan məlumatlar daxildir. .
CipherTrust DDC-nin əsas xüsusiyyəti olan NER, strukturlaşdırılmamış mətndən adlar və tarixlər kimi obyektləri çıxarmaq üçün Təbii Dil Emalından (NLP) istifadə edir və əl ilə təhlil ehtiyacını aradan qaldırır. Bu proses çox genişlənir və müxtəlif sənəd növləri və dillərinə uyğunlaşdırıla bilir .
Nəhayət, CipherTrust DDC, məzmununa əsasən maliyyə və ya hüquqi kimi sənədlərin xarakterini təyin edərək kateqoriya təsnifatı üçün ML-dən istifadə edir. Sənədləri dəqiq bir şəkildə təsnif etmək bacarığı Şəxsi İdentifikasiya edilə bilən Məlumatların (PII) müəyyən edilməsi və qorunmasında mühüm əhəmiyyət kəsb edir. .
Kibertəhlükəsizlik Peşəkarları üçün Əsas Çıxarışlar:
- Strukturlaşdırılmamış məlumatların artan həcmini və mürəkkəbliyini idarə etmək üçün məlumatların təsnifatında ML-ni mənimsəyin.
- Hərtərəfli məlumatların kəşfi və təsnifatı üçün nümunə uyğunluğu və ML-ni birləşdirən hibrid yanaşmalardan istifadə edin.
- Ölçəklənən və səmərəli məlumat təhlili üçün NER kimi qabaqcıl ML modellərindən istifadə edin.
- Geniş çeşidli məlumat növlərini və məxfilik qaydalarını əhatə edən alətlərdən istifadə etməklə məlumatların qorunması qanunlarına uyğunluğu təmin edin.
Məqaləyə keçid: CipherTrust DDC-də Maşın Öyrənmə ilə Məlumatların Təsnifatı