ИИ-модель DarkBERT обучили на просторах даркнета, но предназначена она для науки

ИИ-модель DarkBERT обучили на просторах даркнета, но предназначена она для науки

Фото из открытых источников
Исследователями из Корейского института науки и технологий (KAIST) создана ИИ-модель DarkBERT. Ее предназначение: поиск «ценных научных сведений» в даркнете. Нейросеть снабжена особыми фильтрами, способными помочь оградить пользователей от негативной информации.
 
Как сообщает ресурс tomshardware.com, создали DarkBERT на базе архитектуры RoBERTa, что была разработана в 2019 году. Ее обновили, и оказалось, что на деле данная архитектура имеет большую производительность, нежели из нее извлекали ранее.
 
Для обучения ИИ-модели исследователями было проведено сканирование даркнета через анонимный брандмауэр сети Tor. Далее экспериментаторы осуществили фильтровку необработанных данных с применением методов дедупликации, балансировки категорий и пр. Так был создан необходимый для обучения массив информации.
 
В итоге и появился DarkBERT, получивший способность анализа фрагментов контента из даркнета для извлечения из него полезной информации.
 
Важным преимуществом больших языковых моделей (LLM) остается понимание языка. В даркнете применяют особую смесь языков, и DarkBERT успешно обучили для ее восприятия. Исследователи уверены, что он сможет глубоко изучать это пространство.  Тем не менее, разработчики будут продолжать усовершенствование DarkBERT для улучшения работы модели.