Методический подход к выявлению ботов в социальных сетях на основе специального объединения классификаторов
Аннотация
В настоящее время применение ботов – автоматизированных учетных записей в социальных сетях, управляемых программным обеспечением, но замаскированных под обычных пользователей, имеет серьезные последствия. Например, боты использовались для влияния на политические выборы, искажения информации в сети Интернет и манипуляции стоимостью акций на фондовой бирже. Выявлением таких аккаунтов занимаются многие научные коллективы, к направлениям исследований которых относится применение методов машинного обучения. Однако практические результаты выявления ботов в социальных сетях свидетельствуют о наличии существенных ограничений, так как используемый методический инструментарий обладает языковой ограниченностью и неэффективной критериальной базой определения ботов. В статье представлен методический подход к разработке универсального классификатора аккаунтов социальной сети, направленный на совершенствование способов противодействия ботам и позволяющий минимизировать средний риск ошибки выявления ботов. В основу формирования универсального классификатора аккаунтов социальных сетей положено использование ансамбля классификаторов, объединенных по критерию адаптации к исходным данным и дисперсии результатов каждой модели разрабатываемого ансамбля. Основными результатами, полученными авторами, являются предложенная система критериев выявления ботов и подход к преобразованию категориальных (номинальных) признаков для формирования специального ансамбля классификаторов. Практическое применение ансамбля моделей повысило результативность выявления ботов в сравнении с другими подходами.