Задача автоматической идентификации анонимных авторов - одновременно одна из самых увлекательных и сложных. Особенно, если учесть, что в публикациях вместо актуального имени опытный злоумышленник имеет привычку сообщать о себе выдуманные инициалы или случайный набор букв и цифр.
Так, например, среди зарегистрированных электронных адресов на почтовом сервере google.com Nic "Sasha" может встречаться сколько угодно раз если к нему добавлен префикс, состоящий из цифр (Sasha_001, 2025_Sasha). Да и значение цифр используемых для ников имеет множество вариаций - например, от года регистрации аккаунта или возраста администратора до случайного номера. Как в этом случае определить, что именно этот человек является автором ника или публикации, а не кто-то другой?
Обычно для идентификации анонимного автора детективы используют ручной поиск. Полученная способом подбора информация, позволяет найти публикации, которые подписаны таким же ником или схожим с ним до какой-то разумной степени. Это могут быть близкие по написанию адреса электронной почты, доменные имена, наименования картинок, файлов, в том числе музыкальные и т.д. Но в этом и кроется главная проблема с которой может столкнуться каждый. Даже малейшая разница в написании делает предположения детектива об отношении нового ника к конкретному человеку ложной, поскольку нарушается один из четырех законов формальной логики - принцип тождества.
Часто ручной сбор информации заканчивается на первой странице поисковика. Тогда детектив переходит к следующему поисковику и так до бесконечности, пока совпадение не будет обнаружено. Но и найденной информации бывает совершенно недостаточно для однозначной идентификации. Например, существует распространенный случай, когда два разных человека создают почту под одинаковым Ником на на разных почтовых серверах. Предположив, что емейл Nesh1989@gmail.com и Nesh1989@li.ru значит сделать ложное допущение, что автором текстов подписанных владельцами электронных адресов Nesh1989@gmail.com и Nesh1989@li.ru является одно и то же лицо. То же самое относится к авторам постов на профильных форумах, где задача по идентификации происходит еще сложнее, поскольку информация, которую анонимщик оставил о себе совершенно неинформативна.
В результате, такие публикации и ссылки к ним остаются неидентифицированными, и работу приходится делать ещё и ещё раз – до тех пор, пока детектив не обнаружит новые значимые по делу свидетельства.
В сети X (ранее известной как Twitter) для поиска значимых связей и свидетельств предлагается специальный чат-бот Grok, разработанный компанией xAI под руководством Илона Маска. Интерфейс бота позволяет задать вопрос на русском языке, что уже вызывает профессиональный интерес. При запросе робот выводит все публикации, в которых указана связь ника с автором публикаций, имеющих к нему прямое или косвенное отношение. Детектив может просмотреть этот список, выделить интересующие ссылки и включить их в следующий поиск.
Задача осложняется тем, что для сходных ников сформированный роботом список может включать множество не имеющих к делу публикаций. Поэтому детективу приходится вручную отбирать значимую информацию. И здесь на помощь опять приходит нейросеть Grok. Ее функционал позволяет сильно упростить сыщику работу по идентификации. Детектив, обнаружив значимые свидетельства, например, тематически близкие друг к другу публикации, делает новый ещё более конкретный запрос. В результате, нейросеть генерирует второй лист, в начале которого публикует список из максимально близких к теме расследования публикаций. Результаты, которые менее всего ассоциируются с личностью автора и менее значимые - заносятся роботом в конец списка.
Использование автоматической сортировки по тематической близости и грамматической схожести, конечно, позволяет детективу сократить рабочее время по поиску свидетельств, но и требует навыков в умении работать с большими текстами. Поэтому мы рекомендуем использовать этот режим не как основной, а как дополнительный.