Нужно сказать, что похожие программы уже несколько лет успешно работают в нескольких американских городах. Например, в 2011 году калифорнийский город Санта-Крус (США) первым в мире внедрил математическую модель расчета вероятности преступлений, которая каждый день составляет новый маршрут для патрульных машин, основываясь на статистике преступлений по улицам. Учитываются день недели, время суток, наличие/отсутствие футбольных матчей по ТВ и другие факторы.
Патрульные полицейские Санта-Крус каждый день получают новый маршрут для патрулирования с указанием 10 «горячих точек» маршрута. Вот как выглядит эта информация в
Для каждого квадрата размером 150 на 150 метров указывается вероятность совершения преступления в 24-часовой период, распределение этой вероятности по двум видам преступления: автомобильные и домашние, время начала двух самых опасных часовых интервалов.
Немецкая программа «Pre-Crime Observation System» работает примерно по такому же принципу, вычисляя вероятность совершения преступлений по тем или иным координатам, с учетом прошлой статистики.
В создании системы приняли участие даже российские математики из департамента анализа данных и искусственного интеллекта НИУ ВШЭ.
Главной идеей было создание хорошей системы анализа и визуализации данных полицейских отчетов. В качестве такого средства как нельзя лучше подходит анализ формальных понятий. Этот метод был предложен в 80-х годах прошлого века немецким математиком и философом
В ходе работы специалисты проанализировали порядка 70 тысяч полицейских отчетов, составленных с 2008 года. В основном это были отчеты патрульных полицейских, проводивших осмотр автотранспорта или патрулировавших улицы Амстердама. Лишь примерно в тысяче случаев полицейским было известно, что речь действительно идет о лицах, имеющих отношение к торговле людьми.
Все индикаторы (их можно выявить в тексте автоматически) разделили на группы:
• статические признаки (национальность, проблемы с документами, крупная сумма наличных, женщины не разговаривают, документы женщин находятся у водителя, проститутки, насилие, следы насилия);
• изменяющиеся признаки (район «красных фонарей», дорогая машина, женщины в машине, торговля в машине, каникулы, регулярное посещение сомнительных клубов, регулярная доставка девушек в клуб);
• признаки социального окружения (человек был замечен с подозреваемым или известным преступником, сам был под подозрением).
Также индикаторы подразделялись на ранние и поздние, то есть возможные и явные, сильные признаки соответственно.
Выделенные признаки заносились в таблицу. Глядя на нее, можно было определить, сколько подозрительных признаков есть в том или ином отчете. Полицейские при составлении отчета перечислили такие индикаторы, как «дорогая машина», «проблемы с документами», район, где работают проститутки.
Отчет, содержащий слова-«индикаторы», требовал более пристального внимания правоохранительных органов. Чтобы обнаружить и идентифицировать лиц, причастных к торговле людьми, полицейские анализировали формальные понятия.
Эта работа проходит в три этапа: