Читаем Максимальный репост. Как соцсети заставляют нас верить фейковым новостям полностью

Это учебная задача на сайте Kaggle.com, с которого часто начинается карьера разработчиков искусственного интеллекта. Обычно сюда приходят решать задачи за деньги – участвовать в конкурсах с призовым фондом в десятки или сотни тысяч долларов. Крупные компании, от банков до медицинских клиник и трубопрокатных заводов, выкладывают порции своих больших данных и предлагают придумать алгоритм, который сделает из них какие-нибудь полезные выводы. Например, случится ли поломка на конвейере, есть ли на рентгеновском снимке указания на рак, и стоит ли выдавать человеку кредит. В каждом таком конкурсе соревнуются сотни, а иногда и тысячи команд программистов и программистов-одиночек. Те, кто войдет в первую тройку, разделят между собой призовые деньги, а люди из первой десятки могут быть уверены, что в ближайшие дни после оглашения результатов им напишут рекрутеры крупных компаний, работающих с данными.

Что общего у таких практических задач с вопросом о жизни и смерти пассажиров «Титаника»? С математической точки зрения они ничем не отличаются. Есть таблица, где для каждого человека записаны какие-то его признаки, а напротив части записей стоит пометка «да» или «нет» (вернул кредит или не вернул, пережил кораблекрушение или не пережил). Алгоритм должен увидеть скрытые закономерности в примерах и научиться угадывать «да» или «нет» как можно чаще.

Можно сказать, что и алгоритмы Facebook решают задачу того же сорта. Вот два человека и разные характеристики конкретной записи их дружбы в цифрах – сколько комментариев они написали друг другу за месяц, лайкает ли первый второго, часто ли оба одновременно ставят галочку «пойду» на страничке какого-нибудь концерта – и нужен однозначный ответ, показывать одному свежую запись другого или не показывать. Искусственному интеллекту достаточно сказать «да» или «нет».

К слову, на сайте Kaggle – да и вообще среди тех, кто обучает алгоритмы, – словосочетание «искусственный интеллект» не слишком популярно. Вместо него предпочитают употреблять термин «машинное обучение». (Если вы заявляли в 1990-е, что занимаетесь «искусственным интеллектом», объяснял кто-то из классиков этой науки, вас автоматически записывали в философы или футурологи, которые любят поговорить об отвлеченных сущностях, и математики стали говорить про «машинное обучение», чтобы их с футурологами не путали.)

Нейросети – частный случай машинного обучения, и не всегда самый эффективный (например, в задаче про «Титаник»). Наверное, самый популярный способ решать задачи на Kaggle (которыми пользуются и Google, и Facebook в промышленных масштабах) – это алгоритмы под странноватым названием «ансамбли решающих деревьев» (справедливости ради, «лес» и «пень» – тоже популярные герои мира алгоритмов). А самый простой способ – линейные модели.

Проходной балл: линейные модели

Представьте себе тест вроде тех, которые печатали когда-то рядом с кроссвордами в газетах, где за каждый односложный ответ начисляют баллы. С пассажирами «Титаника» алгоритм – линейная модель – проделывает это так. Купили билет второго класса? 10 баллов. Первого класса? 100 баллов. Взошли на борт в английском порту Саутгемптон? 50 баллов. Во французском Шербуре? 5 баллов. (Этот признак не самый бесполезный для прогноза, потому что косвенно указывает, на каком языке – английском или французском – пассажир разговаривал, и легко ли ему было объясниться во время эвакуации с командой, состоящей преимущественно из англичан.) В конце концов баллы складываются, и если сумма больше пороговой, модель отвечает: «Выживет».

Откуда алгоритм знает, какую характеристику оценить в 500 баллов, а какую – всего в 10? Он начинает раздавать баллы наобум и потом уточняет их раз за разом на каждом примере, для которого известен правильный ответ, – это и есть обучение. Так выясняется, какие признаки важные, какие нет. Например, класс каюты: в первом выжили 63 % пассажиров, в третьем – всего 24 %. Или пол пассажира «Титаника»: среди женщин из списка – 74 % выживших, среди мужчин – всего 19 %.

В случае с записями в Facebook, про которые алгоритму надо ответить «показывать / не показывать», есть еще один небесполезный источник информации – это слова, из которых составлена запись. Если модель знает, что вы любите читать про ракеты, Марс и Илона Маска, то за каждое из этих слов выдаст много баллов, и случайные знакомые, делами которых вы не интересовались последние пять лет, имеют шанс пробиться к вам во френд-ленту со своими рассуждениями про запуск автомобиля в космос.


Перейти на страницу:

Похожие книги

188 дней и ночей
188 дней и ночей

«188 дней и ночей» представляют для Вишневского, автора поразительных международных бестселлеров «Повторение судьбы» и «Одиночество в Сети», сборников «Любовница», «Мартина» и «Постель», очередной смелый эксперимент: книга написана в соавторстве, на два голоса. Он — популярный писатель, она — главный редактор женского журнала. Они пишут друг другу письма по электронной почте. Комментируя жизнь за окном, они обсуждают массу тем, она — как воинствующая феминистка, он — как мужчина, превозносящий женщин. Любовь, Бог, верность, старость, пластическая хирургия, гомосексуальность, виагра, порнография, литература, музыка — ничто не ускользает от их цепкого взгляда…

Малгожата Домагалик , Януш Вишневский , Януш Леон Вишневский

Публицистика / Семейные отношения, секс / Дом и досуг / Документальное / Образовательная литература
Основание Рима
Основание Рима

Настоящая книга является существенной переработкой первого издания. Она продолжает книгу авторов «Царь Славян», в которой была вычислена датировка Рождества Христова 1152 годом н. э. и реконструированы события XII века. В данной книге реконструируются последующие события конца XII–XIII века. Книга очень важна для понимания истории в целом. Обнаруженная ранее авторами тесная связь между историей христианства и историей Руси еще более углубляется. Оказывается, русская история тесно переплеталась с историей Крестовых Походов и «античной» Троянской войны. Становятся понятными утверждения русских историков XVII века (например, князя М.М. Щербатова), что русские участвовали в «античных» событиях эпохи Троянской войны.Рассказывается, в частности, о знаменитых героях древней истории, живших, как оказывается, в XII–XIII веках н. э. Великий князь Святослав. Великая княгиня Ольга. «Античный» Ахиллес — герой Троянской войны. Апостол Павел, имеющий, как оказалось, прямое отношение к Крестовым Походам XII–XIII веков. Герои германо-скандинавского эпоса — Зигфрид и валькирия Брюнхильда. Бог Один, Нибелунги. «Античный» Эней, основывающий Римское царство, и его потомки — Ромул и Рем. Варяг Рюрик, он же Эней, призванный княжить на Русь, и основавший Российское царство. Авторы объясняют знаменитую легенду о призвании Варягов.Книга рассчитана на широкие круги читателей, интересующихся новой хронологией и восстановлением правильной истории.

Анатолий Тимофеевич Фоменко , Глеб Владимирович Носовский

Публицистика / Альтернативные науки и научные теории / История / Образование и наука / Документальное
Гордиться, а не каяться!
Гордиться, а не каяться!

Новый проект от автора бестселлера «Настольная книга сталиниста». Ошеломляющие открытия ведущего исследователя Сталинской эпохи, который, один из немногих, получил доступ к засекреченным архивным фондам Сталина, Ежова и Берии. Сенсационная версия ключевых событий XX века, основанная не на грязных антисоветских мифах, а на изучении подлинных документов.Почему Сталин в отличие от нынешних временщиков не нуждался в «партии власти» и фактически объявил войну партократам? Существовал ли в реальности заговор Тухачевского? Кто променял нефть на Родину? Какую войну проиграл СССР? Почему в ожесточенной борьбе за власть, разгоревшейся в последние годы жизни Сталина и сразу после его смерти, победили не те, кого сам он хотел видеть во главе страны после себя, а самозваные лже-«наследники», втайне ненавидевшие сталинизм и предавшие дело и память Вождя при первой возможности? И есть ли основания подозревать «ближний круг» Сталина в его убийстве?Отвечая на самые сложные и спорные вопросы отечественной истории, эта книга убедительно доказывает: что бы там ни врали враги народа, подлинная история СССР дает повод не для самобичеваний и осуждения, а для благодарности — оглядываясь назад, на великую Сталинскую эпоху, мы должны гордиться, а не каяться!

Юрий Николаевич Жуков

Публицистика / История / Политика / Образование и наука / Документальное
Принцип Дерипаски
Принцип Дерипаски

Перед вами первая системная попытка осмыслить опыт самого масштабного предпринимателя России и на сегодняшний день одного из богатейших людей мира, нашего соотечественника Олега Владимировича Дерипаски. В книге подробно рассмотрены его основные проекты, а также публичная деятельность и антикризисные программы.Дерипаска и экономика страны на данный момент неотделимы друг от друга: в России около десятка моногородов, тотально зависимых от предприятий олигарха, в более чем сорока регионах работают сотни предприятий и компаний, имеющих отношение к двум его системообразующим структурам – «Базовому элементу» и «Русалу». Это уникальный пример роли личности в экономической судьбе страны: такой социальной нагрузки не несет ни один другой бизнесмен в России, да и во всем мире людей с подобным уровнем личного влияния на национальную экономику – единицы. Кто этот человек, от которого зависит благополучие миллионов? РАЗРУШИТЕЛЬ или СОЗИДАТЕЛЬ? Ответ – в книге.Для широкого круга читателей.

Владислав Юрьевич Дорофеев , Татьяна Петровна Костылева

Биографии и Мемуары / Публицистика / Документальное