Читаем The Worlds I See полностью

Точная форма этой эволюции, конечно, остается загадкой, но интригующие намеки уже появляются. Среди наиболее значимых событий последних лет - растущий спектр альтернатив человеческому узкому месту в обучении модели - растущие затраты, время и даже этические проблемы, связанные с организацией достаточного количества ручного труда для подготовки наборов данных в больших и больших объемах, которые требует прогресс. Однако прогресс в том, как модели обрабатывают эти данные, в том, что касается их размера, способности работать параллельно и способности самостоятельно выявлять полезные закономерности - их "внимания", как это называется в литературе, - делает возможным обучение на наборах данных настолько больших, что в некоторых случаях они составляют значительную часть самого интернета. В случае с текстом, например, это часто означает всю Википедию, библиотеки книг и академических периодических изданий и даже истории сообщений на онлайн-форумах вроде Reddit. В результате, когда анализируется каждое слово, пробел и знак препинания, получается статистическая модель человеческого языка, настолько обширная и в то же время плотная, что она способна экстраполировать даже короткую подсказку - зародыш идеи в виде одного предложения, будь то вопрос, утверждение или строка диалога - в огромные массивы потрясающе реалистичной прозы. Полученные модели, которые теперь принято называть "большими языковыми моделями", или LLM, демонстрируют настолько беглую лингвистическую компетенцию, настолько неуловимо человеческую, что легко забыть, что читаешь не слова автора из плоти и крови.

Теперь, после стольких лет прорывов в области компьютерного зрения, LLM вызывают ренессанс в обработке естественного языка и, вполне возможно, предвещают следующую великую эпоху ИИ. Под капотом новый тип модели машинного обучения, известный как "трансформатор", который, вероятно, является самым большим эволюционным скачком в дизайне нейронных сетей со времен AlexNet в 2012 году, делает LLM возможными, воплощая в себе все необходимые качества: гигантский масштаб, возможность ускорить время обучения за счет обработки данных большими параллельными массивами и невероятно сложный механизм внимания. По любым меркам это веха, если не точка перегиба; почти сразу после публикации трансформатор продемонстрировал возможности, настолько впечатляющие, что они шокировали даже экспертов, стоявших за его созданием, и с тех пор прогресс не замедлился.

Мое первое знакомство с текстом, созданным с помощью большой языковой модели, было сюрреалистическим опытом, и оно заставило вспомнить о нашей работе с Андреем. Я вспомнил, как захватывающе было видеть, как в те дни ИИ составлял одно полное предложение - даже неуклюже сформулированное - для описания того, что он видел. Всего несколько лет спустя алгоритмы стали настолько искусными словесниками, что могут отвечать на вопросы, сочинять истории и даже объяснять шутки. Более того, зарождающийся класс "мультимодальных" сетей, обученных не только на тексте, но и на фотографиях, аудио, записанном голосе и даже видео, учится генерировать и эти медиа. Это развитие, которое на практике часто кажется опережающим на поколение или два: всего за десять лет алгоритмы прошли путь от попыток распознать содержимое фотографий до сверхчеловеческого уровня, а теперь, что удивительно, самостоятельно создают совершенно новые изображения, ничуть не хуже фотографических, но полностью синтетические и с зачастую тревожным уровнем реализма и детализации. Похоже, что эра глубокого обучения уже уступает место новой революции - наступает эра генеративного ИИ.

Но в основе этой технологии, которая даже мне порой кажется абсолютным волшебством, лежит еще один урок силы данных в больших масштабах. И, конечно, "масштаб" - это главное слово. Для сравнения: AlexNet дебютировала с сетью, состоящей из шестидесяти миллионов параметров - этого достаточно, чтобы разумно воспринимать набор данных ImageNet, по крайней мере частично. В то время как трансформаторы, достаточно большие для обучения на мире текстов, фотографий, видео и многого другого, имеют сотни миллиардов параметров. Это, конечно, создает бесконечные инженерные проблемы, но удивительно элегантную науку. Как будто эти возможности ждали нас все это время, со времен считывателя ZIP-кодов ЛеКуна, неокогнитрона Фукусимы или даже перцептрона Розенблатта. Со времен ImageNet. Все это было где-то здесь. Нужно было только сделать простую идею достаточно большой.

Перейти на страницу:

Похожие книги

Искусство статистики. Как находить ответы в данных
Искусство статистики. Как находить ответы в данных

Статистика играла ключевую роль в научном познании мира на протяжении веков, а в эпоху больших данных базовое понимание этой дисциплины и статистическая грамотность становятся критически важными. Дэвид Шпигельхалтер приглашает вас в не обремененное техническими деталями увлекательное знакомство с теорией и практикой статистики.Эта книга предназначена как для студентов, которые хотят ознакомиться со статистикой, не углубляясь в технические детали, так и для широкого круга читателей, интересующихся статистикой, с которой они сталкиваются на работе и в повседневной жизни. Но даже опытные аналитики найдут в книге интересные примеры и новые знания для своей практики.На русском языке публикуется впервые.

Дэвид Шпигельхалтер

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература
История леса
История леса

Лес часто воспринимают как символ природы, антипод цивилизации: где начинается лес, там заканчивается культура. Однако эта книга представляет читателю совсем иную картину. В любой стране мира, где растет лес, он играет в жизни людей огромную роль, однако отношение к нему может быть различным. В Германии связи между человеком и лесом традиционно очень сильны. Это отражается не только в облике лесов – ухоженных, послушных, пронизанных частой сетью дорожек и указателей. Не менее ярко явлена и обратная сторона – лесом пропитана вся немецкая культура. От знаменитой битвы в Тевтобургском лесу, через сказки и народные песни лес приходит в поэзию, музыку и театр, наполняя немецкий романтизм и вдохновляя экологические движения XX века. Поэтому, чтобы рассказать историю леса, немецкому автору нужно осмелиться объять необъятное и соединить несоединимое – экономику и поэзию, ботанику и политику, археологию и охрану природы.Именно таким путем и идет автор «Истории леса», палеоботаник, профессор Ганноверского университета Хансйорг Кюстер. Его книга рассказывает читателю историю не только леса, но и людей – их отношения к природе, их хозяйства и культуры.

Хансйорг Кюстер

Зарубежная образовательная литература, зарубежная прикладная, научно-популярная литература