Читаем Цифровой журнал «Компьютерра» № 180 полностью

В феврале 2012 года я написал восторженную «Голубятню» о технологической революции, которую произвел проект Compreno, над которым ABBYY корпела более 15 лет. Летом прошлого года планировался готовый продукт. Пишу это не для того, чтобы укорить, а, как бы, напомнить: «Ау, ребята! Мы вас очень любим, а оттого -помним и всё еще ждем, не теряя надежды :)». Уж очень хочется еще при жизни погулять на празднике реальной альтернативы Google Translate, выводящей компьютеризированный перевод на следующий качественный уровень.

Сегодня хочу поговорить о другом восхитительном начинании ABBYY, которое я лично не хотел бы видеть заброшенным в еще большей степени, чем Compreno. Здесь, впрочем, ситуация качественно отличная: если Compreno никто, кроме самих разработчиков, уже угрохавших на проект 15 лет, продолжить не сможет, то в случае с проектом «Весь Толстой за один клик» (именно о нем мы сегодня будем говорить в «Голубятне») благодарное человечество, выразив предварительно признательность первопроходцу, с легкостью подхватит выпавшее из рук знамя (если, конечно, оно выпадет :) и двинется в будущее уже своим ходом.

Итак, что же это за однокличенный Толстой. ABBYY открыла специальный портал для координации действий по коллективному созданию эталонной электронной версии 90-томного академического собрания сочинений Льва Толстого. Любой желающий регистрируется на сайте (с именем и фамилией, слава богу — никакой дешевой анонимности!), устанавливает у себя на компьютере специальную версию FineReader 11 Professional Edition, загружает сырец-пакет размером в 5-10 Мб, который содержит около 20 страниц факсимильного текста, OCR-ит его и начитает считывать, исправляя ошибки, которые неизбежно возникают в процессе машинного распознавания знаков.

После окончания работы вы возвращаете вычитанный пакет обратно в систему, где его проверяют аудиторы на предмет пропущенных вами ошибок, опечаток и т.д. Если качество достойное, пакет принимается, а вы получаете баллы, увеличивая, тем самым, собственный рейтинг в проекте. Если ошибок слишком много, аудитор ваш пакет отклонит, и он вернется обратно в базу данных, и, следовательно, любой другой участник проекта сможет его взять на вычитывание. Аудиторы тоже набираются из добровольцев, которым, правда, предварительно потребуется пройти специальный тест на грамотность.

Проект организовала ABBYY совместно с Государственным музеем Льва Толстого. Инициатива похвальная, благородная, полезная и… здесь, наверное, можно было поставить точку. Помянули и благополучно забыли. Мало ли в Сети было организовано таких вот групповых аутсорсингов? И где они сейчас?

Очень скоро после запуска «Всего Толстого за один клик» (18 июня 2013 года) случилось событие, которое перевернуло все мои представления о потенциальных возможностях подобных инициатив. За первые 10 дней после старта 1 600 зарегистрировавшихся участников сумели вычитать 41 800 страниц — практически все 90 томов академического собрания сочинений писателя!

Соответственно к работе подключились аудиторы, которым предстоит не только внимательно проверить первую вычитку, но и корректно отформатировать материалы. Очевидно, что это занятие займет побольше времени, чем первоначальная вычитка, но тоже не затянется дольше, чем на пару месяцев.

Что же мы получаем в итоге? Безупречная цифровая версия уникального памятника мировой культуры будет доступна всем желающим за какие-то совершенно невероятные сроки: несколько месяцев! 90 томов! Для ориентира: выпуск самого академического полного собрания сочинений Льва Толстого осуществлялся 30 лет. С 1928 по 1958 годы.

Что меня потрясло в этой истории больше всего? Феноменальная эффективность группового аутсорсинга! Разумеется, можно было предположить, что, объединив усилия многих сотен и даже тысяч людей, можно добиться реально высокой скорости продвижения любого проекта, связанного с оцифровкой текстов. Но чтобы так вот — за 10 дней вычитали 90 томов ПСС, даже и вообразить не мог.

Самое интересное, в чем хотелось бы сейчас разобраться (и самое важное в практическом отношении на будущее) — это факторы, которые способствовали выведению эффективности группового аутсорсинга на качественный уровень, который не имеет аналогов в Интернете (мне, по крайней мере, они не ведомы, так что если кто-то подскажет, буду признателен). Речь сейчас идет не о темпах проведения вычитки и не о качестве продукта, ожидаемого на выходе, а именно об эффективности самого проекта.

Перейти на страницу:

Все книги серии Журнал «Компьютерра»

Цифровой журнал «Компьютерра» № 1
Цифровой журнал «Компьютерра» № 1

СОДЕРЖАНИЕ НОМЕРА:В Новый год — в новых форматах. Автор: Сергей Вильянов.Железо-2009: победы и достижения. Автор: Алексей Стародымов.BrowserLinux: проще некуда. Автор: Андрей Крупин.4G. Шанс России преодолеть цифровой разрыв. Автор: Юрий Домбровский.Beyerdynamic DTX 60 и MMX 100: ушки-люкс. Автор: Константин Иванов.Тысяча душ. Автор: Василий Щепетнев.Самые ожидаемые программные продукты 2010 года. Автор: Андрей Крупин.Новогодние подарки — советы по выбору гаджетов. Автор: Игорь Осколков.Корпус Zalman GS1000 Plus: пять с плюсом. Автор: Константин Иванов.2009 год глазами IT-бизнеса (обновлено). Автор: Марина Пелепец.Голубятня: Антихрист. Автор: Сергей Голубицкий.Приручение Коалы или два месяца с Ubuntu 9.10. Авторы: Григорий Рудницкий, Андрей Крупин.Обзор нетбука Manli iii M3. Автор: Игорь Осколков.Gazzetta, журнал, programma… Автор: Ваннах Михаил.Можно ли нарисовать улицу на картах Nokia? Автор: Георгий Киселев.Новогодние подарки — советы по выбору нетбуков и ноутбуков. Автор: Игорь Осколков.Программные алкотестеры. Автор: Андрей Крупин.Будущее Интернета. Автор: Михаил Карпов.Ни слова о Жомини. Автор: Василий Щепетнев.Беседы о современной физике. Автор: Алла Аршинова.Что готовит нам 2010 год. Автор: Алексей Лукацкий.Голубятня: Нефилимы. Автор: Сергей Голубицкий.Новогодние украшательства Windows. Автор: Андрей Крупин.Компьютеррные события года. Авторы: Сергей Вильянов, Василий Щепетнев, Юрий Ревич, Анатолий Вассерман, Козловский Евгений, Андрей Крупин, Михаил Карпов, Алексей Стародымов, Игорь Осколков.Море возможностей. Автор: Сергей Еремин.Logitech: необычная гарантия. Автор: Алексей Стародымов.Новогодние подарки — советы по выбору телефонов и смартфонов. Автор: Игорь Осколков.

Журнал «Компьютерра» , Компьютерра

Зарубежная компьютерная, околокомпьютерная литература / Прочая компьютерная литература / Книги по IT
Цифровой журнал «Компьютерра» № 2
Цифровой журнал «Компьютерра» № 2

СОДЕРЖАНИЕ НОМЕРА:За что могут посадить компьютерщика? Автор: Майор Мышкин.И для VAS, и для нас. Автор: Сергей Вильянов.Новинки CES 2010. Избранное. Автор: Алексей Стародымов.Голубятня: Золотой ключик. Автор: Сергей Голубицкий.Чаевые как новая парадигма бизнеса. Автор: Михаил Куцов.Обзор док-станции для жёстких дисков IcyBox IB-110. Автор: Игорь Осколков.CES 2010: мобильная связь. Автор: Алексей Стародымов.Василий Щепетнёв: О пользе волшебства. Автор: Василий Щепетнев.Частное охранное предприятие времён киберпанка. Автор: Ваннах Михаил.Голубятня: Факевар. Автор: Сергей Голубицкий.Кивино гнездо: Симулятор религии.Кулеры под LGA1156. Автор: Константин Иванов.Как я работал корпоративным программистом. Автор: Iseman ICEBERG.Василий Щепетнёв: Продолжение думы о пятачке. Автор: Василий Щепетнев.Обзор плеера Sony Walkman NWZ-E440. Автор: Алексей Стародымов.Голубятня: Файнридер 10. Автор: Сергей Голубицкий.Сергей Орловский (Nival): А на десерт будет полноценная модель мира. Автор: Марина Пелепец.Апокалипсис вчера, сегодня, завтра. Автор: Анатолий Вассерман.Голубятня: Симплиций о ДЕГе. Автор: Сергей Голубицкий.Агентство завтрашних проблем.

Журнал «Компьютерра» , Компьютерра

Зарубежная компьютерная, околокомпьютерная литература / Прочая компьютерная литература / Книги по IT
Цифровой журнал «Компьютерра» № 3
Цифровой журнал «Компьютерра» № 3

ОглавлениеBETT 2010: каким мир видит образование будущего? Автор: Сергей ВильяновКивино гнездо: Подбит на взлёте Автор: БЕРД КИВИПротиворакеты Поднебесной Автор: Ваннах МихаилИнтерактивное видео Автор: Максим РудольскийПочему Google уходит из Китая? Автор: Тимофей БахваловВасилий Щепетнёв: Усмиритель Хаоса или Последний декрет Ильича — 2 Автор: Василий ЩепетневКомпьютер в школе: панацея или плацебо? Автор: Сергей ВильяновNexus One — андроидный провал Автор: Фадеев МихаилWindows Mobile в шкуре Google Android Автор: Андрей КрупинОт 430 до 500 Вт: блоки питания на любой случай, часть 1 Автор: Константин ИвановМедиацентр Boxee: первый социальный Автор: Андрей КрупинГолубятня: Сидр № 1 Автор: Сергей ГолубицкийGoogle в КНР: взгляд с другой стороны Авторы: Алексей Стародымов, Марина ПелепецПочему чаевые не спасут онлайн Автор: Иван КошуриновСервисы деактивации троянов-вымогателей Автор: Андрей КрупинЛестница для предпринимателей Автор: Сергей ЕреминКивино гнездо: Сюжет из «Плейбоя» Автор: БЕРД КИВИВасилий Щепетнёв: Последний декрет Ильича Автор: Василий ЩепетневО судьбах Symbian Автор: Алексей СтародымовPackard Bell Easynote TJ65 — хорошо сбалансированный ноутбук Автор: Игорь ОсколковОнлайновые альтернативы Microsoft PowerPoint Автор: Андрей КрупинPanasonic Lumix DMC-TZ7: ультра-ZOOMО возможности предсказания будущего Автор: Ваннах МихаилЗарядись от солнца Автор: Константин ИвановDefenseWall Personal Firewall: очное знакомство Автор: Андрей КрупинЗа что могут посадить компьютерщика? Автор: Майор МышкинИ для VAS, и для нас Автор: Сергей ВильяновНовинки CES 2010. Избранное Автор: Алексей СтародымовГолубятня: Золотой ключик Автор: Сергей Голубицкий

Журнал «Компьютерра» , Коллектив Авторов , Компьютерра Журнал

Зарубежная компьютерная, околокомпьютерная литература / Прочая компьютерная литература / Книги по IT
Цифровой журнал «Компьютерра» № 4
Цифровой журнал «Компьютерра» № 4

ОглавлениеА где же ГЛОНАСС? Автор: Марина ПелепецНоябрьский приз Автор: Игорь ТереховКивино гнездо: Даёшь молодежь! Автор: БЕРД КИВИСчастливое ПО Автор: Alienatio MentaleЦифровые технологии и английские школьницы Автор: Сергей ВильяновВасилий Щепетнёв: О совпадениях Автор: Василий ЩепетневGlobal Mobile Awards 2010: забавные номинанты Автор: Алексей СтародымовYlmf OS: китайский клон Windows XP Автор: Андрей КрупинLeadtek WinFast PxVC1100 — ускоритель кодирования видео Автор: Игорь ОсколковО производстве, портках и логистике Автор: Ваннах Михаил"Компьютерра" в FB2: всё готово Автор: Сергей ВильяновInternet Explorer под ударом Автор: Андрей КрупинБольшая новость Nokia Автор: Алексей СтародымовГолубятня: Коммуникатор в дорогу Автор: Сергей ГолубицкийВасилий Щепетнёв: Прогулка под присмотром Автор: Василий ЩепетневОблачная веб-система Glide OS Автор: Андрей КрупинБилл Гейтс, Facebook и Twitter Автор: Алексей СтародымовКивино гнездо: Акустическая иллюзия Автор: БЕРД КИВИОперационные системы и маркетинговый взгляд Автор: Алексей СаминскийICQ: седьмое пришествие Автор: Андрей КрупинМини-противостояние: Jetway против Zotac Автор: Константин Иванов"Компьютерра" в формате FB2: релиз-кандидат Автор: Сергей ВильяновВасилий Щепетнёв: Ловцы мгновений Автор: Василий Щепетнев

Журнал «Компьютерра» , Коллектив Авторов , Компьютерра Журнал

Зарубежная компьютерная, околокомпьютерная литература / Прочая компьютерная литература / Книги по IT

Похожие книги

«Ага!» и его секреты
«Ага!» и его секреты

Вы бы не хотели, скажем, изобрести что-то или открыть новый физический закон, а то и сочинить поэму или написать концерт для фортепьяно с оркестром?Не плохо бы, верно? Только как это сделать? Говорят, Шиллер уверял, будто сочинять стихи ему помогает запах гнилых яблок. И потому, принимаясь за работу, всегда клал их в ящик письменного стола. А физик Гельмгольц поступал иначе. Разложив все мысленно по полочкам, он дожидался вечера и медленно поднимался на гору лесной дорогой. Во время такой прогулки приходило нужное решение.Словом, сколько умов, столько способов заставить мозг работать творчески. А нет ли каких-то строго научных правил? Одинаковы ли они для математиков, биологов, инженеров, поэтов, художников? Да и существуют ли такие приемы, или каждый должен полагаться на свои природные способности и капризы вдохновения?Это тем более важно знать, что теперь появились «электронные ньютоны» — машины, специальность которых делать открытия. Но их еще нужно учить.Решающее слово здесь принадлежит биологам: именно они должны давать рецепты инженерам. А биологи и сами знают о том, как мы думаем, далеко не все. Им предстоит еще активнее исследовать лабораторию нашего мышления.О том, как ведутся эти исследования, как постепенно «умнеют» машины, как они учатся и как их учат, — словом, о новой науке эвристике рассказывает эта книга.

Елена Викторовна Сапарина

Зарубежная компьютерная, околокомпьютерная литература