Читаем Эксперт № 16 (2014) полностью

Татьяна тут же на примере показывает работу поиска. Специально для нас она проиндексировала 15 тыс. новостных заметок на русском языке. На первой странице Intelligent Search автоматически выскакивают фасеты — наиболее важные и часто встречающиеся категории: упомянутые персоны, географические объекты и даты. На запрос «отделение» система уточняет, какое из множества значений «отделения» имелось в виду, и легко различает в выдаче: «отделение» в смысле организации (отделения банков) или «отделение» — как выделение части из целого. Любая система неидеальна — я быстро нахожу, что Intelligent Search воспринимает «и. о.» и «исполняющий обязанности» как разные понятия. Татьяна тут же заходит в сервис рекламаций и отправляет лингвистам заявку на дополнение словаря. Поиск от ABBYY легко уточняется и масштабируется на новые предметные области, так как смысл многих понятий в словаре общей лексики и, например, медицинском весьма разнится. Дерево понятий поражает дотошностью. Так, класс Beautiful person включает в себя в русском варианте «богиню», «королеву», «кралю», «красаву», «няшку», «пупсика» и еще множество слов, не сразу приходящих на ум при описании кого-либо прекрасного.

Intelligent Tagger позволяет автоматически вычленять факты и связи между объектами. По запросу «Сноуден» система рисует легкочитаемую инфографику, отображающую ключевые факты: родился, учился, работал; разбивку событий по годам, ключевых лиц, с которыми он был связан, причем их система вычленяет из новостной базы не только по именам, но и по социальным ролям, например girlfriend.

Количество возможных применений Compreno ограничено лишь фантазией заказчика. Например, можно настроить анализ корпоративной переписки на поиск любых эвфемизмов для «откат» и «вознаграждение» или негативных отзывов о руководителе, причем система поймает не только прямые упоминания «Иван Иваныч» или «генеральный», но и «дражайший», «сам» и «наш козел».

Интеллектуальный поиск может работать не только с корпоративными документами. Запустив робота на индексацию интернета, можно отыскать все упоминания о каких-либо событиях, фактах или персонах в определенных контекстах и взаимосвязях. Например, можно использовать систему для поиска взаимосвязей между сотрудниками вашего отдела снабжения и руководителями поставщиков, и вполне возможно, что кто-то из них родственники или учился в одном классе. Сейчас министерство внутренней безопасности США публикует длинный перечень ключевых слов, по которым осуществляется мониторинг интернета: от «Аль-Каиды» и «теракта» до «исламистов» и «свинины». Использование поисковых решений на основе Compreno позволит более изощренно и эффективно подходить к контролю интернета, чем уже заинтересовались компетентные службы.

Как признался нам генеральный директор ABBYY Сергей Андреев , компания мечтала бы сосредоточиться на лицензировании технологий сторонним разработчикам. Но как стало очевидно на примере нынешней «дойной коровы» ABBYY — решений в области распознавания текстов и потокового ввода данных, только непосредственная работа с конечным потребителем дает понимание его нужд и возможность совершенствовать под них технологию.

Цены на Intelligent Search и Intelligent Tagger не называются, поскольку формируются в зависимости от объема задач в каждом конкретном случае и числа используемых процессоров. Но, по словам Антона Тюрина, средняя цена установки корпоративного поиска на рынке — 62,5 тыс. долларов, и решения ABBYY будут вполне конкурентоспособны по цене. Ключевой рынок, на который нацелена ABBYY, — Соединенные Штаты.

Плоды понимания

Однако поисковые решения — лишь первый шаг. Compreno — базовая технология, которая может быть использована в десятках различных приложений, предназначенных для работы с текстом. Уже на этапе финальной доработки находится eDiscovery — поиск информации в документах в рамках юридических разбирательств, аудита и расследований в США, Великобритании и других государствах. В них требуется обработка огромных массивов корпоративной информации для дальнейшего поиска и выявления фактов и доказательств.

В числе следующих решений — анализ тональности высказываний (отношения автора к предмету обсуждения) в текстах, обрабатываемых, например, в процессе мониторинга СМИ и социальных сетей. Охрана «информационного периметра» организации с выявлением фактов передачи несанкционированной информации и система прогнозирования и оповещения о наступлении событий. Настоящим переворотом может стать планируемый выход программы семантического перевода — ориентированного на передачу смысла с учетом контекста.

Перейти на страницу:

Все книги серии Журнал «Эксперт»

Похожие книги

100 знаменитых загадок природы
100 знаменитых загадок природы

Казалось бы, наука достигла такого уровня развития, что может дать ответ на любой вопрос, и все то, что на протяжении веков мучило умы людей, сегодня кажется таким простым и понятным. И все же… Никакие ученые не смогут ответить, откуда и почему возникает феномен полтергейста, как появились странные рисунки в пустыне Наска, почему идут цветные дожди, что заставляет китов выбрасываться на берег, а миллионы леммингов мигрировать за тысячи километров… Можно строить предположения, выдвигать гипотезы, но однозначно ответить, почему это происходит, нельзя.В этой книге рассказывается о ста совершенно удивительных явлениях растительного, животного и подводного мира, о геологических и климатических загадках, о чудесах исцеления и космических катаклизмах, о необычных существах и чудовищах, призраках Северной Америки, тайнах сновидений и Бермудского треугольника, словом, о том, что вызывает изумление и не может быть объяснено с точки зрения науки.Похоже, несмотря на технический прогресс, человечество еще долго будет удивляться, ведь в мире так много непонятного.

Владимир Владимирович Сядро , Оксана Юрьевна Очкурова , Татьяна Васильевна Иовлева

Приключения / Публицистика / Природа и животные / Энциклопедии / Словари и Энциклопедии
Жертвы Ялты
Жертвы Ялты

Насильственная репатриация в СССР на протяжении 1943-47 годов — часть нашей истории, но не ее достояние. В Советском Союзе об этом не знают ничего, либо знают по слухам и урывками. Но эти урывки и слухи уже вошли в общественное сознание, и для того, чтобы их рассеять, чтобы хотя бы в первом приближении показать правду того, что произошло, необходима огромная работа, и работа действительно свободная. Свободная в архивных розысках, свободная в высказываниях мнений, а главное — духовно свободная от предрассудков…  Чем же ценен труд Н. Толстого, если и его еще недостаточно, чтобы заполнить этот пробел нашей истории? Прежде всего, полнотой описания, сведением воедино разрозненных фактов — где, когда, кого и как выдали. Примерно 34 используемых в книге документов публикуются впервые, и автор не ограничивается такими более или менее известными теперь событиями, как выдача казаков в Лиенце или армии Власова, хотя и здесь приводит много новых данных, но описывает операции по выдаче многих категорий перемещенных лиц хронологически и по странам. После такой книги невозможно больше отмахиваться от частных свидетельств, как «не имеющих объективного значения»Из этой книги, может быть, мы впервые по-настоящему узнали о масштабах народного сопротивления советскому режиму в годы Великой Отечественной войны, о причинах, заставивших более миллиона граждан СССР выбрать себе во временные союзники для свержения ненавистной коммунистической тирании гитлеровскую Германию. И только после появления в СССР первых копий книги на русском языке многие из потомков казаков впервые осознали, что не умерло казачество в 20–30-е годы, не все было истреблено или рассеяно по белу свету.

Николай Дмитриевич Толстой , Николай Дмитриевич Толстой-Милославский

Документальная литература / Публицистика / История / Образование и наука / Документальное / Биографии и Мемуары
Как разграбили СССР. Пир мародеров
Как разграбили СССР. Пир мародеров

НОВАЯ книга от автора бестселлера «1991: измена Родине». Продолжение расследования величайшего преступления XX века — убийства СССР. Вся правда о разграблении Сверхдержавы, пире мародеров и диктатуре иуд. Исповедь главных действующих лиц «Великой Геополитической Катастрофы» — руководителей Верховного Совета и правительства, КГБ, МВД и Генпрокуратуры, генералов и академиков, олигархов, медиамагнатов и народных артистов, — которые не просто каются, сокрушаются или злорадствуют, но и отвечают на самые острые вопросы новейшей истории.Сколько стоил американцам Гайдар, зачем силовики готовили Басаева, куда дел деньги Мавроди? Кто в Кремле предавал наши войска во время Чеченской войны и почему в Администрации президента процветал гомосексуализм? Что за кукловоды скрывались за кулисами ельцинского режима, дергая за тайные нити, кто был главным заказчиком «шоковой терапии» и демографической войны против нашего народа? И существовал ли, как утверждает руководитель нелегальной разведки КГБ СССР, интервью которого открывает эту книгу, сверхсекретный договор Кремля с Вашингтоном, обрекавший Россию на растерзание, разграбление и верную гибель?

Лев Сирин

Публицистика / Документальное