Читаем Журнал "Компьютерра" №761 полностью

10 Помню времена, когда распознавание речи было… э-э-э, довольно-таки случайным. Но современные технологии делают эту задачу куда более реальной, и совмещая технологии распознавания речи и поиск по видео, вы тем самым заметно расширяете спектр возможных поисков.

11 Обычный пользователь сможет искать по видео года через четыре. Я не уверен, что мы сможем нормально проиндексировать случайно взятый файл с YouTube, поэтому сейчас я имею в виду только контент с хорошим качеством звука и картинки. В общем, через три-четыре года, ну, может быть, через пять лет вы наверняка сможете найти все упоминания Путина в веб-выпусках видеоновостей.

12 Наш машинный перевод несовершенен, но достаточно хорош. Читабелен. И он не требует человеческого участия, он базируется исключительно на собранных данных, на основании которых строится модель языка. Эта модель используется как для создания автоматических переводчиков, так и для движков распознавания речи, где вычисляются вероятности произнесения того или иного слова. Так что если мы теоретически объединим две эти технологии, то в результате получим универсальный речевой переводчик, умеющий переводить с любого языка на любой. Я, конечно, не могу назвать сроки - наверное, это не три года и не пять, - но это возможно.

В течение многих лет в разработке машинных переводчиков главенствовал подход, основанный на правилах (rule-based), и эти системы до сих пор существуют и работают, но на построение полной модели языка уходит десять-пятнадцать лет, а то и двадцать. А за это время язык успевает измениться, это слишком большой срок. Мы, конечно, тоже строим модели, но они, в отличие от тех моделей, являются динамическими. Новые имена, новые названия - а это важно при переводе, это культурный контекст - в динамической модели появляются через считанные дни и часы. У нас, конечно, тоже есть проблемы, но это проблемы масштаба. Чем больше у нас текстов, тем лучше мы переводим, и за последние пять лет мы постоянно побеждали на чемпионатах NIST (имеются в виду сравнительные тесты систем машинного перевода, которые проводит американский Национальный институт стандартов и технологий. - В.Г.).

13 Мы и сейчас можем перевести художественный текст, так что вы, наверное, имеете в виду, когда мы научимся переводить художественный текст не хуже человека? Это зависит от языка, но я не вижу здесь особых препятствий. Это возможно. Не завтра, конечно, но возможно. Это сложная задача, ее решение займет какое-то время. Ну, скажем, лет десять. Или пять.

ГОЛУБЯТНЯ: Держи воррра!

Автор: Сергей Голубицкий

Ух, как хотелось воздержаться сегодня от культур-джема и целиком сосредоточиться на положительных эмоциях от Sony Vaio Z11 VRN! Так ведь не получится: жизнь берет свое, дик­тует условия, не дает пе­редыха своими гадкими миазмами!

В августе я напомнил новому поколению читателей "Голубятни" о существовании самой мерзкой онлайн-компании - PayPal, - освежил в памяти историю шестилетней давности (серия моих статей "Девятый круг") о беспрецедентном воровстве денег клиентов со счетов, открытых в этом хтоническом детище Максимилиана Рафаиловича Левчина, американского миллионера, а в прошлой жизни - выпускника киевской математической спецшколы, промышлявшего в молодости под хакерским погоняловом Mad Russian (а также Mad Max, Coffee, mumitroll, DELPH и Сантехник - The Plumber).

Казалось бы, сколько воды утекло, сколько судебных процессов обрушилось на PayPal, сколько неустоек было выплачено! Мало того: сама компания давно уже продана eBay и сегодня обслуживает десятки миллионов участников популярного онлайн-аукциона. Уж что-что, а генеральная линия общения с клиентами просто обязана была измениться: вместо хамского и оскорбительного отношения "все, кто приходит в PayPal, - потенциальные воры, особенно если они приходят с территорий бывшего отечества товарища Левчина", должна была утвердиться классическая аксиома Америки: "Уважение клиента - единственный залог успеха".

Тем не менее в "Могиле для горбатого" я выразил скепсис в способности PayPal к кардинальному перерождению, поскольку, изучив корпоративные биографии не одной сотни компаний, убедился, что генетическая природа бизнеса совершенно неодолима. Каким был учредитель, таким останется и корпоративный ребенок, в чьи бы руки он ни перешел.

Перейти на страницу:

Все книги серии Компьютерра

Похожие книги

«Ага!» и его секреты
«Ага!» и его секреты

Вы бы не хотели, скажем, изобрести что-то или открыть новый физический закон, а то и сочинить поэму или написать концерт для фортепьяно с оркестром?Не плохо бы, верно? Только как это сделать? Говорят, Шиллер уверял, будто сочинять стихи ему помогает запах гнилых яблок. И потому, принимаясь за работу, всегда клал их в ящик письменного стола. А физик Гельмгольц поступал иначе. Разложив все мысленно по полочкам, он дожидался вечера и медленно поднимался на гору лесной дорогой. Во время такой прогулки приходило нужное решение.Словом, сколько умов, столько способов заставить мозг работать творчески. А нет ли каких-то строго научных правил? Одинаковы ли они для математиков, биологов, инженеров, поэтов, художников? Да и существуют ли такие приемы, или каждый должен полагаться на свои природные способности и капризы вдохновения?Это тем более важно знать, что теперь появились «электронные ньютоны» — машины, специальность которых делать открытия. Но их еще нужно учить.Решающее слово здесь принадлежит биологам: именно они должны давать рецепты инженерам. А биологи и сами знают о том, как мы думаем, далеко не все. Им предстоит еще активнее исследовать лабораторию нашего мышления.О том, как ведутся эти исследования, как постепенно «умнеют» машины, как они учатся и как их учат, — словом, о новой науке эвристике рассказывает эта книга.

Елена Викторовна Сапарина

Зарубежная компьютерная, околокомпьютерная литература
Тайны и секреты компьютера
Тайны и секреты компьютера

Эта книга предназначена для тех, кто самостоятельно осваивает мир информационных технологий. Программирование в среде Microsoft Office, устройство сетей Internet и Fidonet, работа системы электронной почты, структура системного реестра Windows и файловой системы, строение жидкокристаллических дисплеев и проблема наличия различных кодировок русского языка, — про все это рассказывается в ней. Многообразие тем и легкий стиль изложения сделают ее вашим спутником на долгое время, и вы всегда сможете найти в ней нужную именно в данный момент информацию.Если Вы интересуетесь компьютерными технологиями, желали бы расширить свои знания и умения в этой области, то она Вам наверняка понравится.http://comptain.nm.ru

Антон Александрович Орлов , Антон Орлов

Фантастика / Фэнтези / Прочая компьютерная литература / Книги по IT / Зарубежная компьютерная, околокомпьютерная литература