text categorization
(text classification
(text corpora
– текстовые корпуса, корпуса текстов # большие текстовые корпуса используются для обучения нейросетевых систем машинного перевода с одного естественного языка на другой (см. такжеtext generation
– порождение (генерация) текста # в ИИ – формирование интеллектуальной системой последовательности, в которой должна быть изложена информация, заполнение её языковыми выражениями с учётом факторов восприятия текста человеком. Например, automatic text generation – автоматическая генерация текста.text mining
(text normalization
– нормализация текста # в системах обработки естественного языка и в системах преобразования текста в речь – приведение текста в единую каноническую форму перед его сохранением или обработкой; при этом требуется знать, какого типа текст должен проходить нормализацию и как он будет затем обрабатываться – поскольку не существует какой-то одной универсальной процедуры нормализации текста. Например, при преобразовании текста в речь нужно уделять особое внимание таким нестандартным “словам”, как числа, даты, акронимы, аббревиатуры, поскольку они произносятся по-разному в зависимости от контекста (см. такжеtext prediction
– прогнозирование (предсказание) вводимого текста # система (программа) подсказывает пользователю возможные варианты продолжения текста в процессе ввода, что упрощает и ускоряет его работу. Например, context-sensitive text prediction – контекстно-зависимое прогнозирование вводимого текста (см. такжеtext predictor
– предиктор текстового ввода # программа, которая подсказывает пользователю наиболее вероятное продолжение набираемых им слов или фраз. Упрощает ввод текста на мобильных устройствах, при этом программа учитывает возможные опечатки. Чтобы предсказания были полезны, предиктору текста требуется как можно больше знаний о входном языке, что часто достигается с помощью машинного обучения (МО). Частичный синоним – language predictor (см. такжеtext to speech
(text translation
– перевод текста (текстов) # перевод машиной или человеком текста с одного естественного языка на другой (см. также