6.3. Машина учится понимать: обработка естественного языка
Полоний: …Что вы читаете, мой принц?
Гамлет: Слова, слова, слова.
Полоний: Но в чём же именно тут дело, принц?
Гамлет: Чьё дело, с кем?
Полоний: В чём суть того, что вы читаете, мой принц?
Уильям Шекспир. Гамлет[1]
Различные области науки и технологий содержат множество пересечений, что делает невозможным построение их простой древовидной классификации. Обработка естественного языка (Natural language processing, NLP) — так сказать, NLP здорового человека, в отличие от раскрученного «нейролингвистического программирования», — является одновременно областью лингвистики, информатики, информационной инженерии и искусственного интеллекта. К области NLP относят распознавание речи, понимание естественного языка и его генерацию. При этом с NLP совершенно очевидным образом пересекается распознавание образов, методы которого применяются в решении различных задач NLP. Мы уже обсудили прогресс в области распознавания речи, вызванный революцией глубокого обучения, теперь пришла пора обратить внимание на другие задачи из области NLP.
В широком смысле к области NLP относят все задачи, связанные с взаимодействием между машинами и человеческими (естественными) языками. Методы NLP применяются для создания диалоговых и справочных систем, систем поиска информации и машинного перевода, систем анализа тональности высказываний (так называемый сентимент-анализ [sentiment analysis]), систем реферирования текста, уточнения текста при оптическом распознавании, проверки правописания и так далее. В отношении последней задачи я рекомендую всем интересующимся детальное исследование Татьяны Шавриной «Методы обнаружения и исправления опечаток: исторический обзор»[2]. Вообще, для того чтобы сделать полноценный обзор методов NLP и сфер их применения, вероятно, потребовалось бы как минимум написать отдельную книгу, а возможно, и целую серию книг, поэтому здесь мы остановимся лишь на отдельных задачах и проектах, чтобы показать, как область NLP изменилась под влиянием методов глубокого обучения.
- ↑ * Пер. Н. Россова.
- ↑ Шаврина Т. О. (2017). Методы обнаружения и исправления опечаток: исторический обзор / Вопросы языкознания. № 4. С. 115—134 // https://doi.org/10.31857/S0373658X0001024-5