Пруцков А. В., Розанов А. К. Методы морфологической обработки текстов: статья

Аннотация

Выполнен обзор существующих отечественных и зарубежных методов морфологической обработки текстов. С целью разработки универсального метода (УМ) генерации и определения форм слов выявлены преимущества и недостатки существующих подходов. Морфологический анализ и синтез, ориентированный на один естественный язык, не подходит для построения УМ. Алгоритмы и структуры хранения данных (словари) таких методов специализированы под особенности одного языка и не могут быть изменены для других языков. Подходы к морфологическому анализу, предназначенные для нескольких языков, имеют «слабые места», которые могут быть скорректированы в УМ. На основе анализа рассмотренных в статье подходов к морфологическому анализу и синтезу, сформулированы требования к УМ: обработка словоформ языков различных групп и семейств; универсальность структуры словарей, не требующей конвертации для решения задач определения или генерации словоформ; модель формообразования, на основе которой построен метод, должна описывать любые виды образования форм всей парадигмы слова. Разработанный авторами статьи метод генерации и определения форм слов соответствует этим требованиям.

Библиографическая ссылка

Пруцков А. В., Розанов А. К. Методы морфологической обработки текстов // Прикаспийский журнал: управление и высокие технологии. — 2014. — № 3 (27). — С. 119-133.

Текст статьи

Статья в формате PDF

Отправить сообщение автору

Контактная информация