Пусть задано множество словоформ W= {w} предложения, где каждая словоформа w, wÎ W является отношением, заданным на множествах основ M и окончаний E:
wÌ {(m, e)/ mÎ M, eÎE} или wÎ Pow(M´E).
Будем считать, что определены отношения:
RMC - словарь основ, заданный на множествах основ M и флективных классов С
RMC Ì {( m, c)/ mÎ M, cÎC } или RMC Î Pow(M ´ C).
RCZ - грамматические категории флективных классов, заданные на множествах флективных классов С и множестве элементов грамматических категорий H:
RCZ Ì {(c,z)/cÎC, zÎZ } или RCM Î Pow(C ´ Z).
RCEZ - грамматические категории окончаний флективных классов, заданные на множествах флективных классов С, окончаний E и множестве элементов грамматических категорий H:
RCEZ Ì {(c,e,z)/cÎC, eÎE, zÎZ } или RCM Î Pow(C ÚÚ E ´ Z).
Построим отношение RWCZ , заданное на множествах словоформ W, флективных классов C и значений грамматической категории Z:
RWCZ Î Pow(W´ C´ Z).
Отношение RWCZ: определим интенсионально, используя множество словоформ W и отношения: RMC , RCZ, RCEZ:
RWCZ: ={(w, c, z)/ wÎ W, (m, e)Î w, (m, c) Î RMC , ((c, z) Î RCZ,Ú (c, e, z) Î RCEZ)}.
Построим отношение RW , заданное на множествах словоформ W, флективных классов C, значений грамматической категории Z и грамматических категорий H:
RW Î Pow(W´ C´ Z´ H).
Отношение RW: определим интенсионально, используя отношения: RWCZ и функциональное отношение fzh:
RW: ={(w, c, z, h)/ (w, c, z ) Î RWCZ, (z, h) Î fzh }.
Приведем последовательность действий для нахождения отношения RW:
R1={(w, m, e)/wÎ W, (m, e)Î w},
R2={(w, m, e, c)/(w, m, e)Î R1, (m, c)Î RMC },
R3={(w, c, z)/(w, m, e, c)Î R2, (c, z) Î RCZ },
R4={(w, c, z)/(w, m, e, c)Î R2, (c, e, z) Î RCEZ },
RWCZ = R3 ÈR4.
RW={(w, c, z, h)/ (w, c, z) Î RWCZ, (z,h) Î fzh}
Алгоритм морфологического анализа словоформы
За начальную основу взять текущее слово. При необходимости отделить от конца словоформы частицы «ся», «сь» и «ь». Образовать пустую последовательность S. Коду окончания присвоить значение 65.
Поиск основы в таблице основ. Если поиск успешный, перейти к п. 4. В противном случае выполнить п. 3.
Отделить от словоформы последнюю букву, образовать новую словоформу, добавить отделяемую букву слева к последовательности S. Проверить, является ли последовательность S окончанием из таблицы окончаний. Если последовательность S является окончанием, то определить его код и перейти к п. 2. В противном случае, если длина последовательности меньше 3, повторить 3.
Определить по таблице «Словарь основ» номер флективного класса.
По номеру флективного класса и номеру окончания определить в таблице «Морфологическая информация» множество номеров морфологической информации.
По номеру флективного класса и таблице «Флективные классы» определить часть речи.
По номеру морфологической информации и таблице «Грамматическая информация» определить код грамматической информации.
По коду грамматической информации и коду части речи по таблице «Кодификатор грамматической информации» определить содержание грамматической информации
Морфологический анализ словоформы. Контрольный пример
Рассмотрим пример морфологического анализа словоформы «сосуда» слова «сосуд»:
За начальную основу примем «сосуда», коду окончания присвоим значение 65.
Произведем поиск основы в таблице основ: результат – основа не найдена.
Отделим от текущей основы последнюю букву «а» и добавим ее слева к последовательности S (S = «а»). Последовательность S является окончанием из таблицы «Окончания» с кодом 66.
Повторим поиск основы: результат – найдена основа.
Номер флективного класса – 001.
По таблице «Морфологическая информация» определяем номер морфологической информации: 06.
Часть речи S – существительное.
Новое о педагогике:
Молодежь в трудовом секторе России
В труде современная молодежь ориентирована на социально-экономическое выживание вопреки биологическому и социально-психологическому самосохранению. По данным социологических исследований Института Молодежи (ИМ), молодежь в процессе труда и ...
Как проводить анализ почерка
Идеальный образец почерка должен быть на большом листе обычной белой бумаги, не разлинованной и без полей. Для текста лучше не переписывать что-либо из книги или газеты, а предложить человеку написать то, что приходит ему в голову. В этом ...