|
|
Факултет по математика и информатика - Компютърна лингвистика |
|
Информатика (бакалавър) редовно обучение | изпит | | | Естествен език. Предмет на компютърната лингвистика. Проблеми на анализа на ЕЕ текстове. История на КЛ. Регулярни изрази и автомати. Компютърна морфология. Ортографичен анализ. Компютърна фонология и модели на произношение. Вероятностни и статистически модели в КЛ. Контекстно-свободни граматики. Анализ с КСГ. Видове синтактичен анализ. Дефинитно клаузални граматики. Семантика. Компютърна лексикография. Прагматика. Синтез на текст. Трансформация на текст в текст. Машинен превод. Обработка на текстови документи. Езикови ресурси. Софтуерни средства за обработка на ЕЕ текстове. | | - Естествен език. Език и мислене. Нива на лингвистичния анализ: фонология, морфология, синтаксис,семантика, прагматика.Познание.
- Предмет на компютърната лингвистика. Основни понятия, задачи и проблеми на КЛ.
- Проблеми на анализа на ЕЕ текстове. Примери за многозначност и неопределеност при анализа на ЕЕ текстове.Сегментация, лематизация, разпознаване и класификация, извличане на информация.
- История на КЛ. Началото (1940-1950). Първи стъпки (1957-1971). Обработка на естественоезикови текстове (1972-1983). Генериране и модели на крайните състояния (1983-1993). Интегрирани модели. Съвременни направления на КЛ.
- Регулярни изрази и автомати. Основни операции. Крайни автомати и преобразуватели. Приложения в КЛ.
- Компютърна фонология и модели на произношение. Фонематична транскрипция. Фонеми и фонологични правила. Синтез на реч по естествено-езикови текстове.
- Компютърна морфология. Флективна и деривационна морфология. Морфологични анализатори и синтезатори. Модел на Коскениеми. Машинни речници. Алгоритъм на Porter.
- Ортографичен анализ. Минимално разстояние при редактиране. Разпознаване на морфологичния клас на “непознати” думи.
- Вероятностни и статистически модели в КЛ. Модели на Байес. Вериги на Марков.
- Контекстно-свободни граматики (КСГ). Групи на съществителното и глагола. Съгласуване.
- Анализ с КСГ. Възходящ (отдолу – нагоре) и низходящ (отгоре-надолу) анализ. Алгоритъм на Earley.
- Видове синтактичен анализ. Анализ с преместване и сливане. Анализ от левия ъгъл. Табличен анализ. Възходящ табличен анализ. Низходящ табличен анализ
- Дефинитно клаузални граматики. Унификационни граматики. Атрибутни структури. Съгласуване и унификация.
- Семантика. Представяне на смисъла. Синтактично-управляван семантичен анализ. Модели на управление.
- Компютърна лексикография. Значения на думите и синонимни редове. Лексикални типове и йерархии. Полисемия. WordNet. Машинно-читаеми речници. Приближен семантичен анализ на “непознати” думи.
- Прагматика. Дискурс и диалог. Дискурсови структури. Анафора и резолюция.
- Синтез на текст. Нива на синтеза: избор на думи, синтаксис, дискурсова структура. Многоезиков синтез.
- Трансформация на текст в текст. Многоезиково резюмиране на текст. Автоматична идентификация на езика.
- Машинен превод, подпомогнат от човек или компютър. Наивни подходи. Превод дума-дума. Синтактични трансформации. Превод по аналогия. Системи за машинен превод: SYSTRAN, METEO, ПРОМТ и др.
- Обработка на текстови документи. Търсене и резюмиране на документи. Извличане на информация. Компютърно-подпомогнато редактиране и създаване на текст.
- Езикови ресурси. Текстови корпуси. Звукови корпуси. Видове машинно-читаеми речници. Лексикални стандарти и ресурси.
- Софтуерни средства за обработка на ЕЕ текстове.
|
|
|
|
|
|
|
© 2009 ФМИ |