Рабочая программа по дисциплине Компьютерные технологии в лингвистическом образовании




Скачать 342.96 Kb.
НазваниеРабочая программа по дисциплине Компьютерные технологии в лингвистическом образовании
страница1/2
Дата08.09.2012
Размер342.96 Kb.
ТипРабочая программа
  1   2
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РОССИЙСКОЙ ФЕДЕРАЦИИ

Государственное образовательное учреждение высшего профессионального образования

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ГУМАНИТАРНЫЙ УНИВЕРСИТЕТ

ИМЕНИ М.А. ШОЛОХОВА


УТВЕРЖДАЮ

Проректор по научной работе

_______________

«__»________200_г.


РАБОЧАЯ ПРОГРАММА


по дисциплине Компьютерные технологии в лингвистическом образовании


по направлению Филологические науки


10.02.01 – Русский язык

(специальности) (шифр и наименование направления, специальности)


Всего учебных часов 72


Всего аудиторных занятий, час. 18

Всего часов на самостоятельную работу аспиранта 54

Аттестация (3 семестр)


МОСКВА 2011_


Рабочая программа составлена на основании паспорта научной специальности 10.02.01 – Русский язык и учебного плана МГГУ им. М.А.Шолохова


Составители рабочей программы:


Проф., д.ф.н. Циммерлинг А.В.


Рабочая программа утверждена на заседании ученого совета филологического факультета

(наименование факультета)


Председатель ученого совета

«_11_»сентября 2011__г. _____________ Котовчихина Н.Д. _____________

(подпись) (Ф.И.О.)


СОГЛАСОВАНО:


Начальник Управления аспирантуры и докторантуры ______________ ____________

«___»_________2011_г. (подпись) Ромасевич О.А. (Ф.И.О.)


Пояснительная записка


Дисциплина «Компьютерные технологии в лингвистическом образовании» является факультативной дисциплиной 2-го года обучения в аспирантуре и входит в образовательную составляющую структуры программы послевузовского профессионального образования (ФД.А.01). Программа дисциплины разработана на основе паспорта научной специальности 10.02.01 – «Русский язык» и программы кандидатского экзамена по специальности «Русский язык». Дисциплина складывается из лекций, посвященных различным аспектам компьютерной лингвистики и корпусной лингвистики и ориентирует аспирантов на решение задач, требующих комплексного применения лингвистических методов и методов компьютерной лингвистики. Курс призван развить у аспирантов интерес к изучению взаимодействия компьютерных наук и лингвистики как смежных гуманитарных дисциплин и научить их правильно применять приложения компьютерной лингвистики к широкому кругу проблем, связанных с синтезом и анализом текста, автоматической обработкой текста и информационно-поисковыми системами.


Основные цели и задачи дисциплины


Цель данного курса - ознакомление студентов с потенциалом компьютерной лингвистики как дисциплины, возникшей на стыке вычислительной математики, кибернетики и теоретической лингвистики, и выработка у студентов навыков применения компьютерных технологий при решении конкретных задач прикладной линвгистики.

Задачи:

- знать предмет, цели и задачи изучаемой дисциплины;

- усвоить основные понятия и термины курса;

- предъявить систему понятий, показывающую важнейшие принципы компьютерной лингвистики и возможность ее приложений в информационных системах и практической деятельности прикладного лингвиста, состоящей в моделировании фрагментов естественного языка и создании формально-логических моделей, имеющих лингвистическую интерпретацию;

- ознакомить аспирантов с основными понятиями компьютерной лингвистики и принципами аннотирования корпусов текстов.


Распределение часов учебных занятий по семестрам


Название дисциплины

Вид учебной работы

Кол-во часов

Семестры

Аудитор

ные

Самост. работа

Компьютерные технологии в лингвистическом образовании

Лекции

18

54

3




Общий объем часов по дисциплине

18

54

72



Содержание дисциплины


  1. Вводная часть: Предмет и задачи математической лингвистики.

Математическая лингвистика, компьютерная лингвистика и компьютерные технологии. Основные этапы развития современной математической лингвистики и кибернетики с 1950-х гг. по настоящее время. Приложения компьютерной лингвистики в прикладных исследованиях. Понятия формального языка и формальной грамматики. Распознающие и порождающие грамматики. Классы формальных грамматик и их естественно-языковые соответствия. Неукорачивающие грамматики, грамматики непосредственных составляющих, контекстно-свободные грамматики, контекстно-зависимые грамматики. Категориальные грамматики. Структура подчинения и линеаризация. Синтаксические деревья и поддеревья. Грамматики зависимостей и грамматики составляющих. Древоприсоединяющие грамматики (Tree-adjoining grammars) Джоши и Минималистские грамматики Хомского и Стейблера. Мощность грамматики и проблема распознавания языков.

II. Лингвистический процессор и модели парсинга.

Уровневая структура естественного языка и лингвистический процессор. Модель «Смысл-Текст» как обоснование лингвистического процессора на основе грамматики зависимостей. Понятие автоматического (машинного) перевода. Системы «Этап», «Этап 2» и «Этап 3» и их применение для формализации русского языка. Понятия парсера и парсинга. Грамматически-ориентированные (grammar-driven) и корпусно-ориентированные (data-driven) модели парсера. Левое и правое ветвление синтаксической структуры. Понятие глубины памяти и гипотеза Ингве. Неоднозначные предложения и снятие омономии. Понятия перемещения поддерева (Move), слияния поддеревьев (Merge), скрэмблингов и Барьеров.


III.Компьютерная лингвистика и интеллектуальные технологии.

Информационно-поисковые системы. Понятия базы дазы данных и банка данных. Понятие информационно-поискового тезауруса. Структура статьи информационно-поискового тезауруса. Тезаурусы и базы данных в системах извлечения информации. Понятие языковой онтологии. Построение онтологии для фрагментов естественного языка. Компьютерная лингвистика и интеллектуальные технологии. Системы извлечения информации. (проходится на практических занятиях). Компьютерные технологии в распознавании речи. (проходится на практических занятиях, рекомендуется демонстрировать образцы работы компьютерных программ анализа речи). Синтез речи. Понятие речевого клона. (проходится на практических занятиях рекомендуется демонстрировать образцы работы компьютерных программ синтеза речи). Моделирование многофакторных процессов в языковой деятельности. Мультимодальные системы.

IV. Корпусная лингвистика.

Понятия корпуса текста. Аннотированные корпуса текстов естественных языков и их структура. Национальный корпус Русского языка, его структура и возможности навигации. Корпусная лингвистика и ее перспективы.


Лекционный курс



Порядковый номер лекции

Раздел, тема учебного курса, содержание лекции

Количество часов


1.


2.


3.


4.


5.


6.


7.


8.



Тема 1. Предмет и задачи математической лингвистики


1.1. Введение. Понятия математической лингвистики, кибернетики, и компьютерной лингвистики. Зарождение математической лингвистики в 1950-е гг. как новой научной дисциплины, находящейся на стыке теоретической лингвистики и теории формальных языков.

1.2. Выделение классов формальных грамматик и их естественно-языковые соответствий Н.Хомским в 1950-х. Мощность грамматики и проблема распознавания формальных и естественных языков. Нетривиальные лингвистические и математические свойства Неукорачивающих грамматик, грамматик непосредственных составляющих, контекстно-свободных грамматик, контекстно-зависимые грамматик, категориальных грамматик, грамматик с автоматной памятью. Проблема выделения в естественном языке ядра, соответствующего определенным классам формальных грамматик. Распознающие и порождающие грамматики. Категориальные грамматики.

1.3. Проблема полноты распознавания. Порождающая способность как основа языковой деятельности. Формализация естественного языка и поиск интуитивных соответствий классам формальных грамматик как основные направления развития математической лингвистики.

1.4. Понятия дерева подчинения и виды синтаксических деревьев. Грамматика зависимостей и грамматика составляющих как два основных способа представления дерева подчинения. Эквивалентность двух способов представления дерева подчинения. Соотношение линейного порядка и иерархической структуры. Бинарные проективные деревья составляющих и их линвгистические свойства. Феномен непроективности и его проявления в естественных языках. Совершенствование теории формальных грамматик и математической лингвистики в 1980-2010 гг.

1.5. Древоприсоединяющие грамматики (Tree-adjoining grammars) Джоши, и Минималистские грамматики Хомского и Стейблера. Понятия доминации, структурного приоритета, предшествования и непосредственного предшествования. Понятия перемещения поддерева (Move), слияния поддеревьев (Merge), скрэмблинга и Барьеров.


Тема 2. Лингвистический процессор и модели парсинга

2.1. Уровневая структура естественного языка и лингвистический процессор. Модель «Смысл-Текст» И.А.Мельчука – А.К.Жолковского как обоснование лингвистического процессора на основе грамматики зависи мостей.

2.2. Понятие автоматического (машинного) перевода. Системы «Этап», «Этап 2» и «Этап 3» и их применение для формализации русского языка. Достижения отечественных и зарубежных линвистов в сфере машинного перевода.

2.3. Понятия парсера и парсинга. Грамматически-ориентированные (grammar-driven) и корпусно-ориентированные (data-driven) модели парсинга. Левое и правое ветвление синтаксической структуры. Неоднозначные предложения и снятие омономии.

2.4. Понятие глубины памяти и гипотеза Ингве. Алгоритмы отбора правильной синтаксической структуры. Время решения как критерий эффективности парсинга. Машина Тьюринга. Полиноминальное время решения.


Тема 3. Компьютерная лингвистика и интеллектуальные технологии


3.1. Информационно-поисковые системы. Понятия базы дазы данных и банка данных. Реляционные базы данных и семантические сети. Глубинно-семантический уровень как семантическая сеть.

3.2. Понятие языковой онтологии. Предикатно-аргументные отношения как модель для построения языковой онтологии. Понятие информационно-поискового тезауруса. Отличие тезауруса от энциклопедического и толкового словаря. Структура статьи информационно-поискового тезауруса. Тезаурусы и базы данных в системах извлечения информации. Системы распознавания речи в прикладных исследованиях. Речевое портретирование.

3.3. Синтез речи: проблема выделения стандартных сегментных и супрасегментных блоков в корпусе текста. Речевые клоны и моделирование акцента. Сочетание лингвистических и статистических методов в интеллектуальных технологиях. Обучающие логические алгоритмы и тестирование систем.

3.4. Моделирование многофакторных процессов в языковой деятельности. Понятие мультимодальной системы. Применение виртуальных собеседников (роботов) в мультимодальных системах.

Тема 4. Корпусная лингвистика

4.1. Понятия корпуса текста и корпусной лингвистики. Аннотированные корпуса текстов естественных языков и их структура.

4.2. Национальный корпус Русского языка, его структура и возможности навигации. Соотношение традиционной и корпусной лингвистики.

4.3. Проблема языковой нормы и соотношения синхронного и диахронного срезов в корпусах текстов. Панхронические тенденции и статистическая оценка узуса.

4.4. Понятие морфологической дезамбигуации. Синтаксическая и прагматическая дезамбигуация предложений. Разрешение неоднозначности в корпусах текстов со снятой амбигуацией. Понятия лемм и тэгов, наиболее распространенные системы тэггинга.



6


4


5


3





Содержание и объем самостоятельной работы студентов


Разделы и темы рабочей программы самостоятельного изучения

Перечень домашних заданий и других вопросов для самостоятельного изучения

Сроки

выполнения

Объём часов

1

2

3

4

Тема 1. Математическая лингвистика и ее приложения.


Тема 2. Формальные грамматики и их естественно-языковые соответствия.


Тема 3. Лингвистический процессор


Тема 4. Языковые онтологии


Тема 5. Синтез речи и мультимодальные системы



Подготовка эссе на тему с конспектированием первоисточников: 1) Норберт Винер. Кибернетика, или управление и связь в животном и машине. 2-е изд., М., 1983; 2) Мельников Г.П. Системология и языковые аспекты кибернетики. М.: Советское радио, 1983. 3) А.В.Гладкий, И.А. Мельчук. Элементы математической лингвистики. М., Наука. 1969; 4) Тестелец Я.Г. Введение в общий синтаксис. М: РГГУ, 2001; 5) Хомский Н. Аспекты теории синтаксиса. Пер. с англ. М.: МГУ, 1972; 6) Математическая лингвистика. Отв. Ред. С.К.Шаумян. М., 1973; 7) Ч.Мидоу. Анализ информационных систем. М., Прогресс, 1977.

Перевод первоисточников: 1) Nirenburg S. and Raskin V. Ontological Semantics. Cambridge, MA: MIT Press, 2004; 2) Chomsky N. Rules and Representations, New York: Columbia University Press, 2005.


Реферирование: 1) Казенин К.И., Тестелец Я.Г. Исследование синтаксических ограничений в генеративной грамматике. // Фундаментальные направления современной американской лингвистики /А.А.Кибрик, И.М.Кобозева, И.А.Секерина. М: МГУ, 1997, С. 58-109; 2) А.В.Гладкий. Формальные грамматики и языки. М., Наука, 1973; 3) Язык и интеллект. Сб. Пер. с англ. и нем. Сост. и вступ.статья В.В.Петрова. М., Прогресс, 1996; 4) А.В.Гладкий, И.А. Мельчук. Элементы математической лингвистики. М., Наука. 1969; 5) Г.Е.Крейдлин, А.Д.Шмелев. Математика помогает лингвистике. Книга для учащихся. Серия «Мир Знаний». М., Просвещение, 1994; 6) Ковтунова И.И. Порядок слов в русском языке. М.: Наука, 1976.


Аннотированный обзор научной литературы по теме: 1) Лингвистический процессор для сложных информационных систем/ Ю.Д.Апресян, И.М.Богуславский, Л.Л.Иомдин и др. М., Наука, 1992; 2) Л.Л.Иомдин. Автоматическая обработка текста на естественном языке: модель согласования. М., Наука, 1990; 3) И.А.Мельчук. Русский язык в модели «Смысл – Текст». Москва-Вена: Языки славянской культуры, 1995; 4) О.С.Кулагина. Исследования по машинному переводу. М., Наука, 1979; 5) Ю.Д.Апресян, И.М.Богуславский, Л.Л.Йомдин, В.З.Санников. Теоретические проблемы русского синтаксиса. Взаимодействие грамматики и словаря.М., Языки славянских культур, 2010.


Подготовка докладов на предложенные темы на основе реферирования предложенных первоисточников: 1) Raskin, Victor, Hempelmann, Christian F., Taylor Julia M. Догадка или знание: два подхода к семантике при обработке естественного языка. // «Компьютерная лингвистика и интеллектуальные технологии». Выпуск 9 (16). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2010, 642- 650; 2) 3) Кобозева И.М., Марушкина А.С. Онтология силовых процессов. // «Компьютерная лингвистика и интеллектуальные технологии». Выпуск 9 (16). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2010, 192-199; 4) Лукашевич Н.В. Квазисинонимы в лингвистических онтологиях. // «Компьютерная лингвистика и интеллектуальные технологии». Выпуск 9 (16). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2010 , 137-312.

Реферирование первоисточников: 1) А.Н.Баранов. Введение в прикладную лингвистику. М.: УРСС, 2003; 2) Б.М.Лобанов, Л.И.Цирульник. Компьютерный синтез и клонирование речи. Минск.: Белорусская наука, 2008;3) Норберт Винер. Кибернетика, или управление и связь в животном и машине. 2-е изд., М., 1983; 4) Кибрик А.А., Добров Г.Б., Залманов Д.А.,Линник А.С., Лукашевич Н.В. Референциальный выбор как многофакторный вероятностный процесс. «Компьютерная лингвистика и интеллектуальные технологии». Выпуск 9 (16). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2010, 173-180.


Составление реферата и подготовка доклада по источникам: Кибрик А.А., Добров Г.Б., Залманов Д.А.,Линник А.С., Лукашевич Н.В. Референциальный выбор как многофакторный вероятностный процесс. «Компьютерная лингвистика и интеллектуальные технологии». Выпуск 9 (16). По материалам международной конференции «Диалог 2010». М., Изд-во РГГУ, 2010, 173-180.






6


8


10


12


10


5


3




Учебно-методические материалы по дисциплине

  1   2

Похожие:

Рабочая программа по дисциплине Компьютерные технологии в лингвистическом образовании iconРабочая учебная программа по дисциплине Информационные технологии управления
Материалы, устанавливающие содержание и порядок проведения сертификации иту
Рабочая программа по дисциплине Компьютерные технологии в лингвистическом образовании iconРабочая программа По предмету «Материальные технологии» 5-8 классы Учителя Лобковой Ирины Николаевны
Рабочая программа составлена на основе государственной программы по технологии для общеобразовательных школ «Программы. Технология....
Рабочая программа по дисциплине Компьютерные технологии в лингвистическом образовании iconРабочая программа по дисциплине документирование управленческой деятельности для студентов направления
Рабочая программа разработана в соответствии с учебным планом по направлению 080100 «Экономика», утвержденным 17. 06. 2008 г
Рабочая программа по дисциплине Компьютерные технологии в лингвистическом образовании iconРабочая программа по технологии 5-8 классы
Рабочая программа по направлению «Технология. Обслуживающий труд» разработана на основе федерального компонента государственного...
Рабочая программа по дисциплине Компьютерные технологии в лингвистическом образовании iconПрограмма вступительных испытаний для лиц, поступающих на направление подготовки
Педагогическое образование, магистерская программа Информационные технологии в образовании хгу им. Н. Ф. Катанова проходят в форме...
Рабочая программа по дисциплине Компьютерные технологии в лингвистическом образовании iconГоувпо «Самарский государственный архитектурно-строительный университет» Факультет информационных систем и технологий
Информационные технологии. Компьютерные технологии. Теория вычислительных машин и систем
Рабочая программа по дисциплине Компьютерные технологии в лингвистическом образовании iconРабочая программа По дисциплине

Рабочая программа по дисциплине Компьютерные технологии в лингвистическом образовании icon"Компьютерные технологии в библиотечном деле"

Рабочая программа по дисциплине Компьютерные технологии в лингвистическом образовании iconПрактикум по дисциплине Интернет-технологии для бизнеса
Кириченко А. А., Максимова Т. Ю., Бовт В. В. Практикум по дисциплине «Интернет-технологии для бизнеса» М. Московский государственный...
Рабочая программа по дисциплине Компьютерные технологии в лингвистическом образовании iconОргкомитет конференции
Интернет, новых методик преподавания и др., основой которых являются компьютерные технологии. Книга будет полезна педагогам, преподавателям...
Разместите кнопку на своём сайте:
Руководства



База данных защищена авторским правом ©do.znate.ru 2012
При копировании укажите ссылку
обратиться к администрации
Руководства
Главная страница