Соискателя на степень магистра филологии Коноваловой Александры Владимировны Научный канд филол наук, доц. Хохлова Мария Владимировна


Скачать 0.96 Mb.
Название Соискателя на степень магистра филологии Коноваловой Александры Владимировны Научный канд филол наук, доц. Хохлова Мария Владимировна
страница 1/17
Тип Выпускная квалификационная работа
  1   2   3   4   5   6   7   8   9   ...   17
Санкт-Петербургский государственный университет

Филологический факультет

Кафедра математической лингвистики

ИЗВЛЕЧЕНИЕ ТЕРМИНОВ АВТОМАТИЧЕСКИМИ МЕТОДАМИ
(НА МАТЕРИАЛЕ ФИНСКИХ ТЕКСТОВ)

Направление: «Лингвистика»
Образовательная программа: «Прикладная и экспериментальная лингвистика»
Профиль: «Компьютерная лингвистика и интеллектуальные технологии»

Выпускная квалификационная работа

соискателя на степень магистра

филологии

Коноваловой Александры Владимировны
Научный руководитель:

канд. филол. наук, доц. Хохлова Мария Владимировна

Санкт-Петербург

2016

Содержание






Введение


Основными функциями языка являются коммуникативная (язык предназначен для взаимодействия людей), когнитивная (язык служит для передачи смысла) и аккумулятивная (язык обеспечивает сохранение и передачу знаний) [Жеребило, 2010, с. 442].

Терминология как часть специальной лексики языка обеспечивает осуществление аккумулятивной функции языка, позволяя передавать информацию как о конкретных объектах физического мира, имеющих особое назначение и определенные свойства и качества, так и об абстрактных идеях или понятиях. Изучением терминологии занимается терминоведение, в рамках которой специальные единицы языка анализируются «с точки зрения их типологии, происхождения, формы, содержания (значения) и функционирования, а также использования, упорядочения и создания» [Гринев-Гриневич, 2008, с. 9].

В последнее время в терминоведении все большую актуальность приобретает задача автоматического извлечения терминов в связи с огромными и, более того, постоянно растущими объемами информации [Браславский, Соколов]. Автоматическое выделение терминов может использоваться для создания терминологических словарей различных тематик, а также при переводе [Герд, 2014, с. 4]. Это определяет практическую значимость нашей работы.

Поскольку к терминам, в отличие от остальной лексики, предъявляются определенные требования (в частности, к форме и к значению термина, о которых мы будем говорить далее), автоматизация для их извлечения может быть применима с бо́льшим успехом, чем к остальной лексике языка. Согласно А. С. Герду, особенности терминов позволяют «заранее задать определенную модель параметров описания семантики терминов данного типа» [Герд, 2014, с. 4].

Тема извлечения терминов из текстов разрабатывалась еще с 1990х годов. Начало изучения ознаменовалось появлением в 1990 году TERMINO первой широкой известной программы для извлечения терминов [Cabré, Estopà, Vivaldi, 2001, p. 2]. В дальнейшем исследователями применялись различные подходы, на их основе создавались алгоритмы, но и по сей день проблема автоматического извлечения терминов не потеряла своей актуальности.

Объектом нашего исследования являются термины финского языка (конкретнее экономическая терминология, встречающаяся в газетных статьях), а предметом автоматическое извлечение данных терминов из текстов. Целью нашего исследования является исследование терминов и терминологических словосочетаний в финском языке.

Для достижения данной цели нами были поставлены следующие задачи:

  1. теоретическое описание терминов в финском языке (на материале созданного нами корпуса и корпуса fiTenTen);

  2. изучение программного обеспечения для выделения терминов;

  3. описание моделей терминов в рамках грамматики SketchEngine;

  4. выявление выделенных терминов на основе разработанной грамматики из корпуса экономических текстов и последующий анализ результатов.

Мы использовали такие методы как корпусный анализ данных, статистические методы и подход с использованием правил (rule-based approach).

В качестве материала для нашего исследования были отобраны газетные статьи по тематике «Экономика». Объем корпуса составляет 50 тысяч токенов.

Для извлечения терминов нами была написана и протестирована грамматика SketchEngine.

В первой главе мы рассматриваем термин как лексическую единицу, его характеристики и особенности (в частности, морфологические особенности финского термина).

Во второй главе мы приводим краткий обзор существующих способов автоматического извлечения терминов. При рассмотрении программных средств мы ограничились только теми инструментами для выделения ключевых слов и терминов, которые позволяют выявлять именно термины как единицы специального языка.

В третьей главе мы описываем грамматику SketchEngine, с помощью которой нами проводилось извлечение терминов, и материал исследования, анализируем результаты исследования и ошибки, возникшие при автоматическом извлечении терминов.

  1   2   3   4   5   6   7   8   9   ...   17

Похожие:

Соискателя на степень магистра филологии Коноваловой Александры Владимировны Научный канд филол наук, доц. Хохлова Мария Владимировна icon Соискателя на степень магистра филологии Прохоровой Александры Алексеевны...
У таких инструментов есть ряд недостатков — ни одна из таких платформ, существующих в настоящее время, не является оптимальной с...
Соискателя на степень магистра филологии Коноваловой Александры Владимировны Научный канд филол наук, доц. Хохлова Мария Владимировна icon Секция "Перевод и межкультурная коммуникация"
Р е д а к ц и о н н а я к о л л е г и я: канд филол наук, доц. В. В. Сдобников (отв редактор), кнд филол наук, доц. Л. А. Аверкина,...
Соискателя на степень магистра филологии Коноваловой Александры Владимировны Научный канд филол наук, доц. Хохлова Мария Владимировна icon Соискателя на степень магистра филологии Крастынь Валерии Валерьевны...
Целью данного исследования является разработка системы для извлечения именованных сущностей из текстов микроблогов (Твиттер) на русском...
Соискателя на степень магистра филологии Коноваловой Александры Владимировны Научный канд филол наук, доц. Хохлова Мария Владимировна icon Составителя: Н. Н. Бровин, С. А. Куприна, В. О. Перминов, Э. А
Под редакцией канд филол иву* доц. В. О. Пернкнова Рецензент канд филол наук доц. В. В. Постникова
Соискателя на степень магистра филологии Коноваловой Александры Владимировны Научный канд филол наук, доц. Хохлова Мария Владимировна icon Программа государственной итоговой аттестации по направлению подготовки 38. 04. 02 “менеджмент”
Е. Г., д-р экон наук, доц. Максимов Ю. Н, канд экон наук, доц. Писаренков А. Г., канд экон наук, доц. Скосарев С. А., канд социол...
Соискателя на степень магистра филологии Коноваловой Александры Владимировны Научный канд филол наук, доц. Хохлова Мария Владимировна icon Российской Федерации Дальневосточный государственный университет...
Л. П. Бондаренко, канд филол наук, профессор; Л. Е. Корнилова, старший преподаватель; Н. С. Морева, канд филол наук, профессор, М....
Соискателя на степень магистра филологии Коноваловой Александры Владимировны Научный канд филол наук, доц. Хохлова Мария Владимировна icon Российской Федерации Дальневосточный государственный университет...
Л. П. Бондаренко, канд филол наук, профессор; Л. Е. Корнилова, старший преподаватель; Н. С. Морева, канд филол наук, профессор, М....
Соискателя на степень магистра филологии Коноваловой Александры Владимировны Научный канд филол наук, доц. Хохлова Мария Владимировна icon Ационного развития материалы VII международной научно-практической...
Российской Федерации, д-ра экон наук, проф. В. В. М а с л е н н и к о в а, канд психол наук, доц. В. О. М и д о в о й, д-ра экон...
Соискателя на степень магистра филологии Коноваловой Александры Владимировны Научный канд филол наук, доц. Хохлова Мария Владимировна icon Программа государственной итоговой аттестации по направлению подготовки...
Гребенюк А. А, д-р экон наук, проф. Ионцев В. А., канд социол наук Корнеева И. И., канд филос наук, доц. Масленников Е. В., д р филос...
Соискателя на степень магистра филологии Коноваловой Александры Владимировны Научный канд филол наук, доц. Хохлова Мария Владимировна icon Лексикология английского языка
Рецензенты: кафедра английской филологии №1 Санкт-Петербургского университета; канд филол наук доцент кафедры английской филологии...
Соискателя на степень магистра филологии Коноваловой Александры Владимировны Научный канд филол наук, доц. Хохлова Мария Владимировна icon Рабочая программа по дисциплине «Учебно-исследовательская работа...
Составители: канд филол наук, доцент Ю. В. Явинская, канд филол наук, доцент А. Г. Милюкова
Соискателя на степень магистра филологии Коноваловой Александры Владимировны Научный канд филол наук, доц. Хохлова Мария Владимировна icon Магистра филологии Егора Андреевича Инокова Научный к ф. н., ст преп....
Способы выражения просьбы в польском и немецком языках (в сопоставлении с русским)
Соискателя на степень магистра филологии Коноваловой Александры Владимировны Научный канд филол наук, доц. Хохлова Мария Владимировна icon Английский для подготовки к военной олимпиаде Учебное пособие Краснодар
И. Н. Сухомлина – доцент кафедры английской филологии, канд филол наук (Кубанский государственный университет)
Соискателя на степень магистра филологии Коноваловой Александры Владимировны Научный канд филол наук, доц. Хохлова Мария Владимировна icon Р. М. Базылева, канд филол наук, Н. И. Иголкина (отв секретарь),...
Лингвометодические проблемы преподавания иностранных языков в высшей школе: Межвуз сб науч тр. / Под ред. Л. И. Сокиркиной. – Саратов:...
Соискателя на степень магистра филологии Коноваловой Александры Владимировны Научный канд филол наук, доц. Хохлова Мария Владимировна icon На соискание степени бакалавра филологии Научный к ф. н., доц. Сытнов...
I. Терминосистема: формирование, особенности, классификация
Соискателя на степень магистра филологии Коноваловой Александры Владимировны Научный канд филол наук, доц. Хохлова Мария Владимировна icon Программа «количественного смягчения»
Научный редактор И. В. Колесова, канд экон наук, доц. Севастопольский национальный технический университет

Руководство, инструкция по применению




При копировании материала укажите ссылку © 2024
контакты
rykovodstvo.ru
Поиск