Тезаурусы в задачах информационного поиска


Скачать 6.4 Mb.
Название Тезаурусы в задачах информационного поиска
страница 9/45
Тип Задача
rykovodstvo.ru > Руководство эксплуатация > Задача
1   ...   5   6   7   8   9   10   11   12   ...   45

1.4. Конкретные тезаурусы


Рассмотрим принципы устройства и функционирования некоторых известных информационно-поисковых тезаурусов. Специфика предметной области каждого тезауруса находит отражение в его структуре.

1.4.1 Тезаурус Европейского союза EUROVOC


Многоязычный тезаурус EuroVoc разработан специально для содержательной обработки и поиска документов по всем направлениям деятельности институтов ЕС. Последнее третье издание тезауруса на девяти языках было опубликовано в 1995 году. Тезаурус составлен в соответствии с международными стандартами ИСО 2788-1986 и ИСО 5964-1985 и имеет стандартную структуру информационно-поискового тезауруса, предназначенного для ручного индексирования:

  • термины тезауруса разделены на дескрипторы, которые используются для индексирования документов и аскрипторы (условные синонимы), которые входят в классы условной эквивалентности дескрипторов;

  • установлены иерархические отношения между дескрипторами (объединяют отношения «род-вид» и «часть целое»);

  • установлены ассоциативные отношения между дескрипторами;

  • дескрипторы объединены в более широкие тематические классы, называемые микротезаурусами.

В 2001 году Парламентская библиотека Российской Федерации подготовила русскую версию тезауруса EuroVoc, которая содержит переводы всех дескрипторов тезауруса EuroVoc, а также более 5 тысяч понятий, отражающих российскую специфику (EUROVOC, 2001).

1.4.2. Тезаурус исследовательской службы Конгресса США


Тезаурус Legislative Indexing Vocabulary (далее тезаурус LIV) используется для индексирования и поиска законов, законопроектов, политической литературы в исследовательской службе Конгресса США (LIV, 1994).

Разработка тезауруса была начата в 1967 году. Последняя версия тезауруса LIV была подготовлена в 1995 году и включает более 10 тысяч терминов, среди которых около 5 тысяч дескрипторов.

Тезаурус включает термины из широкой области общественной жизни, включая как социальные науки, так и социальные аспекты естественных и прикладных наук. Большое количество предметных областей исследований, проводимых Исследовательской службой, отражаются в смешении в тезаурусе разных типов терминологии - более общей и более конкретной, широко употребляемой и относящейся к более узким предметным областям.

Дескрипторы тезауруса разбиты на 80 тематических областей, называемых top terms (термины верхнего уровня).

1.4.3. Тезаурус ООН UNBIS


Многоязычный Тезаурус UNBIS (UNBIS, 1976), созданный Библиотекой им. Дага Хаммаршельда Департамента общественной информации, содержит терминологию, используемую в качестве дескрипторов при анализе документов и других материалов, относящихся к программам и деятельности ООН. Он используется в качестве списка предметных рубрик Библиографическо-информационной системы ООН (ЮНБИС) и включен в список тематических терминов Системы официальной документации. Будучи многоотраслевым, тезаурус отражает широкий круг вопросов, которыми занимается ООН; термины тезауруса предназначены для их точного и четкого обозначения с учетом специфики предмета.

В настоящее время тезаурус существует на всех официальных языках Организации Объединенных Наций: арабском, китайском, английском, французском, русском и испанском.

1.4.4. Тезаурус по архитектуре и искусству
(Art and Architecture Thesaurus)


Тезаурус по искусству и архитектуре (Тезаурус AAT) создается фондом Пола Гетти (www.getty.edu), содержит 34 тысячи понятий (дескрипторов) и 131 тысячу терминов по искусству, архитектуре, архивным материалам и материальной культуре от античности до наших дней.

Дескрипторы тезауруса подразделяются на 7 фасетов: ассоциированные понятия, физические свойства, стили и периоды, АГЕНТЫ (люди и организации), ДЕЯТЕЛЬНОСТЬ,МАТЕРИАЛЫ, ОБЪЕКТЫ (Art and Architecture Thesaurus, 1994).

Каждый фасет подразделяется на иерархии. Всего насчитывается 33 иерархии.

Таким образом, тезаурус AAT отличается, с одной стороны, значительно большей величиной, с другой стороны, более строгой организацией в иерархии. Количество уровней в иерархиях также значительно больше, чем в ранее упомянутых тезаурусах. На наш взгляд, это объясняется тем, что основным назначением тезауруса является индексирование не только документов по культуре и искусству, но и собственно музейных объектов, что требует большого количества конкретных сущностей. При этом такая направленность тезауруса носит более структурированный характер, чем широкие области ранее упомянутых тезаурусов.

Каждому дескриптору может соответствовать несколько терминов (аскрипторов), которые включают термины в различных грамматических числах, термины в инвертированном порядке, варианты написания термина, а также синонимы различного происхождения. Наличие большого количества морфологических форм терминов не менее, чем в два раза завышает число терминов, описанных в тезаурусе.

Дескрипторы тезауруса снабжены стандартными для тезаурусов отношениями ВЫШЕ-НИЖЕ и АССОЦИАЦИЯ.

Основное внимание разработчики уделили установлению для каждого дескриптора отношения ВЫШЕ. Для некоторых дескрипторов описаны два отношения ВЫШЕ, одно из которых считается основным, другое вспомогательным.

При описании отношений НИЖЕ, если имеется несколько оснований классификации, то под каждое основание классификации заводится отдельный дескриптор. Например, =вместилища= делятся по форме (=мешки=, =бочки=, =ящики= и т.п.), =вместилища по функции= (=вместилища для церемоний=, =вместилища. для денег=, =вместилища для тканей= и т.п.), =вместилища по расположению= (=седельные сумки=, =настенные сумки= и др.). Отношения АССОЦИАЦИЯ занимают относительно небольшой процент всего набора отношений тезауруса AAT.

Авторы тезауруса считают, что наиболее полное покрытие тезаурус обеспечивает для искусства Западной Европы и Америки.
Пример словарной статьи:

athletic shoes (спортивные ботинки)
Note: Shoes designed to be worn for sports (ботинки, предназначенные для спорта)
Terms:
athletic shoes
athletic shoe
trainers (athletic shoes)
trainer
shoes, athletic
shoes, sport
shoes, training
sport shoes
training shoes


Hierarchical position (позиция в иерархии):

, (ботинки по функции)

shoes (footwear), (ботинки)

, (обувь по форме)

, (аксессуары, носимые на ногах)

, (носимые аксессуары костюма)

, (аксессуары костюма)

costume, (костюм)

Furnishings and equipment,

Objects facet.

В последнее время разработчики тезауруса вместо обобщенного отношения ассоциации стали использовать конкретные виды семантических отношений, например, понятие embroidery (visual works) (вышивка (продукт труда)) связано с понятием embroidering (вышивание) отношением «activity/event producing is»:
embroidery (visual works)

activity/event producing is embroidering
Всего предлагается использовать около 40 различных семантических подвидов отношения ассоциации.
1   ...   5   6   7   8   9   10   11   12   ...   45

Похожие:

Тезаурусы в задачах информационного поиска icon Тезаурусы в задачах информационного поиска
Правила индексирования документов дескрипторами информационно-поискового тезауруса 39
Тезаурусы в задачах информационного поиска icon Тезисы представленные на
Внимание! Для поиска своей фамилии или ключевого слова в тексте нажмите Ctrl+F и введите искомое слово в окно поиска!!
Тезаурусы в задачах информационного поиска icon Инструкция по заполнению документов на регистрацию информационного ресурса
Настоящая инструкция определяет порядок заполнения и представления документов для регистрации информационного ресурса в Реестре государственных...
Тезаурусы в задачах информационного поиска icon Лекция №11
В этом разделе будет приведен обзор одних из первых систем поиска информации, насчитывающих к настоящему моменту времени многолетнюю...
Тезаурусы в задачах информационного поиска icon Конспект лекций по дисциплине «Информационные системы и технологии в науке и образовании»
Введение. Содержание дисциплины и порядок ее изучения. Фактографический поиск. Математические модели фактографического поиска. Информационная...
Тезаурусы в задачах информационного поиска icon Инструкция по сверке Планов финансово-хозяйственной деятельности
В параметрах поиска в строке Наименование учреждения вводим инн, либо название учреждения. Нажать кнопку Найти. Внизу экрана загрузится...
Тезаурусы в задачах информационного поиска icon Алгоритмы поиска. Линейный поиск. Двоичный поиск
Также, линейный поиск часто используется в виде линейных алгоритмов поиска максимума/минимума
Тезаурусы в задачах информационного поиска icon Рабочая инструкция по настройке представлений в hp sm
Удалены не используемые номера рисунков. Добавлено описание создания представления из Поиска и описание требований для удаления Представления....
Тезаурусы в задачах информационного поиска icon Задачах на 2014 год Итоги работы Отдела социальной защиты населения г. Рошаль
Отдела социальной защиты населения г. Рошаль Министерства социальной защиты населения Московской области и подведомственных учреждений...
Тезаурусы в задачах информационного поиска icon Общая характеристика информационного ресурса
Целью оказания услуг является формирование и сопровождение картографического информационного ресурса «Шельфовые проекты» (далее ир...
Тезаурусы в задачах информационного поиска icon Отчёт о результатах деятельности отдела загс администрации Лужского...
Во исполнение поручения главы администрации Лужского муниципального района Малащенко Олега Михайловича предоставляем отчет о результатах...
Тезаурусы в задачах информационного поиска icon Инструкция по поиску и спасанию в зоне авиационно-космического поиска...
Организация поисково-спасательного обеспечения полетов в Южной зоне авиационно-космического поиска и спасания (акпс)
Тезаурусы в задачах информационного поиска icon Универсальный телевизионный пульт дистанционного управления
«умного» поиска и сохранения канала, что избавляет вас от необходимости поиска и сохранения каналов вручную. Своевременная замена...
Тезаурусы в задачах информационного поиска icon Инструкция по работе с программным комплексом единого информационного ресурса
При входе в программный комплекс единого информационного ресурса (далее – пк еир) пользователю необходимо пройти авторизацию в меню,...
Тезаурусы в задачах информационного поиска icon Регламент информационного взаимодействия
Настоящий Регламент информационного взаимодействия (далее Регламент) разработан в целях реализации требований следующих документов:...
Тезаурусы в задачах информационного поиска icon Приказ от 3 июня 2014 г. N 148 об утверждении требований к подготовке...
Федеральных авиационных правил поиска и спасания в Российской Федерации, утвержденных постановлением Правительства Российской Федерации...

Руководство, инструкция по применению




При копировании материала укажите ссылку © 2024
контакты
rykovodstvo.ru
Поиск