Разработка алгоритмических и программных средств для реализации стратегий дсм-метода автоматического порождения гипотез


Скачать 357 Kb.
Название Разработка алгоритмических и программных средств для реализации стратегий дсм-метода автоматического порождения гипотез
страница 1/3
Тип Автореферат
rykovodstvo.ru > Руководство эксплуатация > Автореферат
  1   2   3
На правах рукописи

Волкова Анна Юрьевна


РАЗРАБОТКА АЛГОРИТМИЧЕСКИХ И ПРОГРАММНЫХ СРЕДСТВ ДЛЯ РЕАЛИЗАЦИИ СТРАТЕГИЙ ДСМ-МЕТОДА АВТОМАТИЧЕСКОГО ПОРОЖДЕНИЯ ГИПОТЕЗ

05.13.17 – Теоретические основы информатики

Автореферат диссертации на соискание ученой степени

кандидата технических наук


Москва - 2014

Работа выполнена в Федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Российский государственный гуманитарный университет» (РГГУ).

Научный руководитель

доктор технических наук, профессор

Финн Виктор Константинович

Официальные оппоненты
Вагин Вадим Николаевич

доктор технических наук, профессор, Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования «Национальный исследовательский университет «МЭИ», Институт автоматики и вычислительной техники, кафедра прикладной математики, профессор
Забежайло Михаил Иванович

кандидат физико-математических наук, Центр прикладных исследований компьютерных сетей «Сколково», управляющий директор
Ведущая организация

Федеральное государственное бюджетное учреждение науки Институт Системного Анализа Российской Академии Наук (ИСА РАН)

Защита состоится «26» июня 2014 г. в ___ часов на заседании на заседании диссертационного совета Д. 212.198.13 созданного на базе РГГУ, по адресу: 125993, Москва ГСП-3, Миусская площадь, д. 6, ауд. ___.

С диссертацией можно ознакомиться в библиотеке РГГУ по адресу: 125993, Москва, ГСП-3, Миусская площадь, дом 6, и на официальном сайте организации по адресу: http://dissovet.rggu.ru/section.html?id=11325.

Автореферат разослан «21» мая 2014 года.

Ученый секретарь диссертационного совета

кандидат технических наук Халяпин Дмитрий Борисович

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Важную роль в развитии направления исследований «искусственный интеллект» играет интеллектуальный анализ данных (ИАД). Под ИАД мы понимаем извлечение нового знания на основе анализа данных посредством интеллектуальной системы (ИС).

Компьютерные интеллектуальные системы типа ДСМ (ДСМ-системы) являются примером ИС, которые реализуют ИАД средствами правдоподобных ДСМ-рассуждений типа «индукция + аналогия + абдукция» (с возможным применением дедукции). ДСМ-рассуждения можно эффективно использовать для имитации естественного познавательного цикла «анализ данных – порождение гипотез (предсказание) – объяснение». ДСМ-рассуждения реализуются в ИС и являются эффективным средством машинного (индуктивного) обучения для извлечения нового знания из баз фактов.

ДСМ-метод автоматического порождения гипотез (АПГ) является формализованной эвристикой, которая позволяет создавать компьютерные системы, решающие определенный круг задач для различных предметных областей. ДСМ-системы успешно применялись к таким предметным областям, как фармакология, медицинская и техническая диагностика, социология, криминалистика, робототехника.

Актуальность диссертационного исследования обусловлена необходимостью создания Решателя задач, применимого к сериям компьютерных ИС для различных предметных областей и обладающего эффективными средствами для извлечения знаний из баз фактов.

Предметом исследования диссертации являются методы анализа данных посредством правдоподобных рассуждений типа ДСМ и их применимость для задач фармакологии, медицинской диагностики и социологии.

Цель диссертационной работы – создание Решателя задач и компьютерной интеллектуальной системы, реализующих ДСМ-метод АПГ для различных предметных областей в науках о жизни и социальном поведении, а также обоснование того факта, что разработанная ИС может эффективно применяться в конкретной предметной области – социологии. В связи с этим необходимо было разработать не зависящие от предметной области алгоритмы и программы, реализующие ДСМ-рассуждения; создать компьютерную ДСМ-систему, допускающую широкий выбор возможных ДСМ-стратегий; провести эксперименты (с использованием реализованных программных средств) на данных различных предметных областей и сравнить полученные результаты; создать спецификацию ИС для качественного (нестатистического) анализа социологических данных.

Для достижения указанной цели были поставлены и решены следующие задачи:

  • разработана ДСМ-система с гибкой архитектурой, допускающей расширение ее функциональных возможностей, для анализа данных различных предметных областей;

  • реализованы различные версии ДСМ-метода АПГ (прямой / обратный ДСМ-метод, ситуационное расширение ДСМ-метода);

  • создана программная реализация различных методов ДСМ-рассуждений (в том числе четырех индуктивных методов Д.С. Милля [1]);

  • созданы различные дополнительные процедуры ДСМ-рассуждений (например, реализация фильтров для гипотез (специальные ограничения на структуру гипотез, требующие присутствие определенных признаков в «теле» гипотезы), процедура «доопределение по одному» (процедура, позволяющая охарактеризовать исходную базу фактов относительно выбранной стратегии), построение дерева гипотез, вычисление непротиворечивости массивов гипотез);

  • реализованы структуры данных для различных предметных областей и разработаны представления и форматы данных, обрабатываемых ДСМ-системой, для фармакологии, медицинской диагностики и социологии;

  • разработан базовый графический интерфейс пользователя для универсального ДСМ-Решателя с целью проведения экспериментов с данными указанных выше областей;

  • проведено сравнение результатов экспериментов, полученных разными стратегиями на фармакологических и медицинских данных;

  • создана независимая ДСМ-система JSM-Socio для качественного анализа социологических данных с удобным графическим интерфейсом и проведена апробация системы на практическом материале.



Для решения указанных задач использовались следующие методы: многозначная логика с целью представления знаний и формализации рассуждений, алгоритмы порождения сходств, технологии создания баз данных.

Информационной базой исследования стали многочисленные публикации по ДСМ-методу АПГ, приведенные в списке используемой литературы, а также знания, полученные в процессе тесного взаимодействия с экспертами в данной области.

Основные научные результаты, полученные в ходе исследования:

  • Созданы новые средства представления данных и знаний в ИС для наук о жизни и социальном поведении.

  • Разработаны алгоритмические и программные средства, реализующие правдоподобные ДСМ-рассуждения, которые осуществляют взаимодействие индукции, аналогии и абдукции, что соответствует анализу данных, предсказанию и объяснению полученных результатов ДСМ-метода АПГ.

  • Установлено, что разработанные алгоритмические и программные средства ИС применимы для различных предметных областей: фармакологии, медицины и социологии.

  • Разработан Решатель задач, содержащий новые методы машинного обучения: индуктивные методы различия, сходства-различия и остатков. Алгоритмическая и программная реализация этих методов осуществлена впервые.

  • Созданы программы для распознавания противоречивости (непротиворечивости) множеств порожденных гипотез для различных стратегий ДСМ-рассуждений и для последовательностей расширений баз фактов.

  • Осуществлено сравнение результатов различных индуктивных процедур ДСМ-рассуждений на примере анализа фармакологических и медицинских данных.

  • Впервые создана компьютерная ИС для качественного (нестатистического) анализа социологических данных (JSM-Socio), содержащая развитые средства представления данных (описание субъекта, его мнения, ситуации и эффекта поведения). Система имеет Решатель задач с новыми средствами анализа данных и машинного обучения.


Первая ДСМ-система для анализа данных медицинской диагностики была создана в ВИНИТИ РАН. ДСМ-метод применялся для прогнозирования и диагностики различных заболеваний. На текущий момент в ВИНИТИ РАН действующие системы для анализа медицинских данных программно реализованы Д.А. Добрыниным и О.П. Шестерниковой. Действующая система для анализа фармакологических данных программно реализована Д.А. Добрыниным. ДСМ-Решатель этих систем поддерживает прямой атомарный ДСМ-метод АПГ, включающий процедуры простого метода сходства и запрета на контрпримеры. Первая ДСМ-система для анализа социологических данных была разработана М.А. Михеенковой, а ее первое программное обеспечение было реализовано С.С. Московским. Позже разработкой программных средств в этой области занимались Д.В. Панкратов, Ж.И. Бурковская, Т.Л. Феофанова.

Научная новизна диссертационного исследования работы включает следующее:

  • Разработанный ДСМ-Решатель отличается от созданных ранее набором новых стратегий рассуждений и параметров для проведения экспериментов. Обычно все ДСМ-системы включали стандартные стратегии (простой метод сходства, запрет на контрпримеры, единственность причины/ следствия). Впервые была создана система, в которой реализовано сразу четыре индуктивных метода Д.С. Милля: простой метод сходства, метод различия, метод сходства-различия, метод остатков. Архитектура системы позволяет применять ее к различным предметным областям: фармакологии, медицинской диагностике и социологии. Исследователь может использовать различные стратегии и сравнивать полученные результаты. Созданный ДСМ-Решатель на текущий момент предоставляет наиболее богатый инструментарий для анализа данных посредством ДСМ-рассуждений и является новым средством машинного обучения.

  • Было экспериментально установлено, что миллевский метод различия непригоден для анализа данных: на медицинских данных не удалось получить ни одной гипотезы, на фармакологических данных были порождены гипотезы, которые характеризуют небольшое количество примеров, а значит, не поддаются интерпретации относительно всего массива. Метод различия Д.С. Милля не позволяет найти причинно-следственные зависимости, так как нарушает основной принцип индукции – «сходство фактов влечет наличие (отсутствие) эффекта и его повторяемость».

  • В результате анализа данных фармакологии и медицинской диагностики была определена наилучшая стратегия относительно рассмотренных массивов данных. Ею был признан упрощенный метод соединенного сходства-различия (метод различия) с запретом на контрпримеры в качестве (+)-предиката и простой метод сходства с запретом на контрпримеры в качестве (–)-предиката.

  • Использование упрощения метода сходства-различия (метода различия для ДСМ-рассуждений) и процедуры упрощения метода остатков в медицине подтвердило причинно-следственную связь между протеином S100 и продолжительностью жизни больных меланомой, впервые выявленную в ИС, применяемой в Российском Онкологическом Научном Центре РАМН имени Н.Н. Блохина.

  • Впервые было разработано представление медицинских данных, позволяющее применять неатомарный ДСМ-метод (исследуемый эффект может состоять из множества свойств).

  • Впервые были реализованы средства для распознавания непротиворечивости множеств порожденных гипотез.

  • Было разработано представление социологических данных, допускающее разбиение характеристик респондента на четыре компоненты (описание респондента, мнение по заданным вопросам, ситуация (контекст, внешние обстоятельства), исследуемый эффект(ы)) и удовлетворяющее условиям применимости ДСМ-метода. Представление используется для нестатистического анализа – для выявления детерминант поведения и мнений, а также для исходных массивов данных небольших размеров, что исключает возможность использования статистических средств.

  • Как было отмечено, впервые создан Решатель задач, реализующий ДСМ-рассуждения, которые используют четыре метода индукции: сходства, различия, сходства-различия, остатков с возможностью добавления условий запрета на контрпримеры и единственности причины/следствия (ранее методы различия, сходства-различия и остатков не были реализованы посредством программ). Этот Решатель задач является главным модулем впервые созданной компьютерной интеллектуальной системы типа ДСМ JSM-Socio для качественного анализа социологических данных. JSM-Socio позволяет использовать упомянутые методы, а также разработанное многокомпонентное представление знаний о субъекте поведения, включающее описание субъекта (социальный характер субъекта, индивидуальные черты личности биографические данные), его мнение (о ситуации, о возможном поведении), ситуацию (контекст поведения) и эффект поведения (действие или установка к действию). ИС JSM-Socio является эффективным практическим инструментом для социологических исследований. Она обладает важными функциональными возможностями, обеспечивающими комфортную работу для социолога-исследователя. Среди них следует отметить следующее: автоматический перевод файлов с данными из формата программы SPSS в формат, используемый системой (MS Excel); разделение вопросов анкеты на компоненты; автоматическое разделение респондентов на группы в соответствии с эффектом, выделенным для исследования; применение различных стратегий (прямой/ обратный, ситуационный ДСМ-метод); графический интерфейс, разработанный с учетом требований эксперта. С помощью JSM-Socio были исследованы данные с многокомпонентной структурой, сформированные на материале анкет работников промышленных предприятий, а также проведены эксперименты для сравнения стран по уровню одобрения населением протестного поведения.

Полученные результаты и программные средства могут служить базой для дальнейших научных исследований. Архитектура системы допускает расширение существующих модулей и добавление новых классов, а значит возможно ее применение и в других предметных областях.

Практическая значимость диссертационного исследования состоит в следующем:

  • Создана компьютерная интеллектуальная система типа ДСМ, которая позволяет исследователю проводить анализ данных различных предметных областей (фармакология, медицинская диагностика, социология) с помощью различных стратегий.

  • В разработанном Решателе реализованы методы ДСМ-рассуждений, в том числе методы, отсутствующие в других системах: метод различия, метод сходства-различия, метод остатков [1]. В системе доступны прямой и обратный тип ДСМ-рассуждений, а для анализа социологических данных реализовано ситуационное расширение ДСМ-метода.

  • Разработанные средства позволили сравнить новые стратегии на разных предметных областях. Кроме того, при исследовании медицинских данных посредством новых методов удалось подтвердить связь между протеином S100 и продолжительностью жизни больных меланомой.

  • Создана специализация разработанной ИС-ДСМ в виде отдельной компьютерной ДСМ-системы для качественного анализа социологических данных, которая обладает развитым предметно-ориентированным интерфейсом и используется экспертами для решения практических социологических задач.

Изучение данных с использованием различных стратегий может не только упростить процесс оценки экспертом полученных результатов ДСМ-системы (так как позволяет сократить количество найденных причинно-следственных зависимостей, выделив наиболее существенные), но и выявить зависимости, которые не могут быть получены с помощью базовых стратегий (эту возможность предоставляет метод остатков).

Апробация результатов диссертации. Основные положения диссертационной работы были изложены на российско-британской конференции “J. S. Mill's ideas on Induction and Logic of the Humanities in Cognitive Research and Artificial Intelligence Systems” (15 – 17 июля 2011 г., РГГУ). Во время выступления была представлена презентация «Интеллектуальная система, реализующая четыре индуктивных метода Д.С. Милля» и продемонстрирована ДСМ-система для анализа разных предметных областей: фармакологии и медицинской диагностики. Результаты, полученные в ходе работы с социологическими данными, были представлены на межвузовской конференции «20 лет научных исследований и образовательных программ отделения интеллектуальных систем в гуманитарной сфере» (14 декабря 2012 г., РГГУ). В рамках выступления «Интеллектуальные системы типа ДСМ и их приложения» было продемонстрировано приложение-интерфейс, созданное для просмотра социологических данных, обработанных с использованием реализованной ДСМ-системы.

Итогом работы над социологическими данными стала компьютерная интеллектуальная система для качественного анализа социологических данных (JSM-Socio), реализующая стратегии ДСМ-метода АПГ. Система была официально зарегистрирована Федеральной службой по интеллектуальной собственности (РОСПАТЕНТ) и внесена в Реестр программ для ЭВМ (№ 2013614978, от 24 мая 2013 года).

Система JSM-Socio была представлена на XVI-м Междисциплинарном ежегодном научном семинаре «Математическое моделирование и информатика социальных процессов» им. Героя Социалистического труда академика А.А. Самарского (21 ноября 2013 г., МГУ им. М.В.Ломоносова, факультет ВМиК) в рамках доклада «О подходах к формализации качественного анализа социологических данных». Кроме того, система была продемонстрирована на семинаре «Принципы, логические средства и опыт применения в социологии ДСМ-метода автоматического порождения гипотез» (6 декабря 2013 г., Институт социологии РАН, Центр теоретических и историко-социологических исследований).

Интеллектуальная система JSM-Socio используется в Институте социологии РАН для решения задач формализованного качественного анализа социологических данных: выявления детерминаций социального поведения и мнений, учёта влияния ситуационных параметров на социальное поведение, прогнозирования социального поведения и общественного мнения.
  1   2   3

Похожие:

Разработка алгоритмических и программных средств для реализации стратегий дсм-метода автоматического порождения гипотез icon Разработка алгоритмических и программных средств для реализации стратегий...

Разработка алгоритмических и программных средств для реализации стратегий дсм-метода автоматического порождения гипотез icon «Разработка и стандартизация программных средств и информационных технологий»
Целью подготовки студентов по дисциплине является формирование целостной системы знаний о принципах, моделях и методах, используемых...
Разработка алгоритмических и программных средств для реализации стратегий дсм-метода автоматического порождения гипотез icon Дипломному проекту На тему: Разработка технических и программных...
Разработка технических и программных средств системы предсказания прорывов корочки сляба
Разработка алгоритмических и программных средств для реализации стратегий дсм-метода автоматического порождения гипотез icon 1. Методология, метод, техника и процедура как понятия социологического исследования
«Метода», тем не менее стремились разработать все более точные и надежные методы опытной проверки теоретических гипотез, а также...
Разработка алгоритмических и программных средств для реализации стратегий дсм-метода автоматического порождения гипотез icon Научно-исследовательский институт ядерной физики имени Д. В. Скобельцына...
«Разработка архитектуры и программных средств для обеспечения взаимодействия грид-инфраструктуры рдиг/egee и создаваемой системы...
Разработка алгоритмических и программных средств для реализации стратегий дсм-метода автоматического порождения гипотез icon Учебно-методический комплекс дисциплины «разработка и стандартизация...
Рабочая программа составлена на основании типовой программы гос впо и авторских разработок. Номер государственной регистрации 774...
Разработка алгоритмических и программных средств для реализации стратегий дсм-метода автоматического порождения гипотез icon Конспект лекций составлен в соответствии с рабочей программой по...
Целью данного конспекта является изучение технических и программных средств реализации информационных процессов, позволяющих автоматизировать...
Разработка алгоритмических и программных средств для реализации стратегий дсм-метода автоматического порождения гипотез icon В первой главе проведен анализ предметной области, рассмотрены аналоги...
В данной работе представлена разработка программных средств системы мониторинга автоматов продажи проездных билетов, а точнее приложение...
Разработка алгоритмических и программных средств для реализации стратегий дсм-метода автоматического порождения гипотез icon Комплектующих технических (аппаратных и программных) средств системы...
Комплектующих технических (аппаратных и программных) средств системы учета и контроля
Разработка алгоритмических и программных средств для реализации стратегий дсм-метода автоматического порождения гипотез icon Конспект лекций междисциплинарного курса мдк 01. 02 Прикладное программирование
ПМ. 01 Разработка программных модулей программного обеспечения для компьютерных систем
Разработка алгоритмических и программных средств для реализации стратегий дсм-метода автоматического порождения гипотез icon Гнц РФ ао «Концерн «цнии «Электроприбор», с-петербург Разработка цифровой части asic
Разработка цифровой части asic с использованием программных продуктов компании Cadence
Разработка алгоритмических и программных средств для реализации стратегий дсм-метода автоматического порождения гипотез icon Фгбоу впо «ульяновский государственный педгогический университет им. И. Н. Ульянова»
Разработка и применение средств реализации межпредметных связей в процессе теоретического обучения
Разработка алгоритмических и программных средств для реализации стратегий дсм-метода автоматического порождения гипотез icon Российской Федерации Федеральное государственное бюджетное образовательное...
ПМ. 01 Разработка программных модулей программного обеспечения для компьютерных систем
Разработка алгоритмических и программных средств для реализации стратегий дсм-метода автоматического порождения гипотез icon Методические рекомендации по выполнению внеаудиторной самостоятельной...
ПМ. 01 Разработка программных модулей программного обеспечения для компьютерных систем
Разработка алгоритмических и программных средств для реализации стратегий дсм-метода автоматического порождения гипотез icon Методические рекомендации по выполнению внеаудиторной самостоятельной...
ПМ. 01 Разработка программных модулей программного обеспечения для компьютерных систем
Разработка алгоритмических и программных средств для реализации стратегий дсм-метода автоматического порождения гипотез icon Комплекс программных средств
«Портал взаимодействия государственных контрольных органов и заинтересованных лиц в процессе оформления товаров и транспортных средств...

Руководство, инструкция по применению




При копировании материала укажите ссылку © 2024
контакты
rykovodstvo.ru
Поиск