Лекция №5. Модели представления знаний. Семантическая модель.
В связи
с организацией базы знаний в информационной системе, возникли задачи по поиску
оптимального и верного решения на поставленную задачу перед информационной
системой. Таким образом,
неструктурированную массу знаний нужно было представить в такой форме, которая
позволяла бы найти оптимальное решение с наименьшими затратами, например,
временными. И начиная со второй
половины 20-ого века в области искусственного интеллекта стали появляться
различные методы представления знаний.
Представление -- это
действие, делающее некоторое понятие воспринимаемым посредством фигуры, записи,
языка или формализма.
Представление знаний
--
формализация истинных убеждений посредством фигур, записей или языков.
Нас
особенно интересуют формализации, воспринимаемые (распознаваемые) ЭВМ.
Представлению знаний присущ пассивный аспект: книга, таблица, заполненная
информацией память. В ИИ подчеркивается активный аспект представления:
знать должно стать активной операцией, позволяющей не только запоминать, но и
извлекать воспринятые (приобретенные, усвоенные) знания для рассуждений на их
основе.
Выбор модели представления знания
Часто
сводят к обсуждению баланса между декларативным (ДП) и процедурным
представлением (ПП). Различие между ДП и ПП можно выразить различием
между вопросами «знать, что?» и «знать, как?».
Процедурное представление основано
на предпосылке, что интеллектуальная деятельность есть знание проблемной среды,
вложенное в программы, то есть знание о том, как можно использовать те или иные
сущности.
Декларативное представление основано
на предпосылке, что знание неких сущностей «знать, что?» не имеет глубоких
связей с процедурами, используемыми для обработки этих сущностей. При
использовании ДП считается, что интеллектуальность базируется на некотором
универсальном множестве процедур, обрабатывающих факты любого типа, и на
множестве специфических фактов, описывающих частную область знаний.
Основное достоинство ДП по сравнению с ПП
заключается в том, что в ДП нет необходимости указывать способ использования
конкретных фрагментов знания. Простые утверждения могут использоваться
несколькими способами, и может оказаться неудобным фиксировать эти способы
заранее. Указанное свойство обеспечивает гибкость и экономичность ДП, так как
позволяет по-разному использовать одни и те же факты. В ДП знание
рассматривается как множество незави-симых или слабо зависимых фактов, что
позволяет осуществлять модификацию знаний и обучение простым добавлением или
устранением утверждений. Для ПП проблема модификации значительно сложнее, так
как здесь необходимо учитывать, каким образом используется данное утверждение.
Модели представления знаний обычно делят на логические (формальные) и
эвристические (формализованные) модели. В логических моделях, как
правило, используется исчисление предикатов первого порядка (то, что в суждении
высказывается о предмете суждения), дополненное рядом эвристических стратегий.
В логических моделях представления знаний
отношения, существующие между отдельными единицами знаний, выражаются только с
помощью синтаксических правил используемой формальной системы.
В
отличие от формальных моделей эвристические модели имеют
разнообразный набор средств, передающих специфические особенности той или иной
проблемной области. Именно поэтому эвристические модели превосходят логические
как по возможности адекватно представить проблемную среду, так и по
эффективности используемых правил вывода.
К
эвристическим моделям, используемым в экспертных системах, можно отнести:
·
сетевые,
·
фреймовые,
·
продукционные,
·
объектно-ориентированные модели.
К
типичным моделям представления знаний относятся:
·
семантические
сети;
·
фреймы;
·
продукционные
модели;
·
формальные логические модели (в курсе
не рассматриваются).
В свою
очередь это множество классов можно разбить на две большие группы:
·
модульные (продукционные модели и формальные логические модели) используются для
представления поверхностных знаний. Поверхностные знания - знания о видимых
взаимосвязях между отдельными событиями и фактами в предметной области;
·
сетевые (семантические сети и фреймы)
используются для представления
глубинных знаний. Глубинные знания - абстракции, аналогии, схемы, отображающие
структуру и природу процессов, протекающих в предметной области. Эти знания
объясняют явления и могут использоваться для прогнозирования поведения объектов.
Модель
семантические сети
Термин
семантическая означает смысловая, а семантика - это наука, устанавливающая
отношения между символами и объектами, которые они обозначают, то есть наука,
определяющая смысл знаков. Семантическая сеть - это ориентированный граф,
вершины которого это понятия, а дуги - отношения между ними.
Понятия
делятся на:
·
События
Под
событием понимают различные объекты проблемной области: суждения, факты,
результаты наблюдений и т.д. Одно
событие не может встречаться в одном разделе семантической сети больше одного
раза.
События
делятся на характеризуемые и характеризующие. Например, событие дождливая погода
характеризуется событием идет дождь, так как без дождя дождливой погоды не может
быть.
Если
характеризующее событие имеет несколько значений, то оно называется атрибутом.
Например, свойством понятия Времена
года является Погода. Так как последнее имеет несколько значений: Холодная,
Теплая, Дождливая и т.д., то ее можно считать атрибутом Времени года.
·
Атрибуры
·
Комплексы признаков
·
Процедуры – специфические элементы сети, которые выполняют преобразование
информации . Они позволяют вычислять значения одних атрибутов на основании
других, оперируя как с числами, так и с символами.
В
семантических сетях используются следующие отношения:
·
элемент
класса;
·
атрибутные
связи;
·
значение свойства;
·
пример элемента класса;
·
связи типа «часть-целое»;
·
функциональные связи, определяемые глаголами
«производит», «влияет»;
·
количественные (больше, меньше, равно …);
·
пространственные (далеко от, близко от, за, под, над …);
·
временные (раньше, позже, в течение…);
·
логические связи (и, или, не) и др.
Минимальный состав отношений в семантической сети - это элемент класса, атрибутные связи и
значение свойства.
На рис.
8 изображен пример семантической сети.
Рис. 8
Семантическая сеть, показывающая взаимоотношения птицы и самолета.
Проблема
поиска решения в базе знаний типа семантической сети сводится к задаче поиска
фрагмента сети или подсети, соответствующей поставленному вопросу.
Вывод знаний в сетевой модели
Для вывода знания события в сетевой модели делятся на исходные (признаки) и
целевые (гипотезы).
Значения признаков предполагаются известными.
Все признаки, помимо присущих им значений: Истинно (Да) и Ложно (Нет) — имеют
еще два стандартных значения: Пока неизвестно и Неизвестно. При задании
последнего значения признак исключается из рассмотрения. Значения исходных
атрибутов либо выбираются из определенного списка, либо вводятся извне.
Объектами вывода в рассматриваемой модели являются гипотезы. К ним относятся
рекомендации, диагнозы, прогнозы и другие решения, определяемые спецификой ПО.
Условием вывода должно быть существование хотя бы одной гипотезы. В этом случае
решением является оценка ее истинности.
Виды семантических связей
Семантическая связь (СС) отражает отношение понятий в понятийной системе. В
лексике им соответствуют лексемы любого вида, в том числе представляющие
предикаторы «меньше», «равно», «если, то» и др.
Внелексические свойства СС выражаются через:
· Rf — рефлексивность;
· Nrf — нерефлексивность;
· Arf — антирефлексивность (ни одной рефлексии);
· Sm — симметричность;
· Ns — несимметричность;
· Ans — антисимметричность (ни одной симметрии);
· As — асимметричность (контекстное свойство — обращение связи дает иную связь из списка);
· Тг — транзитивность;
· Ntr — нетранзитивность.
Внелексические свойства семантических связей в суждениях проверяются следующим
образом.
Относительно сочетания перечисленных свойств СС делятся на типы, представленные
в (табл. 2.1.).
1. Рефлексивность определяется по критерию подстановки:
вместо объекта А подставляется объект В(АгВ -> ВгВ) и выбирается один из
следующих ответов:
вполне возможно (тавтология) ~» Rf;
не исключено -> Nrf;
невозможно —> Arf.
Пример. Вегетативные расстройства сопровождаются вегетативными расстройствами.
Ответ 1 для Com.
2. Симметричность определяется по критерию перестановки:
объекты А и В меняются местами (АгВ -» ВгА) и выясняется справедливость
полученного предложения. При утвердительном ответе высказыванию приписывается
свойство Sm, в противном случае — свойство Ns.
Пример. Головная боль всегда сопровождается вегетативными расстройствами, и
Вегетативные расстройства всегда сопровождаются головной болью. Ответ «Нет» для
Com. Это соответствует свойству Ns.
Свойство Ns уточняется на более сильные свойства: Ans и As. Первое имеет место
для любых примеров анализируемой связи. Например, для связи Com имеет место
свойство Ans.
Плюс модели: Легка в реализации.
Минус модели: Плохо структурирована – при большом количестве элементов можно
запутаться, а при увеличении объема информации – может произоти комбинаторный
взрыв.При создании любой вещи, любого изделия, любого произведения человек
встает перед необходимостью неизбежного выбора среди огромного числа возможных
вариантов. К чему при этом может привести простой перебор этих вариантов
проследим на следующем явлении. Это явление известно в кибернетике под названием
комбинаторный взрыв. Что это за "зверь" нетрудно продемонстрировать на простом
примере. Допустим, что имеется некий алфавит, состоящий всего из 10 символов
(букв). ...
Из такого алфавита можно составить 10^^100 текстов длиной
по 100 букв. Гипотетический компьютер, обладающий возможностью обрабатывать
10^^18 таких текстов в секунду, потратит на общий анализ всех текстов 10^^74
лет. Для сравнения – по современным космогоническим представлениям с момента
Большого взрыва исследованной части Вселенной прошло ~10^^10 лет.