Пятница, 13.12.2024, 19:46
Приветствую Вас Гость | RSS

ИНТЕЛЛЕКТУАЛЬНЫЕ ИНФОРМАЦИОННЫЕ СИСТЕМЫ

Статистика

Онлайн всего: 1
Гостей: 1
Пользователей: 0
Форма входа

Лекция 4

Лекция 4. Данные и знания

Всегда вызывает интерес соотношение между данными и зна­ниями, в особенности представления (способы формализации) тех и других, модели представления данных и знаний, поскольку дан­ные и знания — это форма представления информации в ЭВМ (рис. 1.17).
Информация, с которой имеет дело ЭВМ, разделяется на проце­дурную и декларативную.

Процедурная информация овеществлена в программах, которые выполняются в процессе решения задач, дек­ларативная — в данных, с которыми эти программы работают (рис. 1.18).

Стандартной формой представления информации в ЭВМ является машинное слово, состоящее из определенного для данного типа ЭВМ числа двоичных разрядов — битов. В ряде случаев машинные слова разбиваются на группы по восемь двоичных разрядов, которые называются байтами.



Одинаковое число разрядов в машинных словах для команд и данных позволяет рассматривать их в ЭВМ в качестве одинаковых информационных единиц (ИЕ) и выполнять операции над командами, как над дан­ными. Содержимое памяти образует информационную базу (рис. 1.19).




Для удобства сравнения данных и знаний можно выделить ос­новные формы (уровни) существования знаний и данных. Как представлено в табл. 1.2, у данных и знаний много общего. Однако знания имеют более сложную структуру, и переход от данных к знаниям является закономерным следствием развития и усложне­ния информационных структур, обрабатываемых на ЭВМ.

Данные

Параллельно с развитием структуры ЭВМ происходило разви­тие информационных структур для представления данных.

Появи­лись способы описания данных в виде: векторов, матриц, списоч­ных структур, иерархических структур, структур, создаваемых про­граммистом (абстрактных типов данных).

В настоящее время в языках программирования высокого уров­ня используются абстрактные типы данных, структура которых создается программистом. Появление баз данных (БД) знаменова­ло собой еще один шаг по пути организации работы с декларатив­ной информацией.

По мере развития исследований в области ИнС возникла кон­цепция знаний, которая объединила в себе многие черты процедур­ной и декларативной информации.
Сегодня термины «база данных», «информационная интеллек­туальная система», как и многие другие термины информатики, стали широко употребительными. Причина этого — всеобщее осоз­нание (социальная потребность) необходимости интенсивного вне­дрения ЭВМ и других средств автоматизированной обработки ин­формации в самые различные области деятельности современного общества. Начало последней четверти нынешнего столетия по пра­ву можно назвать началом эры новой информационной техноло­гии — технологии, поддерживаемой автоматизированными инфор­мационными ИнС.

Актуальность проблематики ИнС и лежащих в их основе БД определяется не только социальной потребностью, но и научно-технической возможностью решения классов задач, связанных с удовлетворением информационных нужд различных категорий пользователей (включая как человека, так и программ­но-управляемое устройство). Такая возможность возникла (при­мерно на рубеже 70-х годов) благодаря значительным достижениям в области технического и программного обеспечения вычислитель­ных систем.

База данных как естественнонаучное понятие характеризуется двумя основными аспектами: информационным и манипуляцион-ным. Первый аспект отражает такую структуризацию данных, ко­торая является наиболее подходящей для обеспечения информа­ционных потребностей, возникающих в предметной области (ПО). С каждой ПО ассоциируется совокупность «информацион­ных объектов», связей между ними (например, «поставщики», «номенклатура выпускаемых изделий», «потребители» — катего­рии информационных объектов, а «поставки» — тип отношений, имеющих место между этими объектами), а также задач их обра­ботки. Манипуляционный аспект БД касается смысла тех дейст­вий над структурами данных, с помощью которых осуществляют­ся выборка из них различных компонентов, добавление новых, удаление и обновление устаревших компонентов структур данных, а также их преобразования.
Под системой управления базами данных (СУБД) понимается комплекс средств (языковых, программных и, возможно, аппарат­ных), поддерживающих определенный тип БД. Главное назначе­ние СУБД, с точки зрения пользователей, состоит в обеспечении их инструментарием, позволяющим оперировать данными в абст­рактных терминах (именах и/или характеристиках информацион­ных объектов), не связанных со способами хранения данных в па­мяти ЭВМ. Следует заметить, что средств СУБД может, вообще говоря, не хватать для решения всех задач той или иной ПО. По­этому на практике приходится адаптировать (дополнять, настраи­вать) средства СУБД для обеспечения требуемых возможностей. Системы, получаемые путем адаптации СУБД к данной ПО, относятся к ИнС.

Жизнеспособная ИнС, т. е. способная поддерживать модель БД с учетом динамики развития ПО, по необходимости должна в каче­стве своего ядра содержать СУБД. Выработанная на сегодняшний день методология проектирования ИнС (с точки зрения БД) включает четыре основные задачи:

1)                             системный анализ ПО, спецификацию информационных объектов и связей между ними (в результате вырабатывается так называемая концептуальная, или семантическая, модель ПО);

2)                             построение модели БД, обеспечивающей адекватное пред­ставление концептуальной модели ПО;

3)                             разработку СУБД, поддерживающей выбранную модель БД;

4)                             функциональное расширение (посредством некоторой систе­мы программирования) СУБД с целью обеспечения возможностей решения требуемого класса задач, т.е. задач обработки данных, ха­рактерных для данной ПО.

Знания

Рассмотрим общую совокупность качественных свойств для знаний (специфических признаков знаний) и перечислим ряд осо­бенностей, присущих этой форме представления информации в ЭВМ и позволяющих охарактеризовать сам термин «знания».

Прежде всего знания имеют более сложную структуру, чем дан­ные (метаданные). При этом знания задаются как экстенсионально (т.е. через набор конкретных фактов, соответствующих данному понятию и касающихся предметной области), так и интенсиональ­но (т.е. через свойства, соответствующие данному понятию, и схему снязсй между атрибутами).

С учетом сказанного перечислим свойства.



Внутренняя интерпретируемость знаний.

Каждая информацион­ная единица (ИЕ) должна иметь уникальное имя, по которому ИС находит ее, а также отвечает на запросы, в которых это имя упомя­нуто. Когда данные, хранящиеся в памяти, были лишены имен, то отсутствовала возможность их идентификации системой. Данные могла идентифицировать лишь программа.
Если, например, в память ЭВМ нужно было записать сведения о студентах вуза, представленные в табл. 1.10, то без внутренней интерпретации в память ЭВМ была бы записана совокупность из четырех машинных слов, соответствующих строкам этой таблицы.
При этом информация о том, какими группами двоичных разрядов в этих машинных словах закодированы сведения о студентах, у системы отсутствует. Они известны лишь программисту.
При переходе к знаниям в память ЭВМ вводится информация о некоторой протоструктуре информационных единиц. В рассматри­ваемом примере она представляет собой специальное машинное слово, в котором указано, в каких разрядах хранятся сведения о фамилиях, годах рождения, специальностях и курсе. При этом должны быть заданы специальные словари, в которых перечислены имеющиеся в памяти системы фамилии, года рождения, название специальностей и курса. Все эти атрибуты могут играть роль имен для тех машинных слов, которые соответствуют строчкам таблицы. По ним можно осуществлять поиск нужной информации. Каждая строка таблицы будет экземпляром протоструктуры. В настоящее время СУБД обеспечивают реализацию внутренней интерпретируе­мости всех ИЕ, хранимых в базе данных.

Структурированность (рекурсивная структурированность) знаний.

Информационные единицы должны обладать гибкой структурой. Для них должен выполняться «принцип матрешки», т.е. рекурсив­ная вложимость одних ИЕ в другие. Каждая ИЕ может быть вклю­чена в состав любой другой, и из каждой ИЕ можно выделить не­которые составляющие ее ИЕ.

Другими словами, должна существо­вать возможность произвольного установления между отдельными ИЕ   отношений   типа   «часть — целое»,   «род— вид»   или   «эле­мент — класс».

Связность (взаимосвязь единиц знаний).

В информационной базе между ИЕ должна быть предусмотрена возможность установления связей различного типа. Прежде всего эти связи могут характеризо­вать отношения между ИЕ. Семантика отношений может носить декларативный или процедурный характер. Например, две или бо­лее ИЕ могут быть связаны отношением «одновременно», две ИЕ — отношением «причина — следствие» или отношением «ар­гумент — функция».

Приведенные отношения характеризуют дек­ларативные знания. Различают отношения структуризации, функ­циональные отношения, каузальные отношения и семантические от­ношения. С помощью первых задаются иерархии ИЕ, вторые несут процедурную информацию, позволяющую находить (вычислять) одни ИЕ через другие, третьи задают причинно-следственные свя­зи, четвертые соответствуют всем остальным отношениям.
Между ИЕ могут устанавливаться и иные связи, например оп­ределяющие порядок выбора ИЕ из памяти или указывающие на то, что две ИЕ несовместимы друг с другом в одном описании.

Активность знаний.

С момента появления ЭВМ и разделения используемых в ней ИЕ на данные и команды создалась ситуация, при которой данные пассивны, а команды активны. Все процессы, протекающие в ЭВМ, инициируются командами, а данные исполь­зуются этими командами лишь в случае необходимости. Для ИнС эта ситуация неприемлема. Как и у человека, в ИнС актуализации тех или иных действий способствуют знания, имеющиеся в систе­ме. Таким образом, выполнение программ в ИнС должно иниции­роваться текущим состоянием информационной базы. Появление в базе фактов или описаний событий, установление связей может стать источником активности системы.


Следует упомянуть о функциональной целостности знаний, т.е. возможности выбора желаемого результата, времени и средств по­лучения результата, средств анализа достаточности полученного ре­зультата.


Перечисленные пять особенностей ИЕ определяют ту грань, за которой данные превращаются в знания, а базы данных перераста­ют в базы знаний (БЗ).

Совокупность средств, обеспечивающих работу со знаниями, образует систему управления базой знаний (СУБЗ). Однако к БЗ, в которых в полной мере была бы реализова­на внутренняя интерпретируемость, структуризация, связность, введена семантическая мера и обеспечена активность знаний, еще необходимо проделать определенный путь.




Таким образом, выполнение программ в ИнС должно иниции­роваться текущим состоянием информационной базы. Появление в базе фактов или описаний событий, установление связей может стать источником активности системы.
Следует упомянуть о функциональной целостности знаний, т.е. возможности выбора желаемого результата, времени и средств по­лучения результата, средств анализа достаточности полученного ре­зультата.

Все приведенные выше качественные свойства знаний касаются в основном уровня Зн1 и связаны со сложной природой знания, изучение которой происходит на междисциплинарном стыке таких наук, как кибернетика, лингвистика, психология и т.д.




Знания иногда называют хорошо структурированными данными метаданными, данными о данных и т.д..

Сравнение данных и знаний можно проиллюстрировать сравне­нием ИнС и обычных программных систем.

ИнС существенным образом отличаются от традиционных про­граммных систем не только наличием БЗ, в которой знания хранятся и модифицируются в форме, понятной специалистам пред­метной области (именно поэтому вопросы разработки БЗ являются центральными при создании ИнС).

Дело в том, что стиль программирования ИнС непохож на стиль традиционного программирования с использованием обычных алгоритмических языков. На рис. 1.20 и 1.21 и в табл. 1.3 пока­заны характерные различия между ИнС и обычными программными системами.
Следует добавить, что кроме общих выделенных особенностей разработки ИнС и традиционных программных систем каждый тип ИнС обладает, как правило, своим собственным стилем про­граммирования,  что затрудняет его использование для других
НН.

Тем не менее в качестве основного вывода по сравнительной характеристике ИнС и традиционных программных систем можно отметить, что обычное для классических систем соотношение ДАННЫЕ + АЛГОРИТМЫ = ПРОГРАММА заменяется на новую архитектуру, основу которой составляет БЗ и интерпретатор БЗ (машина логического вывода), т.е. ЗНАНИЯ + ВЫВОДЫ = СИСТЕМА.

База знаний

База знаний, БЗ (англ. Knowledge base, KB) — это особого рода база данных, разработанная для управления знаниями (метаданными), то есть сбором, хранением, поиском и выдачей знаний. Раздел искусственного интеллекта, изучающий базы знаний и методы работы со знаниями, называется инженерией знаний.

Под базами знаний понимает совокупность фактов и правил вывода, допускающих логический вывод и осмысленную обработку информации. В языке Пролог базы знаний описываются в форме конкретных фактов и правил логического вывода над базами данных и процедурами обработки информации, представляющих сведения и знания о людях, предметах, фактах событиях и процессах в логической форме.

Наиболее важным свойством информации, хранящейся в базах знаний, является достоверность конкретных и обобщенных сведений в базе данных и релевантности информации, получаемой с использованием правил вывода, заложенных в базу знаний. В ответах на простейшие запросы к базам знаний системы логического программирования Пролог, выдает значения «истина» и «ложь» в зависимости от наличия соответствующих фактов.

Обобщенные сведения в языке Пролог задаются с помощью правил логического вывода, выполняющих роль определения понятий, а также логических процедур, состоящих из наборов правил логического вывода. Достоверность обобщенных сведений зависит от наличия необходимых фактов и достоверности данных в базах знаний.

Наиболее важный параметр БЗ — качество содержащихся знаний. Лучшие БЗ включают самую релевантную, достоверную и свежую информацию, имеют совершенные системы поиска информации и тщательно продуманную структуру, и формат знаний.

Классификация баз знаний

В зависимости от уровня сложности систем, в которых применяются базы знаний, различают:

·         БЗ всемирного масштаба — например, Интернет или Википедия

·         БЗ национальные — например, русская Википедия

·         БЗ отраслевые— например, Автомобильная энциклопедия

·         БЗ организаций

·         БЗ экспертных систем

·         БЗ специалистов

Применение баз знаний

Простые базы знаний могут использоваться для создания экспертных систем и хранения данных об организации: документации, руководств, статей технического обеспечения. Главная цель создания таких баз — помочь менее опытным людям найти существующее описание способа решения какой-либо проблемы предметной области.

Онтология может служить для представления в базе знаний иерархии понятий и их отношений. Онтология, содержащая еще и экземпляры объектов не что иное, как база знаний.

База знаний — важный компонент интеллектуальной системы. Наиболее известный класс таких программ — экспертные системы. Они предназначены для построения способа решения специализированных проблем, основываясь на записях БЗ и на пользовательском описании ситуации.

Создание и использование систем искусственного интеллекта потребует огромных баз знаний.

Базы знаний в интеллектуальной системе

Ниже перечислены интересные особенности, которые могут (но не обязаны) быть у интеллектуальной системы, и которые касаются баз знаний.

1.      Машинное обучение: Это модификация своей БЗ в процессе работы интеллектуальной системы, адаптация к проблемной области. Аналогична человеческой способности «набирать опыт».

2.      Автоматическое доказательство (вывод): Способность системы выводить новые знания из старых, находить закономерности в БЗ. Некоторые авторы считают, что БЗ отличается от базы данных наличием механизма вывода.

3.      Интроспекция: Нахождение противоречий, нестыковок в БЗ, слежение за правильной организацией БЗ.

4.      Доказательство заключения: Способность системы «объяснить» ход её рассуждений по нахождению решения, причем «по первому требованию».

 

 

 

 

Счетчик посещений

Copyright MyCorp © 2024
Бесплатный хостинг uCoz


Яндекс.Метрика