Лекция №3. Структура понятий и представление понятий
При построении описания выделенного фрагмента реальной действительности (предметной области — ПО) одним из основных допущений является предположение о том, что мир состоит из независимых объектов (предметов, процессов, вещей или сущностей), которые могут быть уникально идентифицированы.
В дальнейшем при обозначении реальных объектов ПО для однозначности будем
использовать термин сущность.
Определение 2.1. Сущность — это
объект произвольной природы, принадлежащий реальному или воображаемому
(виртуальному) миру.
На самом общем уровне сущности делятся на следующие категории (классы):
· предмет,
· свойство (атрибут),
· состояние,
· процесс,
· событие,
· оценка,
· модификатор,
· квантификатор,
· модальность.
Любое понятие относится к одной из этих категорий.
Сущность ПО необходимо адекватным образом представить в памяти вычислительной
машины, чтобы с ее помощью обеспечить поиск, анализ, обработку и выдачу
накопленной информации в форме, удобной для принятия решений.
Эта задача может быть решена путем использования соответствующих средств описания ПО, предоставляющих необходимые базовые понятия, инвариантные по отношению к любым ПО, и правила, позволяющие строить более сложные синтаксические конструкции на основе базовых.
Средства предоставления информации о ПО различные исследователи называют по-разному.
Под понятием (концептом) понимается
класс сущностей, объединяемых на основе общности признанных (атрибутивных)
структур.
Следует отметить, что наиболее естественным для человека способом описания любых
сущностей ПО является соотнесение с ними в собственной памяти совокупности
определенных понятий (простых и сложных), образующих понятийную структуру
предметной области, а в памяти ЭВМ — как правило, некоторых объектов, состоящих
из атрибутов со значениями (хотя это, безусловно, не единственный способ
реализации описания понятий в памяти ЭВМ).
В ряде случаев вообще не делается попыток различения понятийной структуры и
объектов предметной области, а сразу отмечается, что предметную область можно
характеризовать совокупностью объектов, характеристик объектов и отношений
между объектами. Справедливость подобных утверждений будет вполне очевидна
после рассмотрения некоторых приведенных ниже определений.
Определение 2.2. Под простым понятием
понимается тройка, состоящая из имени, интенсионала и экстенсионала понятия.
Имя понятия — любой идентификатор;
· интенсионал понятия — множество атрибутов (свойств) понятия с областями их определения;
· экстенсионал понятия — совокупность кортежей значений, удовлетворяющих интенсионалу;
·
атрибуты — первичные характеристики данной ПО,
не подлежащие дальнейшей структуризации.
Определение 2.3. Сложные понятия — это понятия, образованные из ранее определенных понятий применением некоторых правил.
Следует добавить, что простота или сложность понятий является явлением
относительным и изменяющимся с развитием науки, причем изменение статуса понятия
возможно и в процессе разработки конкретной ИнС. Отметим также, что для
определения понятийной структуры области необходимо выявление отношений на
множестве понятий, которые являются отражением объективных законов ПО или
субъективных мнений специалистов.
Напомним, что классические модели данных (иерархические и сетевые) базируются на
таких понятиях, как запись, атрибут и связь. Современные модели данных
(реляционные и семантические) используют математическое понятие отношение,
которое задается на множествах, и понятие объекта для представления сущностей
ПО в БД
В соответствии с данными определениями отметим следующее. Структура признаков — это совокупность взаимосвязанных признаков (атрибутов), характеризующих понятие, выделяющих его среди других понятий. Признаки, входящие в совокупность, называются существенными. Их состав определяется исходя из множества понятий, в котором необходимо выделить рассматриваемое.
Совокупность существенных признаков, характеризующих понятие, называется его
содержанием (интенсионалом). В силу ограниченного числа существенных признаков
Al5...,Aj,...,Ak будем представлять содержание понятия А множеством A =
{A1,...,Aj,...,Ak}.
При этом содержание понятия должно отвечать взаимнопротивоположным требованиям
полноты и неизбыточности. Совокупность существенных признаков можно
рассматривать как координаты k-мерного признакового пространства. Оно должно
отличаться от признакового пространства, характеризующего другое понятие. Если
отойти от двух градаций i-ro признака — его наличия, либо отсутствия в
анализируемом понятии — и определить меру схожести, то можно решать задачу
выявления аналогии понятий.
Класс сущностей, объединяемых в понятие, называется его объемом
(экстенсионалом).
Сущности, входящие в объем понятия и называемые экземплярами, вариантами или фактами, задаются перечислением. Объем понятия, в отличие от его содержания, может варьироваться заданием ограничений. По этой причине объем понятия, как правило, задается перечислением не экземпляров Ai, i= 1, 2, ..., а признаков, которым они удовлетворяют: А = {А{:VAj G A,j = 1,..., к}.
Знаковое представление понятий
Понятия именуются с помощью слов или словосочетаний естественного языка,
которые играют роль знаков или имен. Таким образом, носителем знаковой формы
представления знания является естественный язык. Он позволяет с применением
символов (букв и цифр) зафиксировать любую информацию, в том числе и
графическую. Такая специфическая форма информации, как музыкальная,
записывается с помощью знаков специального вида (нотная запись).
Для представления понятия в естественном языке используется слово или
словосочетание, называемое именем. Оно играет роль идентификатора, выделяя
понятие среди остальных. Имя или знак (sign) — единица языка, отражающая
семантически сущность отображаемого мира, а синтаксически — субъект или объект
высказывания.
В пропозициональной функции имя представляется предметной переменной или
константой.
Иными словами, знак — это заменитель некоторого объекта, явления или процесса,
используемый для накопления, хранения, переработки и передачи информации или
знаний.
Пара, состоящая из имени и обозначаемого, в семиотике называется знаковой
ситуацией. Сущности ПО, на которые можно ссылаться с помощью имени или знака,
как уже упоминалось, называются денотатами.
Денотат знака — это конкретная сущность или предмет, на которые указывает
данный знак. Другими словами, денотат знака является способом интерпретации
данного знака в рамках некоторой ситуации, рассматриваемой в ПО. Денотат знака
— это значение, которое может иметь знак в рамках данной знаковой ситуации [46].
Можно указать на следующие основные свойства знаковой ситуации:
имена способны замещать денотаты. Например, имя понятия АВТОМОБИЛЬ может
использоваться в качестве заместителя любого конкретного автомобиля;
имя нетождественно денотату, оно не может полностью заменить денотат. Так, при
алгебраических преобразованиях мы можем использовать буквенные обозначения
чисел. Однако, если необходимо вычислить числовое значение выражения, то
требуется подставить конкретные числа (денотаты) вместо букв;
связь «имя — денотат» многозначна, т. е. некоторое имя может обозначать
множество денотатов — омонимия, и наоборот, одному денотату можно поставить в
соответствие несколько имен — синонимия.
Отношение, связывающее обозначаемую сущность (denotat), отражающее ее понятие
(consept) и его имя (designat), графически выражается треугольником Фреге (рис.
2.1). Сплошными линиями изображен базовый треугольник Фреге, характеризующий
однозначное отношение. Оно является желательным, но не всегда достижимым.
Пунктирными линиями изображены два треугольника, представляющие два случая
неоднозначности отношения.
Треугольник «сущность 1, понятие 1, имя 2» в сочетании с базовым иллюстрирует
случай синонимии. Сущности 1 и понятию 1 ставятся в соответствие два имени,
называемые синонимами. Это слова или словосочетания, тождественные или близкие
по своему значению, например булева алгебра и алгебра логики.
Источниками синонимии являются:
· русское и иностранное происхождение {рынок и маркет);
· полное и краткое обозначение (килограмм и кг);
· фамильный и отражающий существенные признаки (метод Парето и метод недоминируемых альтернатив);
· именование сущности по разным признакам (северный и холодный климат);
· различное авторское именование на этапе формирования новой терминологии (рабочее и функциональное диагностирование).
Треугольник «сущность 2, понятие 2, имя 1» в сочетании с базовым иллюстрирует случаи омонимии и полисемии. Сущностям 1 и 2 и понятиям 1 и 2 ставится в соответствие одно и то же имя, что свидетельствует о его многозначности. В случае полисемии понятия 1 и 2 характеризуются общим происхождением (одна статья в толковом словаре), например сферы — небесная и интересов. При омонимии понятия 1 и 2 имеют различное происхождение.
Например, в бытовом значении слово ключ характеризует предмет, связанный с
безопасностью помещений, а в программировании под ключом понимают программный
код, используемый для поиска данных. Смысл таких слов можно распознать только по
контексту. К частному случаю омонимии можно отнести омографы — слова,
различающиеся звучанием и обозначающие разные понятия (замок и замок).
Определения понятий являются результатом соглашения. Оно достигается, например,
при разработке терминологических стандартов. Такие определения называются
нормативными. Однако в реальной жизни могут использоваться и ненормативные
определения. Наиболее подверженным изменению в определении является признак,
характеризующий роль или назначение понятия, т.е. его прагматику.
В связи с этим ДА. Поспелов предложил дополнить треугольник Фреге 4-й вершиной,
характеризующей прагматику понятия (четырехугольник Поспелова). Он изображен на
рис. 2.2.
Схема и формулы понятий. Как уже отмечалось, сущности, составляющие объем
понятия, различаются с помощью признаков. Признаковые отношения предписывают
одним понятиям выполнять роль некоторых качественных свойств по отношению к
другим понятиям. Признаки понятий могут быть отнесены к одному объему понятия
Р, может быть представлена в виде множества пар дифференциальных,
характеристических и валентных признаков:
Дифференциальные признаки
используются в качестве характеристики содержания понятия.
Характеристические — это признаки,
которые позволяют отличить сущности, относящиеся к объему одного и того же
понятия.
Валентные — это признаки,
обеспечивающие связь между различными понятиями. Без потери общности можно
считать такие связи бинарными.
Признак характеризуется именем и значением. Можно выделить несколько типов значений признаков:
· логические,
· числовые,
· символьные и др.
Имя признака вместе с его значением образует полное наименование
соответствующего признака. Например, признак ВОЗРАСТ вместе со значением «30
лет» образует наименование признака «возраст 30 лет».
Имя признака позволяет указать ту семантическую роль, которую играет его
значение в организации связи между сущностью и признаком, ее характеризующим.
Так, в предыдущем примере имя признака ВОЗРАСТ характеризует определенную роль
понятия «30 лет» по отношению к некоторой сущности, в качестве которой
выступает конкретный человек.
Совокупность имен дифференциальных, характеристических и валентных признаков
составляет схему понятия, обозначаемую как shm P.
Если учесть деление признаков понятия Р(Х) на дифференциальные,
характеристические и валентные, то логическое выражение (2.6) можно представить
в виде
Связи между различными категориями,
используемыми для описания понятий в логике и семиотике, представлены на рис.
2.3.
В зависимости от характера деятельности внимание проектировщиков ИнС концентрируется на различных составляющих понятия: системные аналитики и администраторы задач приложений, создающие формальную модель ПО, больше должны опираться на интенсионал понятий ПО, а администраторы базы данных — на их схему. Тем самым понятие становится чрезвычайно удобным средством, которое позволяет, с одной стороны, путем использования интенсионала выразить семантические отношения для некоторого фрагмента реального мира, а с другой стороны, с помощью схемы обеспечить возможность перехода к менее детальному описанию и представлению этой информации в базе знаний.