Рекурсивная структурированность знаний и связность

Базы данных, базы знаний и экспертные системы 2 Лекция 13

База знаний экспертных систем

Обязательной составляющей любой экспертной системы является база знаний. Как уже говорилось ранее, под знанием можно понимать обобщенную и формализованную информацию о свойствах и законах предметной области, с помощью которой реализуются процессы решения задач, преобразования данных и самих знаний, и, которое используется в процессе логического вывода.

Поскольку не существует единого определения знаний, то будем рассматривать это понятие через набор его специфических характеристик.

Определения:

Переменная – набор с априорно неизвестными значениями.

Переменная может быть связанной и несвязанной (свободной); в последнем случае переменной не приписано никакого значения. Само значение переменной можно рассматривать как некоторый объект. С этой точки зрения связанная переменная будет представлять пару <A1,A2>, где исходным объектом (именованной переменной) является A1, а производным объектом, представляющим значение переменной, является A2.

Константа может быть представлена как пара <C,C>, где С – конкретный объект. В том случае, если для переменной предложено обозначение <A,A>, то эта также суть константа.

Определим основные специфические характеристики знаний:

  1. Внутренняя интерпретируемость знаний отождествляется с порождение некоторой функции (способа) связывания переменных с их значениями или иначе, способ порождения пар <A1,A2>. Такая функция называется интерпретирующей, способ связывания, соответственно, интерпретацией. Данные являются парами типа <C,C>, т.е. константами, для них не нужна интерпретирующая функция, они сами себя определяют.

  2. Рекурсивная структурированность знаний и связность. Рекурсивная структурируемость определяется через понятие концепта – семантического целого понятий.

Понятия В= B1,B2,..Bn образуют семантическое целое, если каждый Вiв B образует семантическое целое как минимум с одним из Вj, где Bj B/ Bi. Концепт есть упорядоченное множество семантических целых, представляющих понятие.

Кроме этого того чтобы понятия, например К1 и к2 образовывали семантическое целое необходимо выполнение следующих условий:

  • К1 и К2 связаны друг с другом как отношение и один из его аргументов;

  • К1 и К2 связаны друг с другом как действие и его носитель или субъект;

  • К1 и К2 связаны как функция ее аргумент.

Для знаний должен выполняться «принцип матрешки», т.е. рекурсивная вложенность одних информационных единиц в другие. Каждая информационная единица может быть включена в состав другой, и из каждой такой единицы могут быть выделены составляющие ее элементы.
Устанавливаемые между понятиями связи позволяют строить процедуры анализа знаний на совместимость, противоречивость и другие, которые невозможно реализовать при хранении традиционных массивов данных.

  1. Семантическое пространство с метрикой. Это свойство знаний связано с возможностью изменения знаний в системе оценок (метрик) в интервале истина, ложь. В системе с нечеткой логикой используется бесконечное множество оценок истинности. Например, утверждение «изменение стоимости товара ожидается с достоверностью 0,7» не является ни строго истинным, ни строго ложным, а лишь характеризуется некоторой степенью правдоподобия.

  2. Активность знаний. Это свойство знаний адаптироваться в ответ на изменяющиеся факты, т.е. возможность обучения и самокоррекции.

  3. Функциональная целостность. Под этим свойством знаний понимается их непротиворечивость, независимость исходных посылок и разрешимость. Непротиворечивость знаний означает. Что в базе знаний невозможно появление двух взаимоисключающих фактов. Хотя принципиально возможно рассуждение на основе взаимоисключающих посылок. Требование разрешимости заключается в том, что любое истинное знание, формализуемое в базе знаний системы, может быть выведено в не й при помощи поддерживаемых стратегий вывода. Требование разрешимости, к сожалению, для некоторых моделей представления знаний (логики предикатов) не всегда выполнимо.

  4. Независимость означает невозможность вывода одного знания из другого формальным способом.

  5. Ситуативность. Наличие ситуативных связей определяет совместимость тех или иных знаний, хранимых в системе. В качестве таких связей могут выступать отношения времени, места, действия, причины и т.п.

Различают две формы представления знаний: декларативную и процедурную.

С учетом архитектуры экспертной системы знания можно делить на интерпретируемые и не интерпретируемые (рис.`1) К первому типу относят те знания, которые способен интерпретировать управляющий компонент. Все остальные знания относятся ко второму типу; структура и содержание этих знаний интерпретатору не известны.

Не интерпретируемые знания подразделяют на следующие категории знаний:

  • вспомогательные, хранящие знания о лексике и грамматике языка общения, информацию о структуре диалога; эти знания обрабатываются естественно-языковой компонентой, не принимающие участия в обработке знаний, т.е. знания являются вспомогательными для проведения экспертизы;

  • поддерживающие знания используются для создания системы и при выполнении объяснений; эти знания выполняют роль обоснований, как интерпретирующих знаний, так и действий системы; эта категория знаний имеет описательный характер.

    • Технологические знания (в составе поддерживающих) содержат сведения о времени создания описываемых ими знаний, об авторе знаний и т.п.

    • Семантические поддерживающие знания содержат смысловое описание знаний о причинах ввода знаний, описывают способ использования знаний и получаемый эффект.

Интерпретируемыезнания можно разделить на следующие виды:

  • Предметные знания содержат данные о предметной области и способах преобразования этих данных при решении задачи. В предметных знаниях можно выделить:

    • Описатели, которые содержат определенную информацию о предметной области; такую как коэффициент определенности правил и данных, меры важности и сложности.

    • Собственно знания разбиваются на:

        • Факты определяют возможные значения сущностей и характеристик предметной области; общеизвестные в данной предметной области истины, обстоятельства.

        • Исполняемые утверждения содержат информацию о том, как можно изменить описание предметной области в ходе решения задач, т.е. это знания, задающие процедуры обработки.Эвристики - это эмпирические алгоритмы, основанные на формальных соображениях, которые ограничивают разнообразие и обеспечивают целенаправленность поведения решающей системы, не гарантируя при этом наилучшего результата. Такие знания основываются на опыте специалиста (эксперта) в данной предметной области.

Пример: База знаний состоит из фактов, отражающих специфику предметной области (например, финансовое положение клиента), вместе с правилами вывода (например, для одобрения решения

  • Управляющие знания можно разделить на:

    • Фокусирующие знания описывают, какие знания следует применять в конкретной ситуации. Обычно фокусирующие знания содержат сведения о наиболее перспективных объектах или правилах, которые целесообразно применять при проверке гипотез.

    • Решающие знания содержат информацию, используемую для выбора способа интерпретации знаний, подходящего к текущей ситуации; эти знания применяются при выборе стратегий или эвристик, наиболее эффективных для решения данной задачи.

  • Знания о представлении указывают, какой способ представления структуры знаний выбран в системе.

По отношению к предметным знаниям знания о представлении и управляющие знания являются метазнаниями.

Выделим следующие проблемы организации знаний:

  1. Организация знаний по уровням детальности и уровням представления.

Для того чтобы экспертная система могла управлять процессом поиска решения, была способна приобретать новые знания и объяснять свои действия, она должна уметь не только использовать свои знания, но и обладать способностью понимать и исследовать их, т.е. экспертная система должна обладать пониманием системы представления знаний о проблемной среде. Знания о проблемной среде можно назвать знаниями нулевого уровня представления. Первый уровень представления будет содержать метазнания - знания о системе представлений знаний нулевого уровня, т.е. знания о том, какие средства используются для представления знаний нулевого уровня. Роль знаний первого уровня велика: они оказывают существенное влияние на процесс управления решением задачи, используются при приобретении и объяснении действий экспертной системы. Эти знания не содержат ссылки на знания нулевого уровня, т.е. независимы от предметной области. Число уровней обычно не превышает двух; второй уровень содержит сведения о представлении базовых понятий первого уровня. Выделение уровней позволяет рассматривать знания с различной степенью подробности.

  1. Организация знаний в рабочей памяти.

Рабочая память предназначена для хранения данных; возможно как разделение данных по уровням (исходя их различия типов данных), так хранение в однородной среде. Выделение уровней усложняет систему, но делает ее более эффективной; возможно выделение уровня планов, уровня решений, уровня агенды, т.е. упорядоченного списка правил, готовых к выполнению. Данные в рабочей памяти могут представлены как константы и переменные. При этом переменные трактуются как характеристики некоторого объекта, в то время как константы – как значения соответствующих характеристик. Если требуется анализировать несколько различных объектов, описывающих текущую ситуацию, то необходимо указать, к каким объектам относятся рассматриваемые характеристики. Для ускорения поиска и сопоставления данные в рабочей памяти могут быть связаны не только логически, но ассоциативно.

  1. Организация знаний в базе знаний.

Показателем интеллектуальности системы является способность системы использовать нужные в данный момент (релевантные) знания. Системы, не имеющие таких способностей, неизбежно сталкиваются с проблемой «комбинаторного взрыва». Эта проблема является основной проблемой ограниченности применения экспертных систем. В проблеме доступа к знаниям можно выделить следующие аспекты: связанность знаний и данных, механизм доступа к знаниям и способ сопоставления. Связность (агрегация) знаний является основным способом, обеспечивающим ускорение поиска релевантных данных. Считается, что знания следует организовывать вокруг наиболее важных объектов предметной области. Все знания, характеризующие некоторую сущность, связываются и представляются в виде отдельного объекта. В объектах целесообразно выделять два типа связок между элементами: внешние и внутренние. Первые – объединяют элементы в единый объект и предназначены для выражения структуры объекта; вторые – отражают взаимосвязи между объектами в области экспертизы. Многие исследователи выделят во внешних связках логические и ассоциативные связки. Логические связки выделяют семантические отношения между элементами знаний, а ассоциативные – предназначены для обеспечения взаимосвязей, способствующих ускорению процесса поиска релевантных знаний.

Основной проблемой при работе с базой знаний является поиск релевантных решаемой задаче знаний. В обрабатываемых знаниях не содержится обычно явное указание на значения, требуемые для их обработки. Требуется механизм, который мог бы по описанию

сущности, имеющемуся рабочей памяти, найти в базе объекты, удовлетворяющие этому описанию. Поиск таких объектов может быть представлен как двухэтапный процесс:

1-ый этап: процесс выбора осуществляется по ассоциированным связкам, что позволяет найти в базе знаний предварительных кандидатов на роль объектов поиска.

2-ой этап: путем выполнения сопоставления потенциальных кандидатов с описаниями базы знаний осуществляется окончательный выбор объектов. Выполнение процедуры сопоставления может использоваться и как средство классификации, декомпозиции и коррекции и подтверждения потенциальных кандидатов. Операции сопоставления принимают разнообразные формы:

  • семантические сопоставления обеспечивает сравнение не образцов объектов, а их функций;

  • синтаксические сопоставления соотносят формы, а не содержание объектов; успешным является сопоставление, в результате которого образцы оказываются идентичными;

  • параметрическое сопоставление обеспечивает выбор параметра, определяющего степень сопоставления;

  • принуждаемое сопоставление один сопоставляемый образец рассматривается с точки зрения другого. В отличие от других форм сопоставления в этом случае всегда может быть получен положительный результат; его объясняет степень (силе) принуждения.

Основные свойства базы знаний экспертной системы:

  • Накопление и организация знаний.

  • Высококачественной опыт наиболее квалифицированных специалистов данной предметной области.

  • Наличие прогностических возможностей.

  • Институциональная память.

Для экспертных систем важны модели представления знаний, составляющие основу для формирования базы знаний. При этом основными требованиями, предъявляемыми к представлению знаний, являются однородность представления, простота понимания, непротиворечивость и полнота. В существующей практике построения баз знаний наибольшее распространение получили:

  • продукционные модели;

  • логические модели;

  • фреймы;

  • семантические сети.

Часто вопрос о выборе модели представления знаний сводится к обсуждению баланса между процедурным и декларативным представлениями знаний. Декларативные знания(«знать, что») не содержат в явной форме процедур, которые нужно выполнять. Такие знаний представляются набором утверждений, не зависящих от того, где они применяются. При использовании декларативного представления знаний считается, что интеллектуальность базируется на утверждении о существовании некоего универсального множества процедур, обрабатывающих знания любого типа, и на множестве специфических фактов, описывающих частную область знаний. Их использование предполагает полное описание пространства состояний моделируемого объекта, которое синтаксический характер. Вывод и поиск основывается на процедурах поиска в пространстве состояний. Эти процедуры учитывают семантику предметной области, поэтому можно говорить, что в декларативной форме синтаксические и семантические знания, в определенной мере, отделены друг от друга, что придает данной форме существования знаний некоторую универсальность.

Процедурные знания («знать, как») содержат в явном виде описание некоторых процедур. Процедурное представление основано на посылке, что интеллектуальная деятельность есть знание проблемной среды, вложенное в программы. Состояние объекта представляется в виде набора процедур, с помощью которых обрабатывается некоторый участок базы знаний. В этом случае не требуется хранение описаний всех возможных состояний объекта, т.к. их можно сгенерировать, имея некоторый набор начальных состояний объекта. При процедурном представлении знаний семантика объекта включена в описание элементов базы знаний, что позволяет применять более эффективные процедуры поиска решений с тем, чтобы исключить необходимость обработки полных описаний. Процедурные знания обеспечивают более быстрый поиск решения по сравнению с декларативными знаниями, однако, уступая последним в возможности накопления и актуализации.

Желание использовать декларативное и процедурное представление знаний привело к разработке формализмов, использующих смешанное представление, т.е. декларативное представление с присоединенными процедурами (например, фреймовая модель).

Модели представления знаний обычно делят на :

  • Логические (формальные) модели. В их основе лежат понятия формальной системы (теории); к этому классу относятся логика предикатов, любая конкретная система продукций. В логических моделях, как правило, используется логика предикатов первого порядка, дополненная эвристическими стратегиями. Эти методы являются дедуктивными, т.е. в них применяется модель вывода из заданной системы посылок с помощью фиксированной системы правил вывода. Дальнейшее развитие предикатных систем нашло в системах индуктивного типа, где правила вывода порождаются системой на основе обработки конечного числа примеров-образцов.

  • Эвристические (формализованные) модели имеют разнообразный набор средств, передающих специфические особенности предметной области; именно этот факт обеспечивает превосходство эвристических моделей над логическими vмоделями как по возможности представить проблемную среду, так и по эффективности используемых правил вывода. К эвристическим моделям относятся фреймовые модели, продукционные модели, семантические сети. Продукционные модели отличаются от формальных продукционных систем тем, что используют более сложные конструкции правил, а также содержат эвристическую информацию о специфике предметной области, выраженную в виде семантических структур.

Рис. 1 Структура знаний экспертной системы

6

 Н.Алтухова, 2004

  1. Д. А. Поспелов выделяет шесть основных факторов, наличие которых говорит о том, что речь идет о знаниях. [1, 2] (1)

    Документ
    Данные и знания суть основные понятия системы представления знаний, являющейся одной из главных компонент интеллектуальной системы принятия решений. Исторически в теории и практике программирования понятие «данные» видоизменялось и усложнялось.
  2. Д. А. Поспелов выделяет шесть основных факторов, наличие которых говорит о том, что речь идет о знаниях. [1, 2] (2)

    Документ
    По мере развития исследования в области интеллектуальных систем возникла новая концепция - концепция знаний, которая стала доминирующей в исследованиях по искусственному интеллекту.
  3. С. А. Орлов технологии разработки

    Книга
    Учебник посвящен систематическому изложению принципов, моделей и методов, используемых в инженерном цикле разработки сложных программных продуктов. Изложены классические основы программной инженерии, показаны последние научные и практические
  4. Разработка экспертных систем

    Книга
    Книга является одним из первых российских изданий по практической разработке экспертных систем. Подробно рассмотрены вопросы домашинного этапа разработки – извлечения и структурирования знаний, а также технологические аспекты разработки
  5. Ж. К. Нурбекова

    Документ
    доктор педагогических наук, профессор Е.Ы.Бидайбеков (заведующий кафедрой информатики и прикладной математики Казахского национального педагогического университета имени Абая)
  6. Организация и планирование производства 145 программирование на языке высокого уровня 153 основы теории управления 161

    Документ
    Программа составлена с учетом требований федерального государственного образовательного стандарта высшего профессионального образования по направлению 230100.
  7. Предисловие (42)

    Документ
    За все это время педвузовские кафедры программирования и вычислительной математики, как и образованные позднее на их основе кафедры информатики и вычислительной техники, не были избалованы своевременным появлением специальных учебных изданий.
  8. Я. А. Ваграменко Редакционный совет (7)

    Научно-методический журнал
    Лапчик М.П. (Омск), Могилев А.В. (Воронеж),Румянцев И.А. (Санкт-Петербург), Сарьян В.К. (Москва),Самовольнова Л.Е. (Москва), Смольникова И.А. (Москва),Хеннер Е.
  9. Я. А. Ваграменко Редакционный совет (14)

    Научно-методический журнал
    Отметим специфику пункта 2. Она заключается в том, что обучение проводится по конкретным компьютерным программам, с которыми предстоит работать. Ни врачей, ни бухгалтеров, ни секретарей не обучают программированию или работе в графическом

Другие похожие документы..