Учебное пособие Издательство тпу томск 2006

Федеральное агентство по образованию

Государственное образовательное учреждение высшего профессионального образования

"ТОМСКИЙ ПОЛИТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ"

В. Г. Спицын, Ю.Р. Цой

ПРЕДСТАВЛЕНИЕ ЗНАНИЙ

В ИНФОРМАЦИОННЫХ СИСТЕМАХ

Учебное пособие

Издательство ТПУ

Томск 2006

УДК 681.3.016

C 72

Спицын В.Г., Цой Ю.Р.

C 72 Представление знаний в информационных системах:

учебное пособие. – Томск: Изд-во ТПУ, 2006. – 146 с.

В учебном пособии рассматриваются современные модели представления знаний в информационных системах и принципы построения экспертных систем; обсуждаются проблемы применения нечеткой логики, генетических алгоритмов и нейронных сетей в интеллектуальных информационных системах; содержатся методические указания и задания для выполнения лабораторных работ. Пособие подготовлено на кафедре вычислительной техники, соответствует программе дисциплины и предназначено для студентов специальности 071900 «Информационные системы и технологии».

УДК 681.3.016

Рекомендовано к печати Редакционно-издательским Советом

Томского политехнического университета

Рецензент

Доктор технических наук, профессор, заведующий

кафедрой автоматизированных систем управления ТУСУРа

А.М. Кориков

© Томский политехнический университет, 2007

© Оформление. Издательство ТПУ, 2007

© В.Г. Спицын, Ю.Р. Цой, 2007



ВВЕДЕНИЕ

В предлагаемом вниманию читателя учебном пособии приведены современные модели представления знаний, принципы построения экспертных систем (ЭС) и перспективные направления развития систем, основанных на знаниях. Первая глава посвящена краткому изложению истории возникновения систем искусственного интеллекта, процесса мышления человека, классификации систем, основанных на знаниях, а также методов извлечения знаний из экспертов инженером по знаниям.

Содержание следующих двух глав составляют современные модели представления знаний, архитектура и технология разработки ЭС, описание систем анализа и синтеза входных и выходных сообщений. В заключительных трех главах излагаются получившие широкое распространение методы решения неформализованных задач. К этим методам относятся нечеткая логика, генетические алгоритмы и искусственные нейронные сети.

В результате освоения изложенного материала студент сможет самостоятельно приступить к разработке ЭС в роли инженера по знаниям.

Глава 1
СИСТЕМЫ, ОСНОВАННЫЕ НА ЗНАНИЯХ

1.1. История создания искусственного интеллекта

Родоначальником искусственного интеллекта считается средневековый испанский философ, математик и поэт Раймонд Луллий. Он еще в XIII в. попытался создать механическую машину для решения различных задач на основе разработанной им всеобщей классификации понятий. В XVIII в. Лейбниц и Декарт независимо друг от друга предложили универсальные языки классификации всех наук. Эти работы можно считать первыми теоретическими работами в области искусственного интеллекта.

Появление искусственного интеллекта как научного направления произошло после создания ЭВМ в 40-х годах XX в. В это время Норберт Винер создал свои основополагающие работы по кибернетике. Вскоре после признания искусственного интеллекта (ИИ) отдельной отраслью науки произошло разделение его на два направления: нейрокибернетика и кибернетика “черного ящика”. Эти направления развиваются практически независимо, существенно различаясь как в методологии, так и в технологии. И только в настоящее время появились тенденции к их объединению [1].

Основная идея первого направления заключается в том, что единственный объект, способный мыслить, – это человеческий мозг. Поэтому любое “мыслящее” устройство должно каким-то образом воспроизводить его структуру. Нейрокибернетика ориентирована на программно-аппаратное моделирование структур, подобных структуре мозга. Как известно из физиологии, человеческий мозг содержит до взаимодействующих между собой нервных клеток – нейронов [1, 2]. В рамках нейрокибернетики создавались нейроноподобные элементы, которые объединялись в функционирующие системы, называемые нейронными сетями.

В основу второго направления ИИ, называемого кибернетикой “черного ящика”, был положен альтернативный принцип, суть которого заключается в том, что не имеет значения, как построено “мыслящее” устройство. Требуется, чтобы на заданные входные воздействия оно реагировало так же, как и человеческий мозг.

Это направление ИИ было ориентировано на поиски алгоритмов решения интеллектуальных задач на существующих моделях компьютеров. В 1963–1970-х годах решение задач стало основываться на методах математической логики. Робинсоном был предложен метод резолюций, на основе которого автоматически доказывались теоремы при наличии набора исходных аксиом. В это же время русский ученый Ю.С. Маслов предложил метод обратного вывода, решающий ту же задачу другим способом [1, 3]. На основе метода резолюций француз Албер Кольмероэ в 1973 г. создал язык логического программирования Пролог.

В США в середине 1970-х годов на смену поискам универсального алгоритма мышления пришла идея моделировать конкретные знания специалистов-экспертов. Появились первые коммерческие системы, основанные на знаниях, или экспертные системы. Начиная с середины 1980-х годов, повсеместно происходит коммерциализация ИИ. Растут капиталовложения и создаются промышленные ЭС. Искусственный интеллект становится одной из наиболее перспективных и престижных областей информатики (computer science).

Следует отметить, что уровень теоретических исследований по ИИ в России сопоставим с мировым. Но, к сожалению, начиная с 1980-х годов, на прикладных работах начинает сказываться отставание в технологии. По оценкам специалистов, отставание в области разработки интеллектуальных промышленных систем составляет 3–5 лет [1].

1.2. Процесс мышления

Процесс мышления, протекающий в человеческом сознании, чрезвычайно сложен. Одна ячейка человеческого глаза способна выполнять за 10 мс обработку, эквивалентную решению системы из 500 нелинейных дифференциальных уравнений. Компьютеру Cray-1 потребовалось бы несколько минут для решения этих уравнений. Поскольку глаз человека насчитывает не менее ячеек и каждая из них взаимодействует с другими, то компьютеру Cray-1 необходимо затратить по меньшей мере 100 лет, чтобы воспроизвести процессы, происходящие ежесекундно в человеческом глазу [4].

Данные из внешнего мира воспринимаются человеком с помощью одного из пяти органов чувств и затем помещаются в буфер кратковременной памяти для анализа. В другой области памяти (долговременной) хранятся символы и смысловые связи между ними, которые используются для объяснения новой информации, поступающей из кратковременной памяти. В долговременной памяти хранятся не столько факты и данные, сколько объекты и связи между ними, т.е. символьные образы. Большие объемы данных постоянно записываются в кратковременную память, и мы непрерывно анализируем и фильтруем получаемую информацию для того, чтобы определить степень ее важности и то, как она соотносится с образами, хранящимися в долговременной памяти (рис. 1.1).

Рис. 1.1. Система обработки информации у человека

Учеными установлено местоположение всех областей памяти в человеческом мозге. Логично предположить, что имеющиеся в мозге области памяти объединяются в единую структуру, в которой и происходит обработка поступающей информации.

Доступ к информации в долговременной памяти осуществляется достаточно эффективно. Практически любой элемент данных может быть извлечен в течение цикла обработки продолжительностью не более 70 мс и затем преобразован. Например, мы инстинктивно отдергиваем руку от горячей печки или резко поворачиваем руль автомобиля при возникновении препятствия на дороге, используя образы, ранее запомненные в долговременной памяти.

Механизм запоминания информации в долговременной памяти представляет собой самостоятельную и обширную тему для исследований. Требуется приблизительно 7 секунд для записи одного образа в долговременную память и установления всех связей, необходимых для извлечения этого образа в будущем. Перемещение данных из кратковременной памяти в долговременную память занимает приблизительно 15–20 минут. Если человек в автокатастрофе получил мозговую травму, то долговременная память может восстановиться почти полностью. Однако вся информация, поступившая в течение 15–20 минут до катастрофы, будет потеряна и никогда не восстановится [4].

Можно провести аналогию между кратковременной памятью человека и оперативной памятью ЭВМ, для которой отключение электропитания означает полное уничтожение всех данных. Долговременная память человека похожа на дисковую память ЭВМ. В долговременной памяти образы существуют в виде циркулирующих электрохимических импульсов и физических нейронных взаимодействий. Человек часто полностью выздоравливает после повреждения мозга и уничтожения нейронов в автокатастрофе, если у него не разрушены речевые центры или нейроны, управляющие двигательной системой. Нейроны других типов, даже если они частично повреждаются при травме, могут сохранять работоспособность благодаря зафиксированной ранее информации.

Целесообразно остановиться на организации хранения информации в человеческой памяти. Эта тема представляет наибольший интерес для разработчиков интеллектуальных систем. Способ хранения символьных образов в долговременной памяти во многом схож со способом хранения числовой информации в базах данных сетевого типа. Человеческая память хранит не числовые данные, как, например, номера элементов некоторой совокупности, а образы или символы. В памяти существует система указателей, позволяющая нам быстро извлечь любой нужный символ и все данные, которые с ним связаны. Мозг человека организован более совершенно, чем компьютерные базы данных, так как символьные образы в нем объединены в чанки – наборы фактов и связей между ними, запомненные и извлекаемые как единое целое. Чанки хранятся совместно с взаимосвязями между ними. В каждый момент времени человек может обрабатывать и интерпретировать не более четырех-семи чанков.

Чтобы убедиться в этом, прочтите следующую строку, закройте книгу и попытайтесь написать на листе бумаги то, что вы прочли:

Нлонмйкртс зрззйнк внбнм гвссмзл.

Теперь проверьте написанный вами текст и подсчитайте, сколько символов вам удалось воспроизвести правильно. Вероятно, их окажется от четырех до семи.

Повторите эксперимент со следующим предложением:

Экспертные системы почти разумны.

На этот раз вы, видимо, написали все буквы правильно. При этом оба предложения состоят из одинакового количества букв и слов. Почему же так отличаются результаты? Во втором случае вы объединили все объекты (буквы) в четыре чанка и в действительности запомнили только их и связи между ними, что соответствует допустимому для человеческого мозга диапазону. В первом же примере вы должны были запомнить 30 чанков, т.е. выйти за пределы допустимого числа чанков.

Используя ту же стратегию, опытный шахматист может, бегло взглянув на доску, запомнить положение всех фигур. При этом он запоминает не положение каждой фигуры, а их комбинации (чанки), и поэтому безошибочно восстанавливает расположение фигур на доске.

Способность формировать чанки отличает эксперта в данной конкретной области от неэксперта. Эксперт развивает свою способность объединять в чанки большие объемы данных и устанавливать иерархические связи между ними для того, чтобы быстро извлекать эти данные из памяти и с их помощью распознавать новые ситуации по мере поступления информации о них в мозг. Средний специалист в конкретной предметной области помнит от 50 000 до 100 000 чанков, которые могут быть использованы для решения той или иной проблемы. Их накопление в памяти человека и построение указателей для такого объема данных требуют от 10 до 20 лет [4].

1.3. Основные понятия и классификация систем,
основанных на знаниях

Искусственный интеллект ориентирован на создание методов дублирования функций живых интеллектуальных систем искусственными системами. Технология разработки интеллектуальных программных средств основана на том, что знания о решении задач отделяются от программ и реализуются в виде базы знаний, а в программах реализуется алгоритм манипулирования этими знаниями. Этот алгоритм называют механизмом логического вывода. Знания являются явными и доступными, что отличает интеллектуальные системы от большинства традиционных программных средств.

К знаниям относят информацию о логике решения задач, а к данным – информацию, которая должна быть проанализирована в соответствии с этой логикой. Поэтому имеются специфические признаки, отличающие знания от данных:

  • внутренняя интерпретируемость, означающая, что в знаниях находится информация, раскрывающая смысл элементов знаний;

  • структурированность знаний, заключающаяся в возможности декомпозиции сложных объектов на более простые и установлении соответствующих связей между ними;

  • связность знаний отражает причинно-следственные и временные отношения между фактами, процессами и явлениями;

  • активность знаний, так как они могут содержать планы действий и управляющие процедуры.

Знания, которыми обладает специалист в какой-либо области (дисциплине), можно разделить на формализованные (точные) и неформализованные (неточные) знания.

Формализованные знания формулируются в виде общих и строгих суждений (законов, формул, моделей и алгоритмов), отражающих универсальные знания.

Неформализованные знания отличаются конкретностью, субъективностью и приблизительностью. Обычно они являются результатом обобщения многолетнего опыта работы и интуиции специалистов и представляют собой многообразие эмпирических приемов и правил.

В зависимости от того, какие знания преобладают в той или иной предметной области, ее относят к формализованной (если преобладают точные знания) или к неформализованной (если преобладают неточные знания) предметной области. Задачи, решаемые на основе точных знаний, называют формализованными, а задачи, решаемые с помощью неточных знаний, – неформализованными [5].

Традиционное программирование в качестве основы для разработки программ использует алгоритм, то есть формализованное знание. Поэтому до недавнего времени считалось, что ЭВМ не приспособлены для решения неформализованных задач. Расширение сферы использования ЭВМ показало, что неформализованные задачи составляют очень важный класс задач, по-видимому, значительно больший, чем класс формализованных задач. Неумение решать неформализованные задачи сдерживает внедрение ЭВМ в описательные науки. Поэтому исследования в области ЭС имеют большое значение и занимают важное место в информатике.

  1. Учебное пособие Издательство тпу томск 2006 (1)

    Учебное пособие
    В пособии рассматривается организационная структура советского востоковедения, раскрывается процесс утверждения партийного идеологического диктата и насаждения формационного методологического монизма в этой области обществоведения,
  2. Учебное пособие Издательство тпу томск 2006 (2)

    Учебное пособие
    В учебном пособии в краткой форме изложены основные подходы к проблеме сохранения здоровья, молодости и красоты. Валеологическое образование актуально не только для студентов специальности «Социально-культурный сервис и туризм», хотя
  3. Учебное пособие Издательство тпу томск 2006 (4)

    Учебное пособие
    В учебном пособии в краткой форме изложены основы отраслевой экономики предприятий электроэнергетики. Показаны место и роль отрасли в национальной экономике, её состав, структура, особенности функционирования и реформирования.
  4. Учебное пособие Издательство тпу томск 2006 (5)

    Учебное пособие
    Учебное пособие представляет собой систематическое изложение основ политической регионалистики. Сформулированы методология и главные утверждения политической регионалистики.
  5. Учебное пособие Издательство тпу томск 2006 (6)

    Учебное пособие
    Учебное пособие представляет собой систематическое исследование конфликта. Сформулированы методология и главные утверждения единой теории конфликта. Представлены специальные методы анализа конфликтных ситуаций.
  6. Учебное пособие Издательство тпу томск 2007 (5)

    Учебное пособие
    В пособии в краткой форме изложены теоретические и практические вопросы законодательства в сфере международного и отечественного социально–культурного сервиса и туризма, выделены важнейшие положения современной нормотворческой практики
  7. Учебное пособие Издательство тпу томск 2007 (2)

    Учебное пособие
    Психолого–акмеологическое знание в системе высшего профессионального образования. Учебное пособие для слушателей дополнительной профессиональной образовательной программы получения дополнительной квалификации «Преподаватель высшей
  8. Элективный курс по философии Учебное пособие

    Элективный курс
    Учебное пособие содержит материал, дающий представление о сущности предмета философии и её истории, предметном самоопределении философии в процессе развития; знакомит с историей становления и развития философских воззрений, основными
  9. Учебное пособие Издательство Томского политехнического университета 2009

    Учебное пособие
    Х 55 История русской живописи: учебное пособие / Автор- составитель: Л.А.Хлабутина. – Томск: Изд-во Томского политехнического университета, 2009. – 166 с.

Другие похожие документы..