Главная > Документ


2.1. Проблемы информатики смысла

Понятие смысла до сих пор точно не определено. Поэтому наименование раздела содержит слово «проблемы». Вполне возможно, что понятие смысла известно каждому на интуитивном уровне. Для Интеллсист, работающей на представлениях знаний, этого недостаточно. Необходимо точное определение понятия смысла, позволяющее ВМ вычислять смысл текстов. Именно с этой целью определяется СеГ.

2.1.1. Основания для новой грамматики. В истории развития средств и методов программирования все время наблюдалась естественная тенденция постепенного приближения к средствам ЕЯ при вводе любых знаний в память ВМ. Наступил критический момент, который вызван экспоненциальным ростом числа пользователей ВМ и сохранением числа программистов для обслуживания пользователей. Для Интеллсист необходимы средства передачи знаний в том виде, в каком с ними встречается человек. Это значит, что ВМ необходимо передавать информацию (сообщения) в форме текстов, таблиц, массивов, структур и формул. При этом различные объекты именуются не только словами, но и комбинациями слов, цифр, графических символов. Пока не затрагивается проблема передачи знаний графическими средствами: графиком, чертежом, рисунком или реальной картинкой. Информатика изображений еще ждет своего исследования и выработки средств передачи, анализа и синтеза смысла таких объектов. Информатика изображений сейчас реализуется с помощью текстов, таблиц, массивов, структур и формул.

Первым основанием для СеГ явилась необходимость передачи ВМ сообщений в том виде, в котором их воспринимает человек, на его ЕЯ или той части ЕЯ, которую он использует в своей практической деятельности. Это основание подтверждается накопленным опытом работы с ВМ и связано с разнообразием решаемых с их помощью задач. На базе одних и тех же знаний человек решает многочисленные задачи, которые не укладываются в технологическую схему построения программ и современного использования ВМ. Но каждое требование пользователя вынуждает программиста составлять новые программы или непрерывно улучшать имеющиеся программы. Знание должно определять всю совокупность возможных постановок и решений задач в пределах рассмотренной совокупности знаний. Отсюда следует, что грамматика ЕЯ должна обслужить любые области знаний. СиГ не обеспечивает пользователя необходимыми средствами.

Вторым основанием является проблема формирования языковых основ для представления знаний. При этом главным критерием формирования языков является минимальный отход от средств передачи знаний на ЕЯ и обеспечение минимальных потерь знаний. Методом разрешения проблемы явилось сопоставление ЕЯ и ФЯ после формирования основных принципов понимания или осмысления текстов ЕЯ.

Третье основание зиждется на постепенном освоении понятия смысл текстов, таблиц, массивов, структур и формул. Если данная ниже СеГ русского языка позволяет раскрывать смысл таких объектов, то проблема передачи знаний для Интеллсист будет более чем на половину разрешена. Другая половина проблемы находится в области использования осмысленных знаний для получения ответов на запросы пользователя. Центральная идеяпостроения СеГ заключена в том, что тексты и другие объекты составляются из известных Интеллсист понятий. Их последовательность и призвана передавать знания и запросы для Интеллсист.

Четвертым основанием является пополнение грамматики русского языка понятиями, которые используются не только в профессиональных специальных языках, но и повсеместно, но они совершенно отсутствуют в СиГ. Эти пополнения являются положительной частичной критикой современной грамматики. Грамотность текстов состоит, в частности, из грамотного написания объектов, которые используются всеми и независимо от специальности автора текста, но которые никак не прописаны в СиГ.

Пятое основание лежит в правильности и точности понимания смысла текстов, представленных на ЕЯ. Смысл текста составляется из смысла понятий, фактов, утверждений о фактах и правил построения новых фактов из известных фактов. Смысл текста по существу определяет знание. Интуиция человека работает всегда, это помогает ему часто обходиться без определения слов или фраз. В таких ситуациях человек использует обширный контекст (головы или библиотеки). Интуиция у Интеллсист может появиться только при сообщении ей лексикона понятий, может быть на первых порах даже и не определенных.

Шестым основанием является способ раскрытия структуры любого понятия. Имеющиеся терминологические словари или словари русского языка дают только весьма общее представление и варианты представлений о понятиях, поименованными словами или сочетаниями слов. Такая информация не конкретна и обычно доопределяется контекстом использования понятия. Проблема анализа контекста важна и будет решена при существенном увеличении объемов памяти ВМ. Структура любого понятия должна представляться полно и только возможно частично неопределенно так, что вводимый в Интеллсист текст вместе с ее библиотеками должен быть достаточным контекстом для доопределения понятия.

И седьмое основание. Критика текстов ЕЯ сводится к тому, что некоторые примерные фразы объявляются недопустимыми в силу авторского непонимания некоторых понятий. Авторы критических замечаний приводят традиционные примеры правильного и ошибочного написания предложений, а некоторые говорят о невозможности фразы. К цитируемым примерам относятся предложения: правильно - «Я наблюдал как прощаются друзья.» и неправильно - «Я слышал прощание.». Вторая фраза является правильной в СеГ, если выполнены ее правила и условия применения фразы. Если условно говорить о синтаксическом и семантическом русском языке, порождаемых соответствующими грамматиками, то синтаксический русский язык шире по составу фраз семантического русского языка в силу использования в нем большого контекста для понимания слов. Но сопоставление языков по передаваемому для Интеллсист смыслу приводит к обратному соотношению объемов языков. Речь (а также предметное или графическое общение) является самым широким по объему языком, поскольку смысл речи передается с учетом обстановки и с нарушением правил СиГ русского языка. Здесь нет касательства с такими формами общения. Еще о примере: автору стихотворения прощается второе предложение, и оно становится осмысленным и правильным. Пример поэтической фразы весьма очевиден. Но такие предложения можно наблюдать в текстах многих других профессий. Подобная критика нами не воспринимается, а используется при создании СеГ.

Обоснованием для СеГ, в частности, является ИЛ, излагаемая в томе 5 и реализованная в программах Интеллсист (см. том 7), фундаментальные знания и системные библиотеки словарей. Цель рассмотрения СеГ состоит в указании средств, с помощью которых можно увидеть, почувствовать и передать смысл различных текстов.

Создание и применение Интеллсист требует понимания смысла текстов, поскольку Интеллсист работает на основе знаний, получаемых от специалистов (от кухарки до академика). Знание можно получить только после осмысления текста. Важным обстоятельством является факт, что кроме словесных текстов знания передаются в виде чисел, символов, дат, таблиц, записей, функций и программ. СиГ не содержит правил построения таких объектов для передачи знаний. Поэтому каждая группа создателей программ для ВМ самостоятельно вводит свои грамматические правила, которые неизвестны другим пользователям даже той же специальности. Важно описать СеГ, поставляющую правила представления таких объектов. Только использование СеГ позволит применять Интеллсист каждому специалисту, формировать знания и запросы (вопросы, задачи, задания или проблемы), которые будут поняты и разрешены Интеллсист.

2.1.2. Основной тезис для построения СеГ. Основной тезис и основные аксиомы для построения СеГ представляются следующим образом. Исходный смысл содержится только в термине, который может быть составлен и из одного слова. Каждое слово не несет смысла, если оно не является термином. По правилам СеГ можно определить смысл каждой последовательности терминов (фразы), если не нарушены ее правила. Смысл всего текста состоит в том, чтобы быть истиной. Если текст имеет смысл лжи, то он содержит некоторое противоречие. Таково требование для каждого текста и требование Интеллсист к фразам, передающим знание ВМ.

В процессе построения правил СеГ необходимо определить объекты (в частности, слова) и понятие о знании. Определение объектов является скорее техническим делом. А вот определение знания требует некоторого усилия для преодоления классического (или общеупотребительного) понимания этого термина. При этом надо учитывать, что определение знания обычно формировалось человеком для человека, умеющего интуитивно осмысливать или понимать каждое понятие. Теперь определение знания надо построить так, чтобы возникло понимание определения системой (можно пока воспринимать термин «понимание компьютером» или «понимание системой» в кавычках). Заметим, что после формирования «нового» определения знания, станет ясным, что оно годится и для человека, иначе он не приобретет возможность общения с ВМ.

Итак, главная цель описания СеГ состоит в определении сущности алгоритма для понимания текстов расширенного русского языка по правилам этой грамматики. Другой язык может рассматриваться по аналогии с русским языком, для него также может быть построена СеГ на основе универсальной грамматики, внутреннего представления текстов в Интеллсист, на базе языка Лейбниц.

В основе разрешения вопросов или проблем в деятельности человека лежат знания. Каждый факт, рассуждения о фактах или правила вывода новых фактов выражают знания. В общении между людьми знания выражаются на каком-либо ЕЯ. Для разрешения вопросов или проблем с помощью ВМ необходимо иметь средства для представления знаний. Сегодня в большинстве случаев применение информатики связано с представлением знания программами, пиктограммами, таблицами, диалоговыми фразами или рисунками. Эти средства имеют определенный уровень интеллектуальности и, конечно же, используются в Интеллсист. Для обучения ВМ чаще всего используются процедурные представления, имеющие вполне определенные недостатки (см. т.7), компенсируемые многократным автоматизируемым составлением программ. Существуют формальные и специальные или формализованные языки представления знаний [Брябрин81, Восилюс80, Гришин82, Дюбуа90, Кирсанов82, Клещев82, Кондрашина89, Коэн75, Минский79, Осуга89, Предстинт80, Хельбиг80], которые должен знать пользователь помимо своего профессионального языка. Будем использовать тучасть ЕЯ, которая ориентирована на пользователя, являющегося специалистом в некоторой области знаний.

Представление знаний в памяти Интеллсист требует понимания того, что знания, передаваемые текстами ЕЯ, разложимы на элементы, которыми может оперировать Интеллсист. Элементарным знанием является пара <имя понятия, смысл-значение>, представляющая простой факт. Имя изображается термином, а значение имеет двоякую форму представления: внутренняя форма, которую можно понять только при анализе кодов в ячейках памяти Интеллсист, и внешняя форма, которая выражается лексемами. В примере “погода холодная” термин погода - имя, а термин холодная - значение. Логическая связь или отношения (композиция) фактов образует простое знание - часть законченной мысли, представленная фразой. Внешнее представление простого знания выражается формулами, а внутреннее представляется альтернативами совместных элементарных знаний. Простое знание служит для представления некоторой законченной мысли. В примере “погода холодная и идет дождь” использованы два факта и логическая связка “и”. Логическая совокупность (композиция) простого знания, обычно представляемая набором предложений ЕЯ, называется абзацем, который выражает законченную мысль. Отдельная законченная (формулировкой) мысль называется прикладной аксиомой, в которой пользователь уверен, что она является истиной. Прикладная аксиома определяет некоторый предмет, его свойства, явление или действия с предметами. Совокупность прикладных аксиом определяет БЗ. При анализе всего введенного в память Интеллсист знания прикладная аксиома может войти в противоречие с ранее введенными аксиомами, тогда Интеллсист обнаружит факт противоречия, а пользователь решает, как выйти из такой ситуации. Важно автоматически обнаружить такие противоречия и локализовать.

В БЗ для Интеллсист заведомо введены фундаментальные знания (они обычно содержатся в книгах и учебниках школы или вуза), а затем вводятся конкретные знания, содержащиеся в запросах на разрешение вопросов или проблем. Запросы пользователь формирует сам, включая дополнительные знания, касающиеся данной проблемы. В БЗ накапливаются две вещи: понятия, в которых пользователь выражает профессиональные базовые знания, и прикладные аксиомы, логически связывающие понятия. Эти два главных атрибута представления знаний рассматриваются ниже подробно.

Понимание текстов связано с определением терминов. Вообще же понимать текст необходимо для передачи не только знания, но и команд или вопросов (задач, проблем или заданий). Понимание команд также считается необходимым для общения с ВМ, как и понимание рассудительных текстов. А понимание вопросов относится к пониманию запросов к знаниям. Вопросы могут передавать знания и задание на логическое извлечение знания из хранилища - из БЗ. Большая часть терминов определяется в БЗ. Пользователь в своем запросе может ввести свои термины для решения частных задач.

Имеется и некоторая сложность понимания СеГ, которая вызвана тем обстоятельством, что в ней вводятся понятия, которые широко используются специалистами различных направлений. Однако вводимые понятия обобщены так, что они являются легко познаваемыми. Лексическое расширение СеГ по сравнению с СиГ будет общепонятным. А введение новых грамматических категорий постепенно поясняется в Информатике или в инструментарии Интеллсист.

2.1.3. Отладка знаний и язык. Поиск противоречий между элементами знания содержится в проблеме отладки БЗ (одна из сторон экологии знания), которая состоит в определении локальной или глобальной непротиворечивости, независимости и полноты конкретных знаний. Проблема отладки разрешается следующим образом. При последовательном вводе знаний по абзацам каждый раз решается логическое уравнение (пусть пока не смущает читателя этот термин, см. т.5), по его решению определяются свойства БЗ и вводимого дополнения к БЗ. По дополнению можно судить о непротиворечивости и/или независимости добавляемого знания. Не следует сбрасывать со счетов традиционные методы отладки знаний. К ним относятся: установление грамматической правильности фраз ЯПП и использования понятий, контроль над точным выполнением количественных ограничений, алгоритмическая, системная и концептуальная отладки. Все эти методы, как обычно, имеют программную реализацию и осуществляются автоматически. Смысловая отладка знания в Интеллсист по существу реализуются автоматически или с участием пользователя на этапе ввода знаний для внесения изменений в соответствии с СеГ. Отладка знаний именуется еще исследованием по экологии знаний [Красилов97б].

Экология знаний предполагает чистоту знаний. Знания могут быть засорены повторами или противоречиями. Повторы фактов или утверждений о фактах легко устраняются, они никогда не изменят базового или пользовательского знания. На них следует обращать внимание только для того, чтобы с какой-либо точки зрения охарактеризовать источник знания, что относится к области эмоциональных исследований, на повторы следует обращать внимание еще для того, чтобы рассмотреть знания с позиции «не содержатся ли в текстах описки или даже ошибки». Искажение хорошего текста может породить повторение, которое будет обязательно проигнорировано в Интеллсист при использовании знаний. Конечно же, важнее проблема поиска противоречий. Интеллсист автоматически находит локальные или глобальные противоречия. Локальные противоречия возникают часто, они могут быть и полезными для «чистки» знания. Глобальные противоречия требуют существенного пересмотра знаний и принятия решений человеком относительно дополнительного или имеющегося знания. В полной мере к экологии знаний можно отнести проблему его полноты. Достаточно ли знаний ВМ для решения им заданий? Этот вопрос разрешается только после попытки решить задание. Если решение состоит из новых (или известных) фактов, то знание полно, иначе оно требует пополнения, поскольку решение содержит утверждения о фактах. Интеллсист подскажет, в какой части такое пополнение необходимо осуществить.

Проблемы использования различных видов знания чрезвычайно важны. Они должны учитываться в языке знаний (в ЯПП). Уже упоминалось, что в современных ВМ используется алгоритмическое (процедурное) знание, обычно представленное программами. Кроме этого вида знаний имеются:

  • лингвосемиотические знания (описательные, плохо формализуемые),

  • семантические знания (или языковые, реализуемые через трансляторы ФЯ),

  • концептуальные знания (понятийные, используемые в системах программирования вручную),

  • фактографические знания (данные из базы, используемые через системы управления БД - СУБД),

  • теоретические знания (или логические, используемые также вручную или через систему управления БЗ - СУБЗ)

  • кибернетические знания (технологические, конструкторские или системные), которые учитываются (или не учитываются) в процессах разрешения организационных или конструкторских проблем.

Из перечисления видов знаний (подробнее см. т.1) видно, что многие виды знаний не используются в программировании автоматически и чаще всего только косвенно учитываются при построении алгоритмов. СеГ (как и СиГ) предусматривает использование всех видов знаний.

Сложность использования всех видов знания вызвана тем, что применение процедур ручного перехода от представлений различных видов знания к алгоритмическому виду приводит к потере части знания. Например, программисту было задано решить задачу об устойчивости двух фирм. Имеется некоторое понимание у программиста о методе решения этой задачи, поэтому он проявляет инициативу и решает задачу подходящим образом, не задумываясь над огромными материалами о деятельности фирм. Другой подход состоит в том, чтобы для Интеллсист сообщить все знания всех видов и сформулировать ему задание в пользовательской постановке. Кроме этого надо заметить, что знания могут быть представлены не только символами, но и графически или предметно. Знаниями, представленными графически, сегодня занимаются плотно и успешно. Хуже обстоит дело с предметным знанием. Еще слабы программы, анализирующие видеозаписи, они не извлекают в полной мере все знания, которые заложены в картинках. Можно утверждать, что имеется огромная перспектива использования знаний, представленных графически или предметно после освоения знаний, представленных символами.

Языки знаний определяют способ хранения знаний в памяти ВМ. Построенная СУБЗ для Интеллсист отличается от СУБД объектами и способами представления взаимосвязь фактов в отличие от способов представления таблиц. Конечно, СУБД используется для хранения данных первичных или новых фактов, но не для представлений знания. Так как операции со знаниями существенно отличаются от операций над таблицами, СУБД не может использоваться для этого эффективно. СУБЗ Интеллсист обеспечивает быстродействие логического вывода с реальной скоростью 500 - 5000 операций логического вывода в секунду (в зависимости от мощности ВМ), поскольку система учитывает связи фактов, а СУБД учитывает сами факты, имеющие только косвенные связи. СУБД может обеспечить быстродействие Интеллсист в 10 - 100 операций в секунду (под операцией здесь понимается один шаг логического вывода решения логического уравнения или применение одного правила СеГ). Правила СеГ диктуют такой подход к хранению знаний.

Для передачи знаний в память Интеллсист необходимо определить понятие смысла текстов, чтобы передавать осмысленные знания. Смысл в толковых словарях определяется несколькими вариантами:

смысл - это внутреннее содержание, значение чего-либо, постигаемое разумом;

смысл - это цель, разумное основание;

смысл - это то же, что и разум (понять смысл чего-либо; слово в прямом и переносном смысле; в этом нет смысла; жизнь получила новый смысл; иметь здравый смысл; в подлинном значении слова).

Действительно, разностороннее определение понятия смысла важно, поскольку человек находится в различных сферах деятельности и требует разного толкования этого понятия. По нашей традиции дадим 7 определений понятия смысл.

2.1.4. Источники проблемы смысла. Источники проблемы смысла находятся в следующем. До сих пор понятие смысла в большинстве случаев находилось вне грамматики ЕЯ. Попытки поиска смысла высказываний из применяемых правил СиГ приводили к небольшому успеху [Хомский96]. Почти единственным способом вычисления смысла на основе СиГ является построения разнообразных графов связей слов или словосочетаний. Поэтому существующие грамматики ЕЯ называются синтаксическими. Конечно, грамотно составленный текст точнее передает смысл высказывания. Наша главная задача состоит в построении Интеллсист, понимающей ЕЯ. Для решения задачи необходимо иметь четкое представление о способах передачи для Интеллсист смысла текстов. Есть убежденность в том, что (как уже говорилось) синтаксическая грамматика не может полностью обеспечить нас средствами передачи смысла высказываний. Рассматривая тексты можно найти ошибки только благодаря тому, что понимаем смысл текста. Без понимания текста весьма сложно найти ошибки, в особенности логические. Иногда в бессмысленном тексте можно обнаружить ошибку. Например, перед «что» должна стоять запятая. Но что же это значит? Смысл вопроса понятен, хотя перед словом «что» нет запятой. Для определения смысла высказывания необходим новый подход к построению грамматики ЕЯ. Имеющуюся грамматику будем квалифицировать как синтаксическую, а предлагаемую грамматику будем называть семантической.

Итак, фундаментальная проблема информатики смысла заключена в поиске способа понимания смысла любого текста, построенного по правилам СиГ. На тексты ЕЯ будут накладываться некоторые ограничения. Проблемы смысла текстов на ЕЯ решались и решаются различными методами. Сошлемся лишь на исторические публикации [Бектаев74, Бидер76, Богодист74, Рубашкин89, Сильдмяэ80 и Фреге77, а также Хомский96]. Что роднит все современные исследования смысла текстов? Главная методическая характеристика понимания смысла авторами сводится к применению СиГ для определения смысла. Но ведь она дает правила образования фраз и ее частей (слов). Действительно, определенная комбинация слов (понимаемый термин или граф связи) позволяет построить картину смысла. Такой методике можно возразить. Во-первых, та же комбинация слов в другом контексте или в другой области знаний имеет почти или совсем другой смысл, во-вторых, последовательность комбинаций слов теряет первоначальный смысл, и она не определяет смысл всего текста. Необходим другой подход для определения смысла текстов. С имеющимися представлениями о смысле тексты знаний нельзя передать для Интеллсист.

Что является основополагающим в методе разрешения проблем информатики относительно смысла текста? Будем исходить из положения, что каждый текст является средством передачи известного или нового знания. Второе положение состоит в том, что каждый текст имеет одну из двух ипостасей: он является истинным или ложным высказыванием (и третьего не дано) или он является командой для выполнения. (И третьего не дано.) В связи с этим понимание структуры знания лежит в основе построения информатики смысла. Зерном структуры знания является элементарное знание, которое обычно квалифицируется как факт. Например, «ему 17 лет» - факт, который отражает характеристику некоторого существа. Производными от фактов являются утверждения о фактах или правила построения новых фактов. Утверждения и правила сыграют главную роль в методе понимания смысла текста. Из таких положений и зерен строится всякое понимания смысла знания, передаваемого текстом.

Следующий шаг в изучении структуры знания состоит в анализе простого знания, построенного из фактов. Простое знание обычно представляет собой композицию элементарного знания и отношений между фактами - утверждения о фактах. Простое знание имеет смысл, поскольку каждый факт имеет смысл и результаты отношений также имеет смысл, вполне определенный по правилам СеГ. Простое знание - это часть текста, которая здесь именуется абзацем. Абзац может состоять из одного предложения, поэтому простое знание можно передать одним предложением. К примеру, «ему 17 лет, а ей 16 лет».

Особое положение в представлении знания имеют тексты, содержащие команды. Любой текст из команд также может пониматься как структура из элементарного знания - отдельно взятая команда и из простого знания - последовательность команд. Необходимо иметь в виду, что выполненная команда порождает истину, а невыполненная - ложь (и третьего не дано). С командными языками редко имеют дело (исключая программистов, руководителей или военнослужащих). Для языка профессиональной прозы нет существенных различий в указанных двух ипостасях. Смесь двух ипостасей допускается в диалоге людей и в диалоге человек-ВМ.

Сложное знание (или знание вообще) представляется последовательностью простых знаний (абзацев или череды команд). Каждый полный текст - это сложное знание, являющееся истинным или ложным. Конечно, истинное знание по традиции считается полезным, а ложное знание требует пересмотра исходных фактов или отношений фактов для исправления полученной ситуации (квалификации или отладки знания). Не исключается из рассмотрения сложное ложное знание, которым практически не занимаются. Но теоретическое значение ложного знания велико. Если изучение ложного знания представляет интерес, то все факты и отношения фактов, имеющих истинное значение, необходимо снабдить отрицанием для того, чтобы Интеллсист могла переработать такое знание и вывести новые ложные факты. В основном Интеллсист исследует только истинное знание, поскольку в нее заложены соответствующие алгоритмы.



Скачать документ

Похожие документы:

  1. Информатика в семи томах том 3 концептуальная информатика

    Документ
    Информатика как наука имеет свой лексикон, который еще не устоялся и находится в развитии. В томе продолжается раскрытие понятие смысла текстов, используемых в информатике, через изучение смысла понятия.
  2. Информатика в семи томах том 6 методы информатики

    Документ
    Каждая наука является коллекцией своих методов. Информатика также включает в состав своих инструментов методы изобретания, проектирования, разработки и сопровождения любого объекта с помощью средств вычислительной техники, способствующие
  3. А а красилов информатика в семи томах том 4 представление знаний

    Документ
    Излагается неформальное описание представления знаний различных видов на языке профессиональной прозы. Описание дано в полном соответствии с формальным изложением языка в томе 2.
  4. А а красилов информатика в семи томах том 1 основы информатики

    Книга
    Книга дает начальные сведения о новом определении информатики. Они необходимы для получения представлений о возможностях СВТ и человека, использующего или желающего использовать свой компьютер для принятия интеллектуальных решений
  5. А а красилов информатика в семи томах том 1 основы информатики

    Книга
    Книга дает начальные сведения о новом определении информатики. Они необходимы для получения представлений о возможностях СВТ и человека, использующего или желающего использовать свой компьютер для принятия интеллектуальных решений
  6. Том 7 интеллектуальные системы (системы решения проблем) москва 1997 -2003

    Документ
    Последний том посвящается проблемам интеллектуализации в деятельности человека на основе информатики. Инструментом повышения уровня интеллектуальной деятельности является Интеллсист.

Другие похожие документы..