Главная > Документ


2.3. Фазы процесса поиска нового знания

Теперь ограничимся такими изделиями как инструментарий ИП, Интеллсист, БЗ или запросы. Каждый этап имеет протяженность по времени и остается достаточно емким. Следуя рекомендациям работы [Боэм85] предлагается расчленить каждый этап на фазы, характеризующиеся однородной деятельностью разработчика. Фазами являются процессы, которые представлены ниже в таблице вместе с относительными затратами.

Фаза работ

Доля затрат в %

Планирование знаний и процессов обработки, выработка требований к представлениям знаний и данных.

10

Техническое проектирование процессов создания, разработки и сопровождения.

20

Выбор средств представления знаний и данных в виде, пригодным для ввода в Интеллсист.

50

Комплексирование всего материала из частей, отладка и испытание знаний.

20

Доля затрат по срокам и ресурсам труда - это часть общих затрат на данном этапе. Планирование изделий продуктивнее начинать с написания руководств пользователя, которые будут выполнять роль задания на разработку изделия и корректироваться после завершения работ по его созданию. На этой фазе вырабатываются качественные основы изделия. Техническое проектирование связано с выработкой количественных основ изделия. Следующая фаза, выбор средств, является довольно трудной, так как работы в ней связаны с проблемами формализации знаний по изложенным ранее канонам. Последняя фаза традиционна для всех методов применения ВМ.

2.4. Работы в процессе поиска нового знания

Каждая фаза подразделяется на конкретные работы. Работа связана с выполнением конкретной функции. Подразделение фазы на работы делается по прецеденту, который можно найти в [Боэм85]. Наименования работ в нижеследующей таблице несколько изменены, поскольку объектом разработки являются БЗ и запросы. Наименования работ в программировании даны через косую черту. В обобщенном виде их перечень дан в таблице вместе с относительной трудоемкостью каждой работы (через косую черту в двух строчках даны относительные затраты, характеризующие затраты в ИП и в программировании).

Наименование работ

Доля затрат в %

Анализ требований

18

Детальное проектирование

17

Запись текстов и данных / Программирование

10 / 20

Отладка знаний / Отладка программ

19 / 9

Верификация и подтверждение

12

Документирование

8

Управление качеством

5

Управление работами и проектом

11

Различие имеются только во второй и третьей строчках работ со знаниями и программами. Создание записей текстов затруднено из-за того, что на эту работу выпадает тяжесть формализации знаний, а уменьшение затрат на отладку обосновывается полной автоматизацией отладки знаний. Приведенные цифры являются приблизительными, они могут существенно зависеть от сложности задания.

Каждая работа представляет отдельную технологическую операцию. Необходимо заметить, что конкретная реализация технологии обработки знаний может состоять из работ-операций, которые могут отличаться от приведенных в таблице. Перечень работ является лишь образцом для подражания. Они сформулированы для деятельности в программировании на основе большого практического опыта, но малого практического опыта по обработке знаний.

2.5. Технологические операции

Вся совокупная деятельность по обработке знаний от задумки до получения результатов представляется последовательностью отдельных технологических операций. Если считать, что все операции применяются, то можно построить матрицу из 4 этапа * 4 фазы * 8 работ = 128 клеток таблицы операций. Полный или почти полный перечень работ относится к сложным проектам коллектива специалистов, решающим ответственные задачи. Простые задачи раскладываются на значительно меньшее число работ. Это может быть обосновано весьма малыми затратами на отдельные работы, которые могут объединяться. Например, некоторые фазы могут отождествиться с одной работой.

Создание программ - это довольно сложная деятельность, деятельность в ИП требует меньших затрат, но она не является менее сложной. Рассмотрение технологии решения конкретной задачи приводит к предварительному построению технологического маршрута. Для коллектива разработчиков обычно составляется сетевой график работ. При проектировании БЗ и запросов учитывается и используется накопленный человеческий опыт работы со знаниями.

2.6. Технологические маршруты

Вопросы технологического маршрута заимствованы из сферы материального производства. Маршрут зависит от задачи и имеющейся технологической оснастки (язык записи алгоритмов, данных, знаний и программ, средства автоматизации, инструментарий и др.). Однако полный набор реально выполняемых технологических операций не используется в конкретных проектах. Некоторые работы не выполняются вообще или они являются простыми, не претендующими на самостоятельность. Поэтому каждая конкретная последовательность операций образует конкретный технологический маршрут рассматриваемого проекта [Красилов88а].

Технологический маршрут поддерживает жизненный цикл знаний и запросов, он заимствуется из программирования, но существенно сокращается по объему. Жизненный цикл знаний и запроса оценивается временем от возникновения идей до снятия их с эксплуатации. Изучение цикла необходимо для:

  • оценки требуемых ресурсов и правильного их распределения,

  • прогноза и оценки материальных затрат,

  • организации управления разработками,

  • выбора методов разработки,

  • выбора методов повышения эффективности работ.

Технологические маршруты и жизненные циклы знаний и запросов составляют новую область деятельности в информатике.

2.7. Обзор методов информатики

Можно считать верными три утверждения: программированием и знанями занимаются весьма с древних времен, программированием и знаниями занимаются всегда и в программировании и в поиске знаний участвуют все. Подтверждением тому являются факты: каждый составляет планы действий, числа и тексты пишут многие. В этом разделе рассмотрим некоторые известные методы программирования и добычи знаний для иллюстрации высказанных утверждений. Главные метода информатики рассматриваются в главах 4, 5, 6 и 7.

Простейшими примерами программирования являются совокупность приемов записи чисел и строк. Сложнее представляется программирование структур из чисел и строк (программирование здесь состоит в выборе символов или лексем и построении их последовательностей или списков). В качестве образцов рассмотрим далее методы информатики. Они предназначены для выполнения технологических операций. Том 6 посвящен главным образом обзору методов в информатике. Их огромное число. Но среди них можно выделить главные. Набор методов подразделяются в соответствии с этапами работ, которые обсуждены выше.

2.7.1. Методы проектирования данных в информатике. Применение ВМ в любой отрасли знания связано с вводом в память данных об объектах, их свойствах, исследованиях, вычислениях, наблюдениях и др. До реализации действий по вводу информации в ВМ необходимо определить, что понимается под данными. Определение этого понятия предшествует их использованию при выполнении программы ВМ.

Данные - это представление знаками имен предметов, значений или смыслов фактов, понятий и их значений, знаний, в частности, программ, значений измерений, результатов обработки данных, такие представления, которые допускают интерпретацию человеком, ввод их в память ВМ, обработку и накопление, вывод из памяти ВМ. Такая формулировка является содержательной и не претендует на определение понятия данные, которое намного шире и глубже приведенного. Но это определение достаточно для введения читателя в курс беседы о проектировании данных. Формальное определение данных дается в описаниях языков программирования или представления данных. В языке Лейбниц данные описаны формально, например в форме лексем и фраз. Данные в описаниях называются, например, константами, именами, формулами и агрегатами. Эти понятия удовлетворяют приведенному определению данных. Имеются малосущественные отличия в определениях констант, имен, формул и агрегатов в различных языках программирования или представления данных. Поэтому определение данных варьируется, точного и однозначного определения, удовлетворяющего имеющимся языкам программирования (или языкам представления данных и знаний), не представляется возможным. Примем обобщенный способ определения данных, пояснив определения на примерах.

Изложенное выше неформальное определение данных для изложения сущности, процессов и методов проектирования данных будет достаточным. Кратко проектирование данных можно определить следующим образом: совокупность синтаксически и семантически определенных способов записи, ввода, хранения и вывода данных, обеспечивающая работу программ или создание БД и БЗ, а также способов и приемов их описания, переводов из одного представления в другое, формирования внешних представлений и выработки атрибутов таких представлений, - все это называется методом проектирования данных.

О программировании данных написано много публикаций. В них описываются наиболее распространенные данные: числа, строки, символы, перечисления чисел, строк, символов, слов и терминов, структуры из чисел, строк, символов, слов и терминов [Язык88]. Данными со временем стали записи программ и формулы, поскольку они могут подвергаться любой переработке. Наконец, в последнее десятилетие получили свое развитие организованные совокупности данных, именуемые БД и БЗ. Таков не претендующий на полноту перечень разнообразных форм данных, используемых при программировании ВМ. Этот ассортимент существенно отличается от предлагаемого ранее в практике программирования и в литературе [Берзтисс60].

Основное назначение метода проектирования данных состоит в поддержании хорошего уровня обмена информацией в системе человек-ВМ с помощью различных терминальных устройств и линий связи. Ему должны соответствовать все требования, предъявляемые к способам представления данных. Наиболее привлекательным требованием является требование максимальной аналогии со средствами, имеющимися в ЕЯ. Однако то большое разнообразие в представлении данных, которое имеется в ЕЯ недопустимо из-за невозможности проведения контроля однозначности интерпретации при вводе данных в память ВМ. Поэтому практически чаще используются ЯПП или ФЯ, на которых каждый пользователь ВМ пишет программы и данные. В таких языках фиксируются способы представления данных, они поддаются автоматическому контролю.

Кажется, что концепция данных нам известна более всего. В записях программ и вне программ мы используем числа, тексты или случайные последовательности символов различной природы. По мере развития методов информатики становится ясным, что работа с данными таит в себе большое количество загадок. Данные постепенно начинают играть одинаковую роль с программами. Современные ЭС функционируют с БЗ, представление которых использует все средства информатики. В БЗ программы выполняют роль данных.

Проектирование алгоритмов и программ начинается с формирования исходных данных и результатов обработки этих данных. Эта процедура проста, если решается вычислительная проблема, процедура сложнее, если решается проблема составления БД, и процедура сложна в достаточной мере, если решается проблема формирования и обработки БЗ. Процесс формирования данных в соответствии с некоторым формализмом составляет программирование данных. Этот процесс должен начинать самые первые этапы использования ВМ. Проблемы программирования данных может не возникать, если создание программ опирается на заданный способ представления данных.

К представлениям данных любого вида предъявляются достаточно противоречивые требования. Это вызывается противоположными желаниями обеспечения эффективности программ обработки и наглядности представления данных о реальных предметах, явлениях и процессах, которые исследуются с помощью таких программ. В основе представления программ и данных для ВМ лежат форматность (ограниченный объем и позиционность представлений) и малая по количеству атрибутика (характеристика) представлений, в основе реального мира - бесформатность и широкое разнообразие атрибутов представлений. Указанные два признака вполне характеризуют противоречивость требований.

В информатике данные - это последовательности символов или картинок, которые являются собственными именами, участвующими при создании программ или при диалоговом взаимодействии в системе человек-ВМ. Последовательности символов составляются в полном соответствии с ФЯ и с запросами решаемой проблемы. Более ясной является последовательность картинок, которая поступает на сканер для чтения и дальнейшего анализа. Проектирование данных - построение последовательностей символов и картинок - пока не поддается формализации в полном объеме. Процедуры формализации обычно производятся вручную. Полностью автоматизируется процесс первичной обработки (ввод, перевод во внутреннее представление и печать на различные носители) данных и процесс алгоритмической обработки. Здесь можно обнаружить проблему информатики - сбор данных, квалификация и классификация их, а также подготовка их к первичной обработке.

Информатика предлагает варьируемые классификации данных. Вариация целиком зависит от ФЯ, используемого для представления данных. Мы будем опираться на средства языка Ада [Джехани88]. Классификация данных в языке Ада является обобщающей и содержит всевозможные символьные представления данных. Хуже обстоит дело с последовательностями картинок. Трудно указать публикации с описаниями формальных методов для использования картинок.

Значительной сложностью обладают файловые структуры данных, которые предназначены для группового обмена данными между различными устройствами памяти ВМ. Файл - это поименная совокупность логических записей. Файлы описываются формально структурами (записями) и содержат поля с данными для алгоритмической обработки, для управления файлом и для контроля за процессами обработки данных файла и самого файла. Программы или программные подсистемы обслуживания файлов обычно являются частями операционной системы и используются с помощью средств языка управления данными [Джадд75, Информ75, Крамм89].

Также большой сложностью обладают структуры, которые предназначены для кодирования, хранения и переработки данных БЗ. Для их представления используются те же формальные основы, что и структуры данных. Но БЗ могут усложняться тем, что среди полей структуры могут содержаться поля со значениями атрибутов самих полей или самой структуры. Например, для представления фреймов и слотов в структуре должны быть поля для значений внешних имен самих полей и структур. Обычно в программировании внутреннее представление умалчивает внешнюю атрибутику объектов. Языки представления знаний должны предусматривать способы представления всего исходного материала каждого элемента знаний или данного, являющегося частью представлений знаний.

Специальное по отношению к традиционным способам представления данных введение информации о БД и БЗ выдвигает требования для программных систем управления такими данными. Такие системы (СУБД и СУБЗ) к настоящему времени имеют богатую историю [Гаврилова00, Грей89, Дейт80, Информ75, Калиниченко90, Когаловский92, Крамм89, Красилов92, Логический98, Лозовский82, Мартин80, Мейер87, Тиори85, Ульман90, Цаленко89] и интенсивно используются в разработках Интеллсист. Эти системы предписывают определенный метод проектирования данных на некотором языке представления данных или в диалоге с ВМ. Надо отметить, что для БД и знаний отсутствуют какие-либо стандарты. Поэтому все или по крайней мере подавляющее большинство систем управления уникальны и чаще всего не совместимы друг с другом ни по методам представления данных, ни по формату представлений.

Программные системы, обеспечивающие и поддерживающие деловые применения ВМ, чаще всего используют широко распространенные СУБД. Интеллсист, базирующиеся на знаниях, в частности, интеллектуальные или ЭС, используют СУБД Oracle [Оракл92]. БЗ используют самые разнообразные сорта и виды данных.

Необходимо обратить внимание на тот факт, что до сих пор рассматривался символьный метод записи данных. Имеется обширный класс геометрических, графических или картинный данных. Программирование таких данных представляет собой относительно новый метод информатики, который еще предстоит исследовать. Его можно переносить на другие формы данных, которые связаны с моделирование всех органов чувств человека. Например, метод информатики составит способы и приемы программирования звуковой информации или представлений звука. В современных методах программирования не рассматривались такие способы и приемы.

В связи с программированием данных имеет смысл рассматривать понятия жизненного цикла данных, технологии программирования данных и др., которые аналогичны понятиям, относящимися к программе и знанию, изобретанию (процессы формирования идей о структурах, представлениях и формах данных), проектирование (процессы создания документов на данные), разработка (процессы сбора, ввода и хранения данных) и сопровождение (процессы развития, исправления, защиты и сохранения данных). Надо считать, что и технологии программирования данных аналогичны технологиям программирования.

2.7.2. Методы проектирования множеств данных. В отличие от проектирования данных метод информатики, именуемый здесь как метод проектирования множеств данных, рассматривает в качестве предмета типы данных (значений или смыслов). Происхождение типов данных естественным образом появилось из математики как прообраз множества. Тип данных связан с введением новых имен для величин (объектов), которым предписывается принимать значения из некоторого множества. Для указания этого факта в описании терминов вводится операция связи имени, например, величины и множества ее значений в форме сопоставления этой величины и множества. Формирование множеств значений в языках программирования известно как определение типа данных или процедур. Процесс формирования описаний типов данных и процедур будет характеризовать проектирование множеств данных.

Проектирование множеств данных связано прежде всего со стандартными множествами (множествами целых чисел, логических значений, вещественных чисел) и методами построения новых множеств на базе имеющихся множеств и правил таких построений (для массивов, записей и структур). Каждый язык программирования вводит свои стандартные множества и свои методы формирования новых множеств. Однако во всем многообразии имеющихся множеств и методов формирования имеются общие информатические черты, которые и составляют предмет настоящего раздела. Кратко мы рассмотрим назначение типов данных, определение метода, классификацию типов данных и некоторые общие соображения о проектировании множеств данных.

Методы построения новых типов данных зависят от их назначения. Рассмотрение назначения типов данных определит их важность по сравнению с понятием множества в математике. Тип данных предназначен для следующего:

- определять новые типы или подтипы данных для проектирования контроля за правильностью выполнения операций и распространения операций типа;

- определять основные свойства объектов (переменных, параметров, процедур, массивов и записей) принимать значения из только заданного в определении типа или подтипа данных;

- определять свойства структур массивов, записей и таблиц данных, а также свойств индексов массивов и ключей таблиц, принимать контролируемые значения из заданного типа данных;

- определять свойства формальных параметров подпрограмм и формальных параметров настройки для контроля за процессами сопоставления формальных и фактических параметров;

- определять свойства результата операции или функции для точного и контролируемого формирования выражений из этих операций и функций при заданных свойствах операндов;

- указывать интерпретацию значения некоторого выражения при уточнении типа значения этого выражения;

- явно указывать на правила преобразования значения выражения в значение требуемого типа.

Здесь перечислены основные пункты назначения типов данных. Остальные пункты являются их производными. Главное и обобщающее назначение типов данных состоит в указании допустимых значений (смыслов) величин и в обеспечении организации контроля за процессами использования самих данных в вычислениях. Контроль за использованием данных может быть статическим (в процессе трансляции и компиляции программы) и динамическим (в процессе выполнения программы). Он обеспечивает надежность процесса отладки программы и поиск всех сортов ошибок в текстах программ.

Проектирование множеств данных (другими словами можно именовать как проектирование среды предметной области и самой предметной области) состоит из анализа и выбора стандартных типов данных или из формирования описаний новых типов. Описание типа вводит новый термин, указывает тип-прецедент и ограничения на прецедент, а также возможные данные о представлении отдельного значения или всей совокупности значений данного типа. Все исходные данные для построения типов данных рассмотрены в томах 2 и 4.

Каждый тип связан с операциями. Операции типа включают:

- базовые операции типа,

- предопределенные операции из стандартного пакета,

- пользовательские операции.

Базовые операции рассматриваются в также в томах 2 и 4.

2.7.3. Методы рекурсивного проектирования данных. По сравнению с рассмотренными данными сложными являются рекурсивные данные. К ним относятся списки, цепи, деревья и другие структуры. Менее сложными данными являются записи из полей и таблицы. Размеры и свойства элементов массивов, столбцов таблиц и полей записи являются предметом глубоких исследований. Возьмем достаточно сложный пример описания термина «человек», требующего рекурсивного использования записей по применению записей в записях и ссылок на это же понятие при указании родственников данного человека, но это рассмотрим ниже в этом разделе.

Другой пример. Понятие бесконечности интенсивно используется в математике. Например, числовой ряд, списочная или древовидная структуры или функция с неограниченным числом параметров. Понятие бесконечности проникает в информатику при решении самых разнообразных заданий. Бесконечность указывается в математике исходным образцом и правилом для получения любого члена бесконечного набора некоторых объектов или выражений. Аналогично поступают и при построении бесконечных последовательностей в информатике. Описание ФЯ - хороший пример создания бесконечных рекурсивных цепочек символов на основе порождающей грамматики. Способы и приемы введения понятия бесконечности для представления данных образуют совокупность методов проектирования рекурсивных данных. Именно рекурсия дает возможность введения бесконечных понятий. Методы можно определить следующим образом.

Методы проектирования рекурсивных данных - это метод информатики, образующий совокупность способов формирования понятий, синтаксического определения конструкции и операций с ними для введения структурных типов данных, использующих при формировании ссылки на сами эти определения. Методы предназначены для задания в знаниях и запросах в форме списков, деревьев, графов и иерархически зависящих данных. Структурные типы данных подразумевают связность данных, которая отражает главное свойство знания передачи сведений о реальном мире. Хорошими примерами представления знаний структурными конструкциями являются фреймы, семантические сети и БЗ.



Скачать документ

Похожие документы:

  1. Моу «якутский городской лицей» п у б л и ч н ы й о т ч ё т 2009-2010 г г

    Документ
    ... ПОЛНЫЕ СЕМЬИ НЕПОЛНЫЕ СЕМЬИ ОПЕКУНЫ МНОГОДЕТНЫЕ СЕМЬИ 487 ... Гин А. - исследовательские методы в обучении - технология внутриклассной ... Е.Н., учитель информатики Жиркова М.М., учитель информатики Замятина А.В., ... программы ЯГЛ, в том числе и в процессах ...
  2. Образовательная программа (61)

    Основная образовательная программа
    ... (в том числе ЕГЭ ... малообеспеченных семей, для ... и проектный методы, игровые методики ... 3 3 литература 2 2 2 2 2 2 иностранный язык 3 3 3 3 3 3 математика 5 5 5 5 5 5 информатика и ИКТ 1 1 1 1 2 1 история 2 2 2 2 2 2 обществознание 1 1 1 1 1 1 география 2 ...
  3. «создание единого информационного пространства»

    Программа
    ... информатики 1 13 1 1 1 Кабинет информатики 2 13 1 1 1 Кабинет информатики 3 13 1 1 1 Кабинет информатики 4 13 1 1 1 Кабинет информатики 5 11 1 1 1 Кабинет информатики ... исследовательские методы обучения ... незащищенных семей и ... курсов, в том числе с ...
  4. За 2011-2012 учебный год (7)

    Анализ
    ... Информатика 9 82 % Ветрова Т.А. Информатика 8 Б 93 % Ветрова Т.А. Информатика 10 А 100 % Ветрова Т.А. Информатика 10 Б 92 % Ветрова Т.А. Информатика ... методы, используемые для диагностики и определения категорий учащихся и их семей ... благодаря тому ...
  5. А а красилов информатика в семи томах том 1 основы информатики

    Книга
    ... ИНФОРМАТИКА В СЕМИТОМАХТом 1. Основы информатики (Введение в информатику) Москва 1997 - 2003 ИНФОРМАТИКАТом 1. Основы информатики (Введение в информатику) Том 2. Информатика смысла (Машинная лингвистика) Том ...

Другие похожие документы..