Главная > Документ


ЕДИНОЕ ИНФОРМАЦИОННОЕ ПРОСТРАНСТВО КОРПОРАЦИИ НА ОСНОВЕ МНОГОМЕРНОЙ СУБД UMS-FAD

Евгений Гришенков,EGrishenkoff@yandex.ru

Аннотация

Предложена концепция построения единого информационного пространства корпорации (ЕИП) средствами многомерной высокоскоростной СУБД UMS-FAD. Выбран путь максимально полного использования возможностей интеграции бизнес-процессов на основе общих данных в многомерной базе для объединения людей, бизнес-процессов и информационных потоков. Проведен анализ моделей данных бизнес-процессов, который показал, что многомерная модель служит контейнером множества всех реляционных моделей; возможность пошаговой модификации общей модели. Предложен подход построения и перестройки единой корпоративной базы данных из «кубов» данных бизнес-процессов, соединяемых по измерениям, как электронную схему собирают из типовых узлов (чипов). Описан принцип функционирования СУБД UMS-FAD на основе логической многомерной структуры, позволяющей реализовать сложную корпоративную базу данных нового качества – ЕИП корпорации.

Введение

Овладение информационным пространством стало сегодня такой же насущной задачей, как овладение космосом полвека назад. Сравним ИТ проекты корпоративной автоматизации с проектами разработки ракет для запуска спутника. Объединяющим моментом выступает задача системного овладения в ограниченные сроки недостаточно изученными, трудно управляемыми хаотическими процессами.

В отличие от состоявшегося полета ракеты и запуска спутника на орбиту, успешный результат ИТ-проекта не так нагляден и очевиден для всех, не слишком ли часто он напоминает ситуацию когда ракета сгорела на старте, но спутник остался цел и продолжает подавать сигналы, но с поверхности Земли? Ведь известно, что доля удавшихся ИТ-проектов все еще очень и очень низка.

История освоения космоса показала ключевую зависимость реализации амбициозных планов от наличия мощного двигателя - не полетели те ракеты, что походили внутри на «склад двигателей». При освоении информационного пространства, аналогом такого мощного двигателя выступает высокоскоростная универсальная СУБД, способная управлять единым информационным пространством корпорации (ЕИП) из множества разнородных информационных систем, окруженным «пространством данных» [1] внешней среды - корпоративной конъюнктуры.

Из прессы известно о выполненных российских масштабных проектах, идущих ";впереди планеты всей";, например, корпоративная система управления финансами и ресурсами - ЕК АСУФР ОАО «РЖД», известны заявления о проектах на десятки и сотни миллионов долларов в других структурах – ВТБ, Газпроме, ЕЭС России. Однако, меньше известны оценки результатов проектов потребителями, заказчиками, профессиональными сообществами.

Такое замалчивание понятно, ведь даже ИТ-руководители считают, что в целом ИТ-отрасль принципиально затратна, что штат и бюджет любой организации только расширяются от автоматизации. При большем масштабе эффект усиливается, ведь риски долговременных проектов должны учитывать высокие темпы изменения структуры самого бизнеса при переходе к рынку и темпы изменения ИТ (срок удвоения вычислительной мощности - 1,5-2 года), иначе будущие результаты, например, пятилетнего проекта, устаревают уже на начальном этапе технорабочего проектирования.

Утешающий результат таких ИТ проектов - приукрашивание фасада корпорации для успокоения инвесторов объявлениями о ";внедрении"; очередной автоматизированной системы. Поэтому так часто ИТ-руководители говорят о задачах предпродажной подготовки и уважают компании-производители программного обеспечения за способность “доказать” руководству компаний-потребителей, что ИТ – тоже часть бизнеса.

Фактически же .экономисты и информатизаторы продолжают жить раздельной жизнью, по прежнему реализуется трудоемкий режим ";ручного"; управления, работа руководства в режиме ";пожарной команды"; при отсутствии времени заниматься перспективой. Напрашивается вывод о том, что такая ";информатизация"; пока что больше вредит, чем помогает делу. Однако, этот вывод может принять только ";узкая"; прослойка людей - владельцев основного бизнеса, остальных же ситуация устраивает, или к ней приспособились.

Представляется, что разрешение противоречия невозможно без целенаправленных проектных работ в области ИТ, не только внедряющих заграничный опыт, но и продолжающих работы выдающихся отечественных ученых по методологии построения систем управления, например [2,3], остающиеся актуальными и сегодня.

При анализе проблем создания информационного пространства следует расширять контекст, вплоть до философского уровня [4], чтобы выявить общую сущность, связывающую наблюдаемые явления. Без этого трудно ориентироваться в виртуальном мире представлений об ИТ, заполненном мифами и феноменами массового сознания, основанными на вере и неполном знании, содержащем разные ловушки: коммерческой природы, групповых интересов, интересов целых экосистем программного обеспечения (ПО).

Настоящая статья посвящена концепции построения единого информационного пространства корпорации - ЕИП, основанной по многомерной скоростной СУБД UMS-FAD - инновационной разработке российской компании Х-Технология [5].

Обзор концепций ЕИП

Понятие ЕИП корпорации в своем развитии прошло различные состояния, начиная с идеи использования СУБД для поддержки ведения бизнеса, которая впервые сформулирована в 1972 г. в журнале для экономистов Harvard Business Review. Суть её сводится к регистрации всех бизнес-операций в единой базе данных корпорации, которая стала бы важным источником информации для принятия решений о ведении бизнеса. Принцип идеи не нов, получаемый результат напоминает, на новом историческом этапе, последствия изобретения карандаша, обеспечившего толчок развитию культуры на основе рефлексии с записываемой информацией.

Этапы развития ЕИП

Начальный замысел применения СУБД для анализа внешней среды был вытеснен потребностями автоматизации внутренних процессов производства, затем комплексных ERP-систем планирования производства. Однако, в настоящее время реализуется переход к системам управления поставками SCM по мере осознания зависимости предприятия от внешней среды, как части системы в цепи: заказ - источники сырья – производство – отгрузка.

Модель компьютерного интегрированного производства CIM (конец 80-х) разбивает ЕИП на пять уровней по шкале частот информационных потоков. Сбор данных датчиками - в непрерывной шкале времени, контроль параметра в заданных пределах - в шкале миллисекунд и секунд, АСУТП для управления единицей оборудования или одним процессом - в диапазоне секунд и минут, MES системы интеграции внутрицеховых приложений - минут и часов, а ERP системы планирования, составления расписаний, логистики – в нише дней, недель, месяцев, что будет далее в центре нашего внимания.

Сейчас роль ИТ в управлении производством пересматривается, отвечая условиям глобализации, ускорения хода рыночных часов, роста разнообразия и специализации, усиления взаимодействия контрагентов и повышении роли управленческих функций. Пришло понимание того, что движущей силой развития компании выступает не производство, выталкивающее продукцию клиентам, а запросы конечных потребителей.

В результате этого в структуре ЕИП появляются системы: прогнозирования спроса; обработки заказов; планирования дистрибуции; стратегическое и тактическое производственное планирование; оперативное планирование производства; управление материалами и закупками; управление поставками и транспортировкой.

На современном этапе развития ЕИП приходит понимание более гибкого подхода и необходимости плавной реорганизации существующих бизнес процессов – шаг за шагом, вместо шокового внедрения “монолитного” ERP решения - библиотеки «чуждых» бизнес процессов. При этом существенно возрастает роль нормативно справочной информации (НСИ) как «мастер-данных» – интеграционного фундамента бизнес процессов.

Разные поставщики предлагают различные подходы, например, Микрософт предлагает идти «от человека», выдвигая модули InfoPath MS Office и Share Point Services, которые позволяют собирать первичные данные (с проверками по справочникам в базах НСИ, что очень важно) в формы обычных документов типа Word и EXCEL, с которыми привыкли работать пользователи, реализующие детальные операции бизнес процессов. В среде разработки Business Intelligence Development Studio интеграция НСИ означает превращение внутренних измерений разных кубов данных в одно внешнее общее измерение.

ИБМ предлагает SOA архитектуру для реорганизации бизнес-процессов на основе интеграции разнородных работающих приложений, в том числе унаследованных. Однако это, лежащее на поверхности решение, ведет к росту потребностей в ресурсах, представляя собой внешнюю реорганизацию, а не внутреннюю, в большей степени обслуживает маркетинг.

Предлагаемый подход состоит в максимальном использовании возможностей интеграции бизнес-процессов на основе общих данных в многомерной базе данных, обеспечивающей ЕИП корпорации. Это реализуется на основе критического переосмысления возможностей реляционных моделей данных бизнес-процессов и индексных структур, что обуславливает переход к многомерным базам данных, управляемых системами типа СУБД UMS-FAD.

Проблема единой базы данных и двухуровневая архитектура

Постоянной проблемой развития ЕИП, несмотря на взрывной рост мощности оборудования, остается невозможность реализовать на практике «правильный» подход к построению единой корпоративной базы данных [6]. Такая база должна бы охватывать все стороны деятельности корпорации, в ней должны отсутствовать противоречия в данных, она должна быть быстрой, надежной и служить основой ЕИП корпорации.

С начала 1990-х годов были осознаны непреодолимые трудности проектирования и реализации единой корпоративной базы данных и сформированы представления об отдельной аналитической базе данных для целей управления корпорацией в виде надстройки над разрозненными системами регистрации хозяйственных операций и внешних источников.

Разработана технология построения такой базы (Информационное Хранилище или Data Warehouse, кратко DW), развита аргументация и обоснование [7] в работах Б.Инмона, Р.Кимбала и др. Основные этапы заключаются в физическом отделении управленческих данных от систем регистрации хозяйственных операций, периодических откачках, верификации, согласовании и преобразовании данных, превращении времени в ключ к данным.

Технология DW - обширный целостный процесс, охватывающий много источников данных, создающий базу предметно-ориентированных данных, глубоко переработанных и интегрированных, интерполированных во временные срезы, далее не изменяющихся. Качество согласованности данных отличает DW от локальных решений киосков данных DataMart, реализующих прямой доступ к части транзакционной базы через семантический слой создаваемых бизнес-терминов, поэтому “все возможные киоски данных не заменят одно DW”.

Именно DW призвано удовлетворять потребности широкого круга пользователей на основе единого непротиворечивого источника предметно- ориентированных данных. Пользователей DW больше и статус их в корпорации выше, чем пользователей систем регистрации хозяйственных операций. В принципе это весь аппарат управления и руководство, включая центральный аппарат и высшее руководство. Это отражает тот факт, что управленческая деятельность труднее автоматизируется, чем само производство.

Эволюция СУБД и ЕИП

Главное качество ЕИП заключается в возможности оцифровать все корпоративные информационные потоки и погрузить их в единое адресное пространство общей памяти. В реальности оно формируется из “островов” автоматизации в море бумажного документооборота, образованных различными системами. Какое-то время старые системы поддерживают информационные потоки в условиях ЕИП, по мере того как реорганизация и перестройка бизнес процессов формируют новые требования к их функционированию.

ЕИП качественно отличается от базы данных тем, что вмещает одновременно много различных систем со своими базами данных, а также связи между ними и обеспечивает процесс интеграции разнородных систем. Процесс можно сравнить его с тропическим циклоном из многих кучевых облаков, ячеек локальной циркуляции, который превращается в одну ячейку-вихрь при определенных внешних условиях (явление конвективной неустойчивости второго рода при температуре поверхности океана выше 26 градусов). В случае с ЕИП роль внешних условий играет рыночная конъюнктура и требование неуклонного повышения производительности труда.

Интеграция систем требует однородности в корпоративном ЕИП нормативно- справочной информации (НСИ). В связи с этим развивается целое направление работы с мастер-данными, т.е. теми справочниками, которым не уделялось достаточно внимания в системах ERP [8,9]. Поскольку справочники фактически выступают как измерения при построении многомерных баз (в настоящее время кубов данных), это служит дополнительным аргументом в пользу разработки геометрического подхода к моделированию данных, вместо известных методов реляционной алгебры.

Новое понятие корпоративного ЕИП требует разработки адекватного средства его реализации. Традиционно это были различные СУБД, вид которых определялся по структуре базы данных: иерархические, реляционные и сетевые. Не так давно СУБД стали называться также объектно-ориентированными, постреляционными и, наконец, многомерными. Однако, проведенный нами анализ не обнаружил по настоящему многомерных СУБД, на самом деле это или иерархические типа IMS, Cache, Pick или надстройки из кубов данных над реляционными СУБД MS SQL, Oracle, DB2.

Полностью последовательный многомерный подход в реализации СУБД реализован в разработке СУБД UMS-FAD компании X-Технология. Это обеспечивает данной разработке такие свойства как масштабируемость и быстродействие при одновременной поддержке различных видов оперативной аналитической обработки, которые соответствуют требованиям реализации ЕИП корпорации.

Цель и назначение корпоративного ЕИП

Миссия компании служит инвариантом, обеспечивающим её устойчивое развитие, при различных изменениях организационной, функциональной и других структур в поисках эффективности. Главная цель корпоративного ЕИП - в обеспечении этих процессов на основе иерархической системы моделей корпорации, в том числе основной модели контроллинга для расчета и корректировки планов и бюджетов.

Современные средства моделирования реализуют принцип конструктора и позволяют собирать расчетные финансово-экономические модели из трех основных объектов: измерения, кубы, связь по данным между кубами. Они основаны на многомерных принципах организации данных и ставят целью обеспечить самостоятельную работу экономистов с моделью компании. Например, упрощенную блок схему расчетной модели бюджетного планирования представляет Рис. 1, интерактивная схема используется как часть меню верхнего уровня системы.

Рис. 1. Упрощенная финансово-экономической модель контроллинга и скользящего планирования. Блоки представляют кубы данных (стопки однородных документов), стрелки – пересылки данных между кубами по методу координат. Расчет план-бюджета прибылей и убытков включает функции ежемесячной корректировки на основе план-фактного сравнения. Приложение в системе Сognos.

Настоящая модель обладает сложной внутренней структурой, она объединяет 5 основных блоков управления компанией: финансы, производство, маркетинг и сбыт, управление персоналом, управление собственностью. Основное требование к реализации такой модели в режиме коллективной работы заключается в минимизации кружности (перепробега) информационных потоков сверху вниз и снизу вверх.

Существующие технологии OLTP, OLAP и DW ориентированы на обработку потока информации в одну сторону – только ввод или только чтение. Это приводит к массовым пересылкам данных, существенно замедляет бизнес-процессы. Эту ситуацию исправляет разработанный метод транзакций на основе “многомерного” баланса, “быстрой” консолидации по уровням распределенных ресурсов [10].

Назначение ЕИП состоит в обеспечении эффективного функционирования корпорации, прозрачности и согласованности деятельности посредством оперативного отчуждения и обобществления информации каждого сотрудника о выполняемой работе и принимаемых решениях. Взамен сотрудник получает больше возможностей по формированию адекватной реакции на меняющуюся ситуацию, на изменение рыночного спроса и конъюнктуры, выявлению узких мест производства, неэффективных операций и т.п. По некоторым оценкам, до 60% рабочего времени сотрудников современной корпорации должно выделяться на ввод информации в компьютер, чтобы ей могли пользоваться другие.

Модель контроллинга в ЕИП

Реализованная в ЕИП модель контроллинга служит в первую очередь высшему руководству и экономистам, которые занимаются стратегическим, тактическим и в перспективе – оперативным управлением.

Именно такая модель обеспечивает оперативную обратную связь с линейными руководителями и позволяет реализовать переход от амбициозных стратегических планов к тактическим действиям. В модели наряду с финансовыми присутствуют натуральные показатели и нормативы, отражающие свойства модели бизнеса компании, свойства бизнес процессов и внешней (конъюнктурной) среды. Действует принцип оценки достижение цели по показателям планирования, а в жизни часто случается, что планируют по одним показателям, а оценивают достижения по другим.

Модель планирования отражает во времени все расходы, все доходы и может учитывать риски в разрезах регионов, партнеров, поставщиков и потребителей продукции. Учитывает, например, арендные и налоговые ставки, стоимость рабочей силы на региональных рынках труда, параметры себестоимости бизнес операций по регионам, подразделениям и т.п. Она позволяет учитывать опыт руководителей линейных предприятий и знание ими местных особенностей – нормативов, формулируемых ими в плановых заявках и реализуемых в корректировках планов.

Выходом модели выступают три основных документа: план-бюджет прибылей и убытков (P&L), бюджет движения денежных средств и план-отчет о финансовых результатах, в различных разрезах НСИ: организационной структуры, центров прибылей и затрат, региональной структуры, номенклатуры продукции, функциональной структуры, структуры цен, и других измерений.

Геометрия многомерного пространства

В процессе разработки модели контроллинга ключевую важность приобретает требование однородности справочников и классификаторов (НСИ) в ЕИП, иначе затруднительно реализовать в автоматизированном режиме эти три расчета.

Представляется, что проблема НСИ имеет геометрическую природу, поскольку разнообразие справочников по сути - разнообразие всевозможных систем координат, реализующих субъективную точку зрения на экономический объект,а само его функционирование объективно. Для описания преобразований таких сложных экономических систем существует аппарат тензорного анализа [11,12]

Связь многомерной и реляционной структур

Классификация СУБД становится сегодня весьма условной, поскольку на каждом из трех уровней представления СУБД (внешний, логический и физический) может быть своя модель, и даже не одна, а уж иерархии в виде XML-структур проникают везде, и в архитектуру реляционных СУБД. Моделирование данных бизнес-процессов инициировано работой Е.Ф.Кодда [13], положившей индустрию реляционных СУБД и реляционную алгебру в обоснование практических разработок. Однако со времен Декарта известна двойственность алгебры и геометрии как явлений, выражающих одну и ту же сущность. Это дает нам основание построить реляционную модель такого информационного объекта как многомерная база данных, чтобы выявить взаимосвязь различных подходов.

Реляционная модель многомерной базы

Особенность реляционного подхода проявляется уже в том, что проектировщик обычно затрудняется построить модель данных сущность-связь (по третьей нормальной форме 3NF) даже для простейшей многомерной структуры, например, следующей таблицы с итогами:

X..

X.1

X.2

X.3

X.4

X1.

X11

X12

X13

X14

X2.

X21

X22

X23

X24

X3.

X31

X32

X33

X34

X4.

X41

X42

X43

X44

На самом деле здесь присутствуют четыре сущности, три агрегатных и одна детальная таблицы: 1) сумма по строкам и столбцам X..; 2) суммы по строкам X.j ; 3) суммы по столбцам Xi.; 4) детальная таблица Xij, i,j < 5 . Модель данных этой двумерной структуры образует квадрат (ромб) с ориентированными ребрами, представляющими отношения один ко многим. Основанием типизации служит процесс свертки–развертки по измерениям, задавая отношения один ко многим.

В общем случае многомерной базы N измерений получаем N-мерный бинарный гиперкуб, Рис. 2. Вершины куба отражают сущности, а ориентация ребер выражает отношения: сущность – явление, тип - значение или внешний ключ - первичный ключ, для соответствующего уровня представления СУБД: внешний, логический или физический.

В вершинах этого куба представлены таблицы с агрегатными значениями. Внизу - детальная таблица, верхняя вершина содержит одно значение – общую сумму и соответствует началу координат, первый ряд сверху содержит простые измерения, другие ряды - составные измерения. Таким образом, сущности нормализованной базы данных являются агрегатными таблицами с точки зрения многомерного моделирования. Точнее, множество агрегатных таблиц всегда поглощает множество сущностей.

Рис. 2. Логическая реляционная модель (по третьей нормальной форме) многомерной базы данных для трех (слева) и четырех (справа) измерений. Сущности – агрегатные таблицы в имени которых представлен их тип (0 – свертка по измерению, 1 – развертка).

Вложение реляционной модели в многомерную

Классический пример из [14] описывает бизнес-процесс работы с поставщиками деталей, с информацией о поставщиках, имеющих представителей в разных городах: Поставщик, Город, Контактное лицо, Контактный телефон, Деталь, Цвет, Стоимость.

При многомерном подходе реальные данные образуют ненормализованную таблицу, строки образованы всеми осмысленными комбинациями значений измерений. Каждая строка отображает допустимую точку в многомерном пространстве, то есть буквально по точкам задается область определения измерителя в детальном пространстве.

Нормализованная модель предполагает естественную логическую модель данных, Рис. 3 (справа), основываясь на допущения, что в каждом городе у каждого поставщика не более одного контактного телефона и представителя. Этот же Рис. 3 показывает, что реляционная модель многомерной базы служит контейнером для множества всех реляционных моделей данных бизнес процессов для сущностей: Поставщик, Город, Деталь.

Схемы «Звезда» и «Снежинка»

В свете такой связи многомерного и реляционного моделирования данных бизнес процессов, становится более понятным происхождение схем DW баз данных типа звезда и снежинка, которые обычно приводятся без всякого обоснования. Самая нижняя таблица в реляционной модели многомерной базы (Рис. 2) со своим окружением представляет схему «Звезда». Причем лучи звезды могут и пересекаться. Если же удалить самую нижнюю таблицу (и верхнюю тоже), то получим схему «Снежинка», когда есть две таблицы фактов на разных лучах, связанные между собой реляционными отношениями.

Рис. 3.Вложение нормализованной модели бизнес процесса в многомерную модель данных общего вида. Справа нормализованная модель 3NF с выделением трех независимых сущностей (справочников), недостающие таблицы приведены без связей.

Связывание бизнес-процессов по данным

Для целей автоматизации бизнес процессов абстрагируемся до уровня изменения данных, подчиняющихся закону сохранения, поэтому все нижеизложенное применимо к любому бизнес-процессу, не только к планированию. Природа изменений, план это или факт, введено вручную, рассчитано автоматически, сняты показания датчиков, это не суть важно. Наш анализ показывает, что:

  • любая реляционная модель данных бизнес-процессов вложена в модель некоторой многомерной базы данных, в том числе вся ERP модель данных;

  • реализация любого бизнес-процесса проявляется в изменениях состояний базы данных и абстрактно его суть состоит в произвольном перераспределении ресурса в пространстве базы данных на основе баланса;

  • элементарный бизнес процесс – перераспределение ресурса по значениям одного измерения, содержащего точку нераспределенных значений ресурса, в пределах одномерного куба данных;

  • сложный бизнес процесс составляется из элементарных последовательностью распределений по иерархии измерений, образующих куб данных;

  • бизнес процессы связываются между собой по данным агрегатных таблиц многомерной базы и планировать (распределять ресурс) можно по разным иерархиям измерений с соблюдением баланса;

  • любое агрегатное значение многомерной базы данных можно изменять на основе транзакций базы методом многомерного баланса и «быстрой» консолидации;

  • единое информационное пространство компании изначально вмещает любые разрозненные слабо связанные между собой системы и позволяет их постепенно интегрировать пошаговым образом;

Это происходит следующим образом:

  • каждое подразделение реализует свой бизнес-процесс, ограниченный некоторым числом измерений, которые образуют кубик данных (агрегат многомерной базы или подпространство многомерного пространства);

  • пересечению кубиков по общим измерениям соответствует взаимодействию двух подразделений по общим данным (это соответствует стрелке пересылки на рисунке);

  • разрозненные системы соответствуют кубикам не пересекающимся, хотя всегда у них есть хотя бы одно общее измерение – время, пространство, план счетов и т.п.;

  • все единое информационное пространство может содержать тысячи измерений, однако, естественно предположить, что любой бизнес-процесс ограничен конечным числом измерений;

  • в результате этих предположений технические проблемы сводятся к обработке слабо заполненного многомерного массива из тысяч измерений;

  • эта проблема решается проектированием этого пространства в пространство абстрактных n-измерений, получаем, что ERP система проектируется в стандартную многомерную структуру данных MDDS n-измерений;

  • технически это решение получено в виде инновационной многомерной СУБД UMS-FAD, показавшей рекордные скорости транзакционной работы на стандартном тесте ТРС–С.

Описание СУБД UMS-FAD

Разработка СУБД UMS-FAD обусловлена растущими потребностями практики в средствах реализации корпоративного ЕИП. Она основана на многомерном подходе к реализации быстрых механизмов доступа к данным, отказе от классического процесса индексирования из-за его ресурсоемкости и длительности.

Особенно недостатки традиционных технологий СУБД и DW проявляются при больших и очень больших объемах данных корпоративного ЕИП и продолжают расти в соответствии с трендами развития потребностей в хранении данных и производства аналитических расчетов.

Вместо реляционной модели данных и индексов используется многомерная модель и принцип алгоритма Тезея, когда при внесении данных в базу производится их предварительный анализ, классификация и сохранение пути к месту записи. Описание пути к записи реализуется последовательностью ссылок внутри каждой записи, что обеспечивает впоследствии быстрый поиск для удаления, извлечения или обновления данных.

С точки зрения многомерного подхода, этой системой ссылок объединяются все точки каждой гиперплоскости (класса), при удалении и добавлении данных последовательность ссылок дополняется новыми связями.

Реализация запросов к данным СУБД обеспечивается быстрым поиском с предварительной оптимизацией запроса на основе такого же механизма как в SQL. Выбирается такая последовательность измерений для погружения в многомерное пространство, когда сначала отсекаются максимальные объемы на дереве поиска.

Структура СУБД UMS-FAD включает основной блок записей с данными (базу данных) и динамическую базу метаданных, которая содержит расшифровки кодов измерений, их значений и маргинальные статистики для каждого значения каждого измерения, то есть количество записей с данным значением в базе. Эти количества и используются для оптимизации запросов, поскольку результат запроса представляет собой пересечение нескольких гиперплоскостей, а в каждой из них производится поиск последовательным перебором, следуя по ссылкам дерева поиска. Оптимизация дерева поиска - выбор наилучшей последовательности гиперплоскостей на основе статистик, также содержащихся в базе.

Понять лучше такой способ обработки данных (FAD – fast accessible data) позволяет наблюдение работы табличного процессора, например, в листе MS EXCEL 2007 можно хранить миллион строк, 32 000 столбцов-измерений и до 10000 отдельных значений столбцов в автофильтре. Все то, что записано в листе представляет собой содержимое некоторой многомерной базы данных, без пустых строк и столбцов, где столбцы представляют измерения многомерной базы.

При использовании автофильтра мы можем выбрать значение измерения и увидеть строки – точки одной гиперплоскости. Затем можем задать условие отбора следующей гиперплоскости и т.д. Отбор строк каждой гиперплоскости реализуется перебором (последовательным чтением и отбором), но для больших объемов можно использовать и принцип ссылок, обеспечивающих пропуск чтения сразу многих строк, что и реализовано в СУБД UMS-FAD. Кроме того, используется расширенный до пределов всей физической памяти размер адресации (в настоящее время 64-разрядной), обеспечивающий единое информационное пространство корпорации.

Такой же автофильтр можно применить и к строкам, возможность транспонирования таблицы позволяет это легче представить, а при сцеплении номера строки и столбца, получаем одномерную проекцию листа, то есть одномерный разреженный массив данных.

Заключение

В настоящей работе затронуты проблемы формирования корпоративного единого информационного пространства ЕИП и предложены способы их решения на основе многомерной СУБД UMS-FAD компании Х-Технология, как альтернатива традиционным ИТ решениям, основанных на поддержании нормализованных данных, индексных структур, массовых пересылках и пересчетах данных, снижающих оперативность, то есть технологии Data Warehouse на реляционных СУБД.

Главное противоречие ЕИП заключается между требованиями практики эффективно автоматизировать смесь разнонаправленных информационных потоков на каждом рабочем месте и возможностями существующих ИТ обрабатывать только однонаправленные потоки: преимущественно ввод для транзакционной обработки по регистрации хозяйственных операций или только чтение при аналитической обработке.

Для преодоления этого противоречия предложено уменьшать кружности нформационных потоков в ЕИП на основе интеграции бизнес процессов по общим данным и использовать механизм транзакций с поддержанием различных видов системной целостности – метод «многомерного» баланса и «быстрой» консолидации.

1 От баз данных к пространствам данных: новая абстракция управления информацией, http://www.citforum.ru/database/articles/from_db_to_ds/

2 Инженерно-экономический анализ транспортных систем. Методология проектирования автоматизированной системы управления / Р.И. Образцова, П.Г. Кузнецов, С.Б. Пшеничников. – М. Наука, 1990. – 191 с., http://www.situation.ru/app/rs/lib/pobisk/ur_enj-ek-an/ur_enj-ek-an.htm

3Математическое обеспечение управления. Меры развития общества./ М.И.Гвардейцев, П.Г.Кузнецов, В.Я.Розенберг, М. Радио и связь, 1996, http://www.situation.ru/app/aut_t_39.htm

4 Э.В. Ильенков, Диалектика абстрактного и конкретного в научно-теоретическом мышлении (с комментариями П.Г. Кузнецова), http://situation-rus.narod.ru/lib/ilienkov/ilienkov0.htm

5 Обзор свойств СУБД UMS-FAD, http://htt-ums.ru/beta-version.htm

6 Дэвид Васкевич, Стратегии клиент-сервер, 2-е издание, руководство по выживанию для специалистов по реорганизации бизнеса, Киев, ";Диалектика";, 1996, 384 с.

7 W. H. Inmon. Metadata in the data warehouse: A statement of vision,

8 Дмитрий Гулько, Мастер-данные: найден кратчайший путь к СОА, http://www.iteam.ru/publications/it/section_88/article_3074/

9Михаил Глинников, Навигационная карта предприятия, Директор ИС № 8,  август  2005г., http://www.parus.ru/index.php?page=8&mode=press&sub=345

10 Планирование и консолидация данных многомерной базы, Евгений Гришенков, ";Открытые системы/СУБД";, апрель, 2001, http://www.osp.ru/os/2001/04/065.htm

11 Кузнецов О.Л., Кузнецов П.Г., Большаков Б.Е. Система природа – общество – человек: Устойчивое развитие. – ГНЦ РФ ВНИИгеосистем; Международный университет природы, общества и человека «Дубна», 2000. – 392 с., http://www.situation.ru/app/j_art_295.htm

12 Крон Г., Тензорный анализ сетей: Пер. с англ./Под ред. Л.Т.Кузина, П.Г.Кузнецова. - М.; Сов. Радио, 1978.-720с.

13 Е.Ф. Кодд, Реляционная модель данных для больших совместно используемых банков данных, журнал СУБД, 1995, 16 стр.

14 Дейт К.Дж., Введение в системы баз данных, 6-е издание, 2000г., 848 стр.



Скачать документ

Похожие документы:

  1. ЕДИНОЕ ИНФОРМАЦИОННОЕ ПРОСТРАНСТВО КОРПОРАЦИИ НА ОСНОВЕ МНОГОМЕРНОЙ СУБД UMS-FAD

    Документ
    ЕДИНОЕИНФОРМАЦИОННОЕПРОСТРАНСТВОКОРПОРАЦИИНАОСНОВЕМНОГОМЕРНОЙСУБДUMS-FAD Евгений Гришенков, EGrishenkoff@yandex.ru Аннотация Предложена концепция построения единогоинформационногопространствакорпорации (ЕИП) средствами ...
  2. Отчет о научно-исследовательской работе проведенной по заказу министерства экономического развития и торговли

    Отчет
    ... группа индивидуумов, корпорация, или другое ... информационных ресурсов в единоепространство ОГИР России Процесс создания ОГИР России должен быть регламентирован наоснове ... на любом основании, с любой степенью объединения + обеспечение многомерного ...
  3. Отчет о научно-исследовательской работе (1)

    Отчет
    ... группа индивидуумов, корпорация, или другое ... информационных ресурсов в единоепространство ОГИР России Процесс создания ОГИР России должен быть регламентирован наоснове ... на любом основании, с любой степенью объединения + обеспечение многомерного ...

Другие похожие документы..