Вы здесь

Комп’ютерні методи підвищення достовірності та повноти інтегрованих баз даних

Автор: 
Завгородній Андрій Юрійович
Тип работы: 
Дис. канд. наук
Год: 
2008
Артикул:
3408U001809
99 грн
(320 руб)
Добавить в корзину

Содержимое

РАЗДЕЛ 2
РАЗРАБОТКА МЕТОДА ИНТЕГРАЦИИ БАЗ ДАННЫХ В АВТОМАТИЗИРОВАННЫХ СИСТЕМАХ УПРАВЛЕНИЯ
2.1. Типовая автоматизированная система управления

Автоматизированные системы управления активно развиваются, начиная с 60-х годов прошлого столетия. Первыми такими автоматизированными системами стали системы класса MRP (Material Requirements Planning), которые использовались для расчета потребностей предприятия в материальных ресурсах на основании объемно-календарных планов производства [101]. Появившиеся впоследствии системы класса MRP II [102] (Manufacturing Resource Planing) уже включали в себя управление всей цепочкой "сбыт-производство-склад-снабжение". Результатом дальнейшей эволюции стала концепция ERP [103] (Enterprise Resource Planning). Ее отличительной чертой стали, во-первых, возросшая универсальность систем относительно различных типов производства, и, во-вторых, появление достаточно развитых систем поддержки принятия решений (СППР). На следующем витке эволюции появились системы класса ERP II [104] (Enterprise Resource Planning& Relationship Processing), которые увеличили количество охваченных автоматизацией бизнес-процессов за счет автоматизации процессов внешнего и внутреннего взаимодействия предприятия. Анализ систем, созданных в рамках перечисленных концепций, позволяет выделить расширение и углубление функциональности информационных систем, как основную тенденцию развития таких систем. В то же время следует отметить, что изменения, появлявшиеся на каждом из перечисленных этапов, могут быть наиболее точно охарактеризованы описанием принципов новых задач, системного подхода к проектированию АСУ, первого руководителя, непрерывного развития системы, единства информационной базы, комплексности задач и рабочих программ, согласования пропускной способности различных звеньев системы, типовости, впервые предложенных В.М. Глушковым [105].
С точки зрения данного исследования процесс функционирования предприятия с внедренной современной АСУ можно упрощенно представить следующей образом (рис. 2.1).

Рис. 2.1. Место АСУ в процессе функционирования организации
Вся текущая операционная деятельность предприятия отражается в соответствующих документах, формируемых работниками предприятия с помощью ПО, входящего в состав АСУ. Подсистемы АСУ предназначенные для поддержки принятия решений не вносят новых данных в систему, обрабатывая уже накопленные данные с тем, чтобы предоставить руководителю некоторые агрегированные показатели деятельности в удобном для анализа виде или даже сформировать рекомендации [106, 107]. Далее, на основании полученной информации, руководитель принимает решения, обеспечивающие прогрессивное развитие организации.
Рассматривая АСУ как человеко-машинную систему, можно предположить, что основным источником проблем достоверности и полноты данных является человек-оператор. Статистика, собранная для различных видов систем "человек-машина" подтверждает такую гипотезу. Так, например, ошибки водителя являются причиной 40% автодорожных происшествий [108], 66% аварий на флоте также вызваны неверными действиями капитанов и экипажей [109]. Анализ литературных источников, посвященных проблемам достоверности и полноты данных [52, 110, 111], также подтверждает сделаное ранее предположение и позволяет сформировать множество видов недостоверных или неполных данных в АСУ:
- отсутствие данных об определенной сущности реального мира или ее свойства, вызванное тем, что соответствующая информация была пропущена оператором при вводе;
- избыточность данных, появляющаяся в результате ошибочного двухкратного (или более) ввода достоверных данных об одной сущности;
- недостоверные реквизиты, появление которых вызвано ошибками оператора, наиболее характерные из которых были выявлены в работе [43] и представлены в табл. 2.1;
- отсутствие унифицированных требований к вводу информации, приводящей к тому, что безошибочно введенный реквизит (но, например, с использованием аббревиатур или сокращений) является непригодным к использованию, вызывая проблемы, например, с получением агрегированной информации.

Таблица 2.1
Наиболее распространенные орфографические ошибки оператора
Виды ошибокУдельный весПримерыОднократная транскрипциядо 76%245.75-> 295.75Добавление символадо 15%профессор->проффессорПропуск символадо 12%к.т.н.-> к..н.Транспозиция смежных символовдо 6%Пешков-> Пек шовДвукратная транскрипциядо 3%731.25->832.25 Показатели достоверности и полноты данных каждой унаследованной системы можно оценить, представив данные источника как совокупность отношений Sch={R1,R2,...,Rq} и воспользовавшись методом, предложенным в работах [112, 113]. В соответствии с [113] вводятся показатели достоверности и полноты, оцениваемые путем сравнения реального и идеального экземпляров базы данных. Процедура сравнения экземпляров БД подразумевает оценку каждого из представленных в Sch отношения:

, , (2.1)

где SSch, CSch - показатели достоверности и полноты источника данных Sch соответственно;
q - количество отношений в источнике Sch;
SRi, CRi - показатели достоверности и полноты i-го отношения из Sch.
В свою очередь, для каждого отношения R с заголовком вида {A0:T0, A1:T1, ..., Ah:Th}, где Ai - имя атрибута, Ti -домен, на котором определен атрибут, A0 - ключевой атрибут, показатели рассчитывают следующим образом. Исходное отношение разбивается на проекции по всем возможным парам ключ-атрибут, после чего получают частные показатели для каждой проекции: , , где I - идеальное отношение. Тогда достоверность и полноту отношения R, содержащего (h+1) атрибут оценивают как
, . (2.2)
Рассмотрим пример, иллюстрирующий процедуру оценки достоверности и полноты. Пусть даны идеальное отношение I (табл. 2.2) и реальное отношение R (табл. 2.3).

Таблица 2.2
Данные идеального отношения I
КодФамилияИмяОтчествоОклад1КаспаровГарриКимович424,502