Управление на данни

©Христо Тужаров, 2013  

КОМПОНЕНТЕН МОДЕЛ "Качество на данните"

 

[Home] [Съдържание]

КАЧЕСТВО НА ДАННИТЕ

Стратегия за качество на данните

Стандарт  ISO 8000

КОМПОНЕНТЕН МОДЕЛ "Качество на данните"

ФАКТОРИ, ИЗИСКВАЩИ КАЧЕСТВО НА ДАННИТЕ

Критерии за качество на данните

Зрялост на данните  

 

Компонентен модел "Качество на данните"

 

 

      1. Стратегически цели - определят основните направления в работата по обезпечаване качество на данните и как те подкрепят бизнес целите.

      2. Хора и умения - насърчаване на културните и организационни промени за изграждане на съзнание, разбиране, съпричастност и ангажираност на основните заинтересовани страни.

      3. DQ процеси  - установяване на стандартни и повторяеми процеси при осигуряване на качеството на данните.

      4. DQ технологии - техники и средства за обезпечаване на качеството на данните  - анализ, мониторинг, контрол и прочистване.

 

Цели на управление качеството на данни

  • Активно проследяване на качеството на данните, като своевременно се извършва актуализирането им във всички приложения и постоянно се поддържа достигнатото ниво на качество;

  • Създаване на възможности на представители на бизнеса да управляват данните и да поддържат тяхното качество;

  • Постигане на по-добри резултати в бизнеса, чрез използване на данни, на които може да се има доверие;

  • Получаване на достъп до данните от всеки източник и въвеждане на централизирани правила за качеството на данните;

  • Интегриране на инструментите за контрол на качеството на данните в корпоративната информационна система.

 

Процеси по постигане качество на данните

 

       Профилиране на данните

Първоначална оценка на данните за определяне в тях на потенциални и действителни недостатъци;

 

        Стандартизация на данните

Инструмент, който действа на основа бизнес правила и осигурява подчиняване на данните на правилата за качество.

Възможна е също автоматична корекция в съответствие с заложени в системата бизнес правила;

 

        Стандартизация на адреси

Използва се за данни, касаещи имена и адреси, като тези данни се коригират в съответствие с пощенските стандарти, приети в САЩ или други страни на света.

 

       Съпоставяне (matching) на данните

Установяване на връзки между подобни, но все пак различни записи, използвайки правила за съпоставяне на данните.

В случаю може да се използва нечетна логика за търсене на дублиращи се данни.

Например:

  • Елементите “Bob” и “Robert” могат да се възприемат като дублирани, обозначаващи един и същи човек.

  • Двама човека се явяват съпрузи, ако живеят на един и същи адрес.

      

       Установяване на най добри версии

Избор на най добри компоненти от множество източници на данни и създаване на «златен» запис.

 

       Контрол

Наблюдение за промените в качеството на данните във времето и известяване за отклонения в качествените показатели.

 

        Почистване на данните в реално време:

След като данните за преминали начално прочистване, процесите по почистване на данните и контрол на качеството им може да бъдат встроени в корпоративните приложения, за да се извършват в реално време.