Gilon
Gilon
Adatminőségbiztosítás DQA-val
Gilon - Data Quality Assurance
Az adattárház projektek és üzleti intelligencia projektek egyik legnagyobb kihívása a megfelelő adatminőség biztosítása.
Veszélyek:
A nem megfelelő adatminőség jobb esetben azt okozza, hogy az üzleti intelligencia megoldások felhasználói nem tudnak dolgozni a vállalat adataival. Rosszabb esetben felmérhetetlen károkat okozhat egy rossz döntés meghozatala miatt.
LEGYEN BIZTOS AZ ADATMINŐSÉGBEN - A megoldás
A DQA egy teljesen automatizált folyamatot kínál amellyel a szükséges adatminőséget folyamatosan képes biztosítani. Széleskörű adattesztelési lehetőségeket nyújt kényelmes grafikus felületen keresztül, könnyen kezelhetően. A működése során folyamatosan értesíti az adminisztrátort az eredményekről, akár SMS-ben, e-mailben is, előre beállítható események bekövetkeztekor.
Architektúra
Data Quality Repository
Egy olyan adatbázis amely tartalmazza az összes minőségbiztosítási eljárást definícióját, és az elosztás fogalmát.
- Tesztek
- Teszt típusok
- Test subjects
- Szigorúság minden teszttípushoz
- Lista címzettjei
A Data Quality Job a következőket hajtja végre :
- Paraméterek visszanyerése a repository-ból
- Végrehajtja a teszteket, amik az aktuális eljárások terveztek
- A Data Quality LOGBAN ledokumentálja a teszteket és eredményeket
Data Quality Log
Az adatbázisban eltárolásra kerül minden olyan teszteredmény, ami az adatminőség audit alatt futtattak.
Minden teszteredmény tartalmaz egy önálló azonosítót (ID) és egy töltési dátumot
A DQA kétféle eredmény táblát tesz lehetővé:
- Két tábla minden teszttípushoz (egy részletes és egy aggregált)
- Tabulált összegzések az eljárások eredményéről
Teszt Típusok
- Cross Footing - Összehasonlítás az adatforrás és a DWH között (Count, Sum, Sample)
- Thresholds - Határértékekkel kapcsolatos adatok megbízhatósága (History data, Constants)
- Slowly - Lassan változó dimenziók tesztelése
- Uniqueness - Kulcs egyediség ellenőrzés
- Combination - Értékkombinációk érvényességének ellenőrzése
- Referential Integrity - A tény és dimenzió táblák közti integritás
- Value Validation - Üzleti szabályok szerinti adat érvényesség
- Full Overlap - Vonatkozó integritások, átfedések, duplikációk
- General - Free hand SQL
Súlyossági szintek
a rendszer 4 súlyossági szintet tud rendelni minden egyes teszttípushoz.
Például:
- 0% - 10% - rossz rekordok
- 10% - 20% - rossz rekordok
- 20% - 60% - rossz rekordok
- 60% - 100% - rossz rekordok
Distribution Job
Az értesítő motor képes minden DQA felhasználó részére értesítéseket küldeni
- Mely releváns forrásrendszerre vonatkozik
- Alkalmazott szigorúsági szint
Információközlés: SMS, E-mail, Report
Teszteredmények
Minden egyes teszt során a rendszer az alábbi eredményeket tárolja:
- megvizsgált bemenő rekordok száma
- rossz bemenő rekordok
- rossz értékek száma
- Százalékos analízis
- Szigorúsági analízis





