„Data Vault“ yra sudarytas iš trijų pagrindinių sluoksnių:
- Stage - tai yra laikina saugojimo vieta tarp duomenų šaltinių (angl. Data sources) ir duomenų saugyklos (angl. Data Warehouse). Šios saugojimo vietos naudojimas pagreitina duomenų nuskaitymą.
- Vault:
- Operational Data Vault (ODV) - šio sluoksnio objektai saugo neapdorotus ir nepakeistus aktyvius ir istorinius duomenis. Vienas iš operatyvinės saugyklos tikslų – sudaryti galimybę visapusiškai audituoti pradinius duomenis.
- Business Data Vault (BDV) - šio sluoksnio siekis yra sumažinti tolesnių biznio taisyklių kartojimą. Jis sulygiuoja verslo raktus bei sąlygas (terms) iš neapdoroto duomenų šaltinio su galutiniu verslo vaizdu, būtent šis sluoksnis užtikrina atitikimą tarp neapdorotų duomenų ir biznio taisyklių.
- Mart - šis duomenų saugojimo sluoksnis yra orientuotas į vieną temą/verslo sritį. Naudojant šį sluoksnį vartotojai gali greičiau ir patogiau padaryti įžvalgas, nes visi susiję duomenys yra vienoje vietoje ir nereikia gaišti laiko norint išrankioti duomenis iš sudėtingų duomenų saugyklų.
- HUB tai atskiras objektas (lentelė) kurioje yra saugoma unikalus biznio raktų (angl. Business Key) komplektas bei metaduomenys, kada ir iš kur įrašas buvo įterptas. Dažniausiai atskira HUB lentelė indikuoja atskira verslą dominantį objektą, pvz.: kompanija, darbuotojas, sąskaita.
- SATELLITE tai lentelė, kuri tiesiogiai yra susijusi su pagrindiniu HUB objektu. Satellite lentelėje yra saugomas unikalus HUB raktas, meta duomenys, kurie indikuoja kada įrašas buvo patalpintas, įrašo galiojimo pabaigos data, bei kiti verslui svarbūs duomenys, tokie kaip: darbuotojo vardas, pavardė, gimimo data, ir t.t.
- LINK lentelėje yra saugomi dviejų arba daugiau HUB lentelių surogatiniai raktai. Ši lentelė kitaip gali būti vadinama kaip sąryšio „daug-su-daug“ (angl. Many-to-many) tarp skirtingų (arba ne) HUB lentelių.
- LINKSATELLITE (LSAT) tai šiek tiek kitokio tipo lentelė, kuri saugo kontekstinius duomenis kurių raktas yra ryšys tarp dviejų ar daugiau HUB lentelių, t.y. LSAT yra tiesiogiai susijęs su LINK. Kaip pavyzdį galėtume paimti skirtingus objektus “Parduotuvė” ir “Produktas”. Tarpusavyje šie skirtingi objektai yra visiškai susiję, todėl tam reikalinga LINK lentelė. O norit duomenis saugoti remiantis šiuo ryšiu, reikalinga LSAT lentelė, kurioje galėtų būti saugomi tokie duomenys: [Prekės kiekis sandėlyje], [Kaina parduotuvėje], [Prekės galiojimo pradžia], [Prekės galiojimo pabaiga].
Tai kokią gi naudą duoda ir kaip gali sužibėti Data Vault?
- Vienas pagrindinių privalumų naudojant DataVault yra duomenų pasikeitimo istorijos sekimas/duomenų judėjimas.
Kiekvienos naujos duomenų eilutės pridėjimas, atnaujinimas ar pašalinimas yra fiksuojamas, to pasekoje matomas tikslus laikas kuomet eilutė buvo pridėta, atnaujinta ar pašalinta iš sistemos. Su kiekvienu duomenų atnaujinimu (update) eilutė yra įterpiama kaip nauja eilutė į SAT arba LSAT objektus. Tuomet senosios versijos duomenų eilutė pažymima kaip nebegaliojanti, o atnaujinta eilutė kartu su fiksuotu tiksliu atnaujinimo laiku yra įterpiama į lentelę. - Efektyviausias kuomet duomenys atkeliauja iš įvairių duomenų šaltinių.
Kartu su laiko žymėmis duomenų eilutė taip pat turi ir duomenų šaltinio informaciją. Taip galima nesudėtingai atsekti iš kurio šaltinio atkeliavo duomenys. - Puikiai pritaikomas skaitant ne tik failus su pilna duomenų istorija (angl.full file), bet taip pat ir nepilnus (angl. incremental) failus.
Data Vault metodologiją pritaikome kasdien
twoday esu BI programuotoja Valmet BAM projekte. Lyderio poziciją pasaulyje užimanti Valmet kompanija kuria automatizavimo sistemų ir srauto valdymo sprendimus, kurie pritaikomi masyvo, popieriaus ir energijos pramonės šakose.
Verslo analitikos Valmet BAM projekte kiekvieną dieną jau kelis metus sėkmingai dirbame pagal Data Vault metodologiją. Iš įvairių duomenų bandome sistemingai išgauti naudingą informaciją kientui, kuri padėtų jo verslui.
Žinoma, neapsiribojame tik naujų duomenų sisteminimu, kiekvieną dieną kuriame raportus, tobuliname jau esamą logiką ir ieškome kaip galėtume pagerinti rezultatų pateikimą klientui.
Matydami Data Vault’o naudą rekomenduojame šią metodologiją pritakyti ir jūsų projekte 😊