/
Metod för Masterdataarkitektur

Metod för Masterdataarkitektur

Beskrivning

Arkitektur-perspektiv

Verksamhets-område

Publicerad / Version

Beskrivning

Arkitektur-perspektiv

Verksamhets-område

Publicerad / Version

Här introduceras masterdatahantering och vägledning för arbete med masterdataarkitektur.

Information

Alla

2022-05-03/62

Innehållsförteckning


Introduktion

Masterdata är data av referenskaraktär som nyttjas av flera olika system och/eller verksamhetsprocesser inom en organisation. Vilka data som skall klassas som masterdata styrs främst av verksamhetens behov och som regel är det de företeelser som har störst betydelse för den organisation som genererar de data som brukar klassas som masterdata. Vanliga exempel på masterdata är data om kunder, anställda, medborgare, leverantörer, avtal och produkter.

Masterdatahantering syftar till att säkerställa hög kvalité på masterdatat genom att minska risken för redundans och datainkonsistens i de system som använder masterdatat. För att åstadkomma detta är det viktigt att kartlägga verksamhetsperspektivet, dvs hur informationsmängder/objekt produceras och bearbetas i olika processer eller värdeflöden. Från verksamhetens beskrivning av hur information hanteras definieras masterdatamodeller som kan implementeras i IT-system och integrationer mellan dessa. I masterdatahantering ingår även de aktiviteter som görs för att kontinuerligt förbättra datats kvalité, exempelvis att hantera dubletter, ta bort inaktuellt data mm.

Denna vägledning riktar sig främst till arkitekter som behöver förstå hur de på bästa sätt kan bidra till en effektiv masterdatahantering och ett högkvalitativt masterdata. Följande aktiviteter är de som arkitekter i huvudsak är inblandade i:

  • Analys av behov av masterdata och masterdatahantering

  • Informationskartläggning genom exempelvis processanalys och informationsklassning

  • Informationsmodellering för att definiera struktur och samband mellan informationsobjekt

  • Skapande av datamodeller och regler för masterdata

  • Beskrivning av var masterdata lagras och hur det utbyts i nuvarande och framtida lösningar

  • Beskrivning av arkitektur för masterdatalösningar

Nyttor med masterdatahantering

Enligt undersökningar som http://tdwi.org har genomfört rapporterar 75% av organisationer att inkonsekventa definitioner av gemensamma termer och manuell inmatning av data är de vanligaste bidragande faktorerna för problem med datakvalitet.

Masterdatahantering skapar förutsättningar för att gemensam data blir tillgänglig, korrekt samt jämförbar för enheter och organisationer. Detta leder till följande nyttor för organisationen:

  • Skapar förutsättning för automatisering eftersom data blir mer tillförlitligt

  • Bidrar till tillförlitligt beslutsstöd där data från olika källor analyseras

  • Ger enhetligare begreppshantering genom arbete med gemensamma datamodeller

  • Möjliggör interoperabilitet och samverkan inom och mellan organisationer

  • Tydliggör och effektiviserar informationshantering och dataflöden genom distribution och synkronisering av masterdata

  • Bidrar till att hantera information (data) som en värdefull tillgång.

Taxonomi för data

Det finns många olika sätt att kategorisera och förklara olika typer av data. Dessa klassificeringar är viktiga för att förstå vad som är masterdata och inte, dvs vad som ska ingå i masterdatahantering och inte.

De huvudsakliga typerna av data, de som i princip finns med i alla taxonomier för data är:

  • Masterdata, d v s data av referenskaraktär som nyttjas av flera system och/eller verksamhetsprocesser inom en organisation som exempelvis anställda, tjänster och leverantörer.

  • Transaktionsdata, d v s data som representerar någon form av transaktion eller händelse i verksamheten som exempelvis en faktura, bokning eller beställning.

  • Metadata, d v s data som definierar och beskriver annan data som exempelvis vilket format data har eller från vilken källa data härrör.

Utöver dessa förekommer i varierande grad andra typer så som:

  • Ostrukturerad data, d v s data som inte har något bestämt format som exempelvis löpande text i ett e-postmeddelande eller i ett dokument.

  • Hierarkisk data, d v s relationer mellan data som exempelvis delegationsordning, organisationsstruktur och produktstruktur.

  • Samt en lång rad andra typer så som referensdata, mätdata och grunddata.

Här är de källor som använts för identifikationen ovan.

Ett exempel ur ISO 8000. Notera att syftet är att visa masterdatas kontext, inte att vara en komplett taxonomi för data.

Exempel från material av Kimmo Ulltjärn, Region Östergötland.

I materialet beskrivs kategorierna enl. nedan:

  • Ostrukturerad data är information som inte har något bestämt format och som är svår att koppla till ett informationsobjekt t.ex. information i e-post, löpande text i en artikel eller liknande.

  • Transaktionsdata beskriver en händelse t.ex. ett vårdbesök, en rumsbokning eller en faktura

  • Masterdata är grundinformation om objekt som är viktiga för verksamheten t.ex. information om personer, organisationen, kunder och produkter (har livscykel, ändras över tid)

  • Referensdata är en lista över tillåtna värden i datafält, t.ex. kodverk, landskoder och måttenheter

  • Metadata är data om data t.ex. modeller

Ett visuellt exempel på hur information vid ett läkarbesök kan kategoriseras:

Ett visuellt exempel på hur produktinformation kan kategoriseras:

Exempel från Microsoft, taget ur ett white paper författat av Roger Wolter and Kirk Haselden 2006.

Enligt Microsoft utgör de kritiska substantiven för en verksamhet masterdata, och ryms som regel i någon av följande fyra grupper: människor, saker, platser och koncept. En djupare kategorisering av dessa grupper ger något som kallas datadomäner eller subject areas. Inom exempelvis ”människor” är det t.ex. möjligt att identifiera kund, anställd och säljare. Inom ”saker” kan ett företag ofta identifiera produkt, del av produkt och tillgång emedan en tjänsteproducerande organisation som en kommun kan betrakta även en tjänst som en produkt. Inom koncept återfinner vi företeelser som kontrakt, garantier och licenser. Inom området ”platser” återfinner vi adresser för kontor, geografiska indelningar och fastighetsdata. Dessa datadomäner kan i sin tur ofta brytas ner i mindre delar. Olika grupper och datadomäner har olika stor betydelse för olika typer av organisationer. ”Saker” har större betydelse för en tillverkningsindustri emedan ”Kund” eller dess motsvarighet som regel är det som har störst betydelse för en tjänsteproducerande organisation. Graden av nedbrytning styrs även det av behoven i verksamheten.

Exempel från Malcom Chisholm.

Jämfört med Microsoft bortser Chisholm från det som Microsoft kallar ”ostrukturerad data” men identifierar i likhet med Microsoft både ”metadata” och ”transaktionsdata”. Chisholm skiljer dock på ”Transaction Activity Data” och ”Transaction Audit Data” där det senare främst syftar på data i loggar som sällan är av intresse för andra än IT-driftspersonal och säkerhetsansvarig emedan ”Transaction Activity Data” i princip definieras på samma sätt som Microsoft definierar ”transaktionsdata” dvs. det transaktionsberoende data som primärt hanteras i våra processflöden.

Den avgränsning som Chisholm gör av vad som är att betrakta som masterdata är något vidare då han även inbegriper det Microsoft kallar ”hierarkisk data” i en kategori han kallar ”Enterprise structure data”. Som exempel på data inom denna kategori anger Chisholm ”CoA” (Chart of Accounts = kontoplan) och ”Organisation Structure”. Även delar av det som Chisholm kallar ”Reference Data” dvs. ”Code Tables” och ”Taxonomies” (indelning, klassificering) skulle förmodligen kunna klassas som ”hierarkisk data” om vi strikt följde Microsofts upplägg.

Den sista typen av masterdata som beskrivs av Chisholm är den kategori som rymmer ”Product” och ”Customer”. En masterdatatyp han kallar ”Transaction Structure Data”. Begreppet har sitt ursprung i att Chisholm betraktar objekten i denna kategori som antingen produktionsobjekt dvs. ”det som organisationen hanterar” eller aktörer dvs. ”de som hanterar produktionsobjekten”. Tillsammans utgör de enligt Chisholm organisationens ”transaktionsstruktur”.

Förmågor för masterdatahantering

Förmågan Masterdatahantering definieras på sidan OLD-Verksamhetsstöd - Förmågekartaarchived som följer:

Förmågan att identifiera, definiera, underhålla och styra data av organisationsgemensamt intresse.

Denna förmåga kan i sin tur brytas ner i flera underliggande förmågor som beskriver i mer detalj vad verksamheten behöver göra. Bilden nedan visar dessa förmågor grupperade i fyra olika områden som har valts för att skapa en struktur i vägledningen:

 

Område

Förmåga

Beskrivning

Område

Förmåga

Beskrivning

Analys

Behovsidentifikation

Förmågan att identifiera verksamhetens behov av masterdata

Analys

Masterdatamodellering

Förmågan att analysera, klassificera och beskriva datamodeller för masterdata

Analys

Masterdatakartläggning

Förmågan att inventera och beskriva var masterdata finns och vad det används till

Datalogistik

Dataextraktion

Förmågan att lokalisera, säkra access och hämta masterdata från källsystem

Datalogistik

Datatransformation

Förmågan att tvätta, validera och filtrera data gentemot definierade regler och krav

Datalogistik

Masterdataunderhåll

Förmågan att underhålla och säkra kvalitet i masterdata

Datalogistik

Masterdatadistribution

Förmågan att distribuera och tillgängliggöra masterdata till de verksamheter och system som  behöver använda datat

System-livscykel-hantering

Systemdefinition (se OLD-Verksamhetsstöd - Förmågekartaarchived )

Förmågan att skapa och beskriva i detalj ett system som kan tillgodose ett identifierat behov

Styrning/ ledning

Styrning av masterdatahantering

Förmågan att sätta strukturer och ramar för masterdatahantering

Styrning/ ledning

Ledning av masterdatahantering

Förmågan att exekvera inom beslutade strukturer och fatta beslut för masterdatahantering

Arkitekturrelaterade aktiviteter per förmåga

Här beskrivs de aktiviteter som normalt sett utförs av arkitekter inom respektive förmåga för masterdatahantering.

Analys

Detta förmågeområde innehåller förmågor som handlar om att analysera masterdata vilket till stor del är en uppgift för arkitekter. För att uppnå förmågorna krävs att ett antal aktiviteter genomförs och det behövs även stödjande tekniska verktyg för att underlätta arbetet och spara resultatet. Aktiviteterna och därmed också förmågorna är tätt sammankopplade med varandra och ofta arbetar man med flera perspektiv samtidigt.

Det finns två huvudsakliga angreppssätt att identifiera vad som är masterdata inom en verksamhet. Det ena är att analysera verksamheten uppifrån och ner, dvs att utgå från strategi och identifiera vilket masterdata som behövs för det som verksamheten ska göra och det andra är att titta nerifrån och upp, dvs att analysera vad verksamheten faktiskt gör och hitta behov av data för användning i flera olika processer och tekniska system.

Behovsidentifikation