Datakwaliteit issues

Technische data over de assets kent vele verschijningsvormen en is een lange periode ontstaan. Een periode waarin de ontwikkeling van informatievoorziening en informatiedragers spectaculair is geweest. Deze bonte verzameling zodanig structureren dat aan de hedendaagse eisen tegemoet is te komen, mag met recht een uitdaging heten.

.

Aan de data over de assets stellen we hoge kwaliteitseisen. Daarbij spelen aspecten als volledigheid, juistheid, aanwezigheid, actualiteit en een  juist abstractieniveau een belangrijke rol. Om deze kwaliteit te kunnen realiseren en borgen moeten we de nodige uitdagingen overwinnen:

Informatiedragers

(kan ik erbij?)
De ontwikkeling van de automatisering heeft geresulteerd in een scala aan informatiedragers en variatie daarbinnen:

 – Analoog (Papier, transparant tekening)

– Gescand (Microchip, foto’s/dia’s)

– Digitaal

  • bestanden, databases, gestructureerd, ongestructureerd
  • tekst, (geo)grafisch, image, audio, video
  • tapes, floppy’s, harddisks, cd’s, dvd’s, usb’s, (netwerk)schijfsystemen
  • formaten
    • tekst/spreadsheet-files
    • database (Oracle, Ingres,..)
    • image (tif, pdf, jpg, pgn, …)
    • tekening formaat(dwg, dgn, fgb, shp,MID/MIF,…)

Waarbij ook nog het versienummer als extra dimensie een rol speelt. Voor sommige data geldt al dat deze niet meer te lezen is omdat de hardware (computers en drivers) en software niet meer beschikbaar is.

Structuur

(kan ik het begrijpen?)
Ook de logische opbouw van de asset data vormt vaak een uitdaging. Uitleg structuur (de metadata) ontbreekt vaak, en omdat door fusies, samenvoegingen en dergelijke vaak ook verschillende structuren naast elkaar bestaan is een ware puzzel ontstaan. Hier speelt de aanwezige kennis binnen organisaties een belangrijke rol, kennis die zich aan het voorbereiden is op de gepensioneerde jaren…

Compleetheid

(heb ik alles?)
Als we erbij kunnen en het ook begrijpen is de volgende vraag:

  • Hebben we de data die we vandaag (en morgen) nodig hebben?
  • Kunnen we de asset (object)structuur afleiden van de oude tekeningen?
  • Kunnen we de attributen van objecten in de oude bestanden achterhalen?
  • Hebben we alle attributen, of kunnen we die afleiden uit andere data?

Correctheid en Consistentie

(klopt het ook?)
Een volgende stap is kritisch naar het plaatje van de asset data kijken en controleren of de data overeenkomt met de werkelijkheid.

  • Zijn alle mutaties verwerkt?
  • Kloppen de objectgegevens in verschillende omgevingen met elkaar?
  • Is de data en zijn de relaties ertussen logisch?

Kwaliteitsdoel

(goed is goed genoeg!)
Belangrijk bij dit alles is ook na te denken over het kwaliteitsniveau van de data dat we nastreven. In het proces om de data op orde te brengen spreekt Net4s een kwaliteitsdoel af voor de initiële dataschoning. Omdat de laatste procenten verhoudingsgewijs duur zijn, kunnen we daar ook anders mee  omgaan. Bijvoorbeeld deze opschonen wanneer de data operationeel toch door de handen gaat. Zie ook uitwerking Tricycli concept:  Data op Orde fase.