Harmonisering av geodata

Här kan du läsa om harmonisering av geodata.

Vad menas med harmonisering av geodata?

Två datamängder kan sägas vara harmoniserade med varandra om det inte finns några uppenbara motsägelser dem emellan.

Motsägelser mellan två datamängder

Möjliga motsägelser kan exempelvis vara variationer i kartografiskt manér, skillnader i geometrisk upplösning, skillnader i användning av begrepp, skillnader i klassificeringssystem med mera.

Hur reducerar jag motsägelserna?

Ett sätt att reducera motsägelserna mellan två datamängder är genom att använda gemensamma dataspecifikationer. Tanken här är att dessa dataspecifikationer skall vara så pass detaljerade att eventuella kvarvarande motsägelser inte reducerar användbarheten av datamängderna.

Inom INSPIRE-arbetet har flera detaljerade dataspecifikationer utarbetats, en för varje tema. Detta innebär att begreppet ”dataharmonisering” för många har kommit att likställas med processen att, genom en datatransformation, säkerställa att den egna datamängden uppfyller de krav som anges i dataspecifikationen.

Beskrivning av strukturen hos en datamängd

Ett schema definieras här som en formell beskrivning av strukturen hos en datamängd. Denna struktur kan exempelvis vara trädorienterad (XML), relationsorienterad (GeoPackage), platt (Shape eller GeoJSON) eller baserad på tripletter (RDF).

Vad innebär begreppet schematransformation?

Begreppet schematransformation innebär här att data transformeras från en struktur till en annan. Ofta ingår också en semantisk transformation i denna process, det vill säga man anpassar namnsättningen av objekttyper och attribut till de regler som anges i dataspecifikationen.

För många har därför begreppet ”schematransformation” kommit att likställas med begreppet ”dataharmonisering”. Men för att geodata ska kunna anses vara harmoniserade fullt ut, och särskilt i ett gränsöverskridande perspektiv, behöver ett flertal frågeställningar beaktas och inkluderas i hela transformationsprocessen.

Frågeställningar

Standardiserad datastruktur

Strukturen hos en datamängd kan beskrivas av ett schema. Om dataleverantörerna använder standardiserade scheman, så kan de effektivt bearbetas av olika användare.

Standardiserade rumsliga referenssystem

Standardiserade geodetiska referenssystem är en grundläggande förutsättning för att kunna kombinera geodata från olika källor, och för att möjliggöra gränsöverskridande sampresentationer och analyser.

De flesta moderna GIS-klienter klarar idag av att i realtid transformera mellan olika standardiserade rumsliga referenssystem. Begreppet ”standardiserade rumsligt referenssystem” innebär här att referenssystemet skall finnas definierat i EPSG’s register, där det anges med en EPSG-kod.

Geometrisk överensstämmelse

För att kunna utföra vissa beräkningar, behöver datamängderna överensstämma rent geometriskt, till exempel vid nationsgränser. För att exempelvis utföra ruttplanering över en nationsgräns krävs att vägarna på bägge sidor av nationsgränsen ansluter till varandra.

Liknande krav finns för vattendrag och andra datateman. Kravet på geometrisk överensstämmelse gäller vid alla typer av gränser där data från två olika källor ska kombineras, således också vid regiongränser och kommungränser.

Kravet gäller också när man kombinerar olika teman. En väg kan exempelvis inte korsa ett vattendrag utan att det ansluts till en bro, tunnel eller färjelinje.

Geometrisk överensstämmelse kan också vara viktigt vid visuell betraktning av flera datamängder. Trovärdigheten för datamängderna minskar om det finns uppbenbara glapp mellan företeelser som ska vara sammanhängande.

Enhetlig datakvalitet

Information används framför allt för att fatta beslut och säkerheten i dessa beslut beror till viss del på kvalitén i de datamängder som utgör beslutsunderlaget. INSPIRE anger inga riktlinjer gällande noggrannhet eller detaljeringsgrad för olika geodatamängder.

Däremot har Europakommissionen uttryckt att om en typ av geodata förekommer i flera olika skalor (detaljeringsgrad), så ska geodata tillhandahållas i samtliga skalor.

I rasterdata anges, som regel, detaljeringsgraden i form av rastrets upplösning, dvs hur stor del av marken som återspeglas i en pixel i rastret.

Enhetligt kartografiskt manér

Ett enhetligt kartografiskt manér gör det möjligt att presentera internationella data på ett enhetligt sätt. Detta ökar den visuella läsbarheten och användbarheten av exempelvis gränsöverskridande visningstjänster.

I INSPIRE’s dataspecifikationer finns kartografiska manér angivna som kan användas för presentation av data i visningstjänster. Ibland är de alltför basala och kan behövas modifieras. Detta blir ännu tydligare när flera visningstjänster läggs på varandra i syfte att skapa en egen-definierad produkt för ett speciellt användningsområde.

Enhetlig användning av begrepp

Genom att använda väl definierade och allmänt accepterade termer och begrepp, minskar risken för att betydelsen av information missförstås. I INSPIRE har betydelsen av objektklasser och attribut specificerats i INSPIRE’s dataspecifikationer, i så kallade objektkataloger.

Att använda dessa internationellt vedertagna begrepp i sina data kallas semantisk harmonisering. Man kan kalla det för att man använder samma semantiska referenssystem.

Informationsmaterial

Instruktionsfilmer till dataharmonisering finns på svenska på youtube.com:

Vanliga frågor om dataharmonisering (nytt fönster).

Utbildningsmaterial om INSPIRE och dataharmonisering finns på INSPIRE:s webbplats:

För att följa dessa kurser krävs att man först registrerar sig på Geospatial Knowledge Base (GKB) Training Platform.