High2x2 - #Energie Knowledge Graph

Introductie

De voortgang van de energietransitie moeten we kunnen volgen. We willen weten of we op de goede weg zijn bij het behalen van onze doelstellingen, dus b.v. of er voldoende windmolens zijn geplaatst en gepland. Daarnaast willen we weten waar ze staan, om b.v. te kunnen inschatten of ze goed ruimtelijk zijn ingepast, of ze een veiligheidsrisico vormen. Na een kort zoekrondje op internet binnen de publieke sites, blijkt het lastig om een eenduidig antwoord te vinden op b.v. de relatief makkelijke vraag hoeveel windmolens er per provincie zijn.

Vanuit VIVET hebben we onderzocht of het stelsel van basisregistraties een eenduidig antwoord zou opleveren. We hebben juist in de basisregistraties gezocht, omdat het proces van actualisatie door o.a. gemeenten, wettelijk is geregeld en overheden de basisregistraties verplicht moeten gebruiken. We zien dat de verschillen in aantallen windmolens op de publieke sites. De verschillen lijken grotendeels te verklaren door het verschil in moment-opname en de definities gehanteerd binnen het inwinningproces.

De keuze voor het verzamelen van gekoppelde informatie aan de basisregistraties is het faciliteren van zowel actualiteit alsook flexibiliteit. Hierbij willen we niet steeds losse koppelingen maken met gedownloade databestanden, waarmee niet beide randvoorwaarden optimaal worden gefaciliteerd. Door te werken met dynamische koppelingen in een gekoppeld (federatief) stelsel, houden we meer actualiteit in het overzicht en flexibiliteit in het type gewenste vragen/informatie. We hebben daarom gekeken naar het opstellen van een Knowledge Graph van de basisregistraties, die we ook gekoppeld hebben aan data van andere overheden, zoals b.v. atlas van de leefomgeving van RIVM en RVO over de SDE-subsidie.

Opmerking: we presenteren op deze pagina de resultaten uit twee focusdagen waarin gegevens van de BGT, BRT, RIVM en Topstakels werden gecombineerd en geanalyseerd. Het resultaat staat in de #Energie Knowledge Graph. De herkomst van de data zal in verdere iteraties worden toegevoegd aan de grafiek, zodat ook de originele gegevens kunnen worden getraceerd. Door deze actieve koppeling naar de originele gegevens, houden we het #Energie Knowledge Graph met minimale inspanning actueel. Ook kunnen we makkelijk koppelingen naar andere open-data sources koppelingen maken, zoals b.v. het SDE subsidie bestand van RVO.

Federatief Stelsel

Het Kadaster werkt aan de ontwikkeling van een federatief stelsel van basisregistraties. Dit stelsel maakt gebruik van linked data technologieën en heeft als voordeel dat verschillende datasets worden bijgewerkt en onderhouden door bestaande processen (data wordt bij de bron gehouden) maar vervolgens kunnen worden gecombineerd voor verschillende use-cases, zoals voor gebruik in de #Energie Knowledge Graph. Maatwerkvragen waarvoor gegevens uit meerdere registers nodig zijn, kunnen vervolgens binnen een centrale omgeving worden gesteld en beantwoord!

Momenteel het Stelsel van Basisregistraties ontsluit tien basisregistraties voor meervoudig gebruik. Helaas is dit niet genoeg voor de aanpak van de grote maatschappelijke opgaven want die hebben vaak informaties vanuit verschillende domeinen nodig. De ambitie is om de gegevens uit die registraties ook als ‘basisdata’ beschikbaar te laten zijn in een uitgebreider stelsel. Daarvoor wordt er gewekt aan een federatief stelsel met als uitgangspunt om data niet op een centrale plek te verzamelen, maar deze in de sectoren te houden, daar waar ze horen, bij de bron. Dit voorkomt het onnodig kopiëren van gegevens met kans op fouten.

Meer lezen: https://www.digitaleoverheid.nl/achtergrondartikelen/federatief-datastelsel-het-organiseren-van-vertrouwen/

Data Preparatie

De volgende stappen zijn genomen bij het voorbereiden van gegevens voor het maken van de Knowledge Graph:

  1. De BRT en de BGT zijn beide opgevraagd om de geïdentificeerde gegevens te retourneren die nodig zijn voor opname in de Knowledge Graph. Het datamodel in de volgende sectie laat zien welke attributen zijn gemaakt met welk basisregistratie.
  2. Er is een subselectie gemaakt van gegevens van zowel het RIVM als de topstakels (waaronder alleen de gegevens die betrekking hebben op windturbines en van belang zijn voor dit project). Elk van deze is getransformeerd naar gekoppelde gegevens en deze versies zijn hier te vinden voor Topstakels and hier voor RIVM.
  3. Om alle gegevens uit de verschillende bronnen aan elkaar te koppelen, is het noodzakelijk om een koppelset tussen beide te creëren. Hiervoor werd in ArcGIS pro een ruimtelijke join gedaan op basis van de geometrie van de windturbines uit elke dataset en vervolgens werd deze koppelset getransformeerd om data te koppelen. De koppelset zelf is hier te vinden.
  4. Om de data naar het gedefinieerde datamodel te projecteren en de uiteindelijke #Energie Knowledge Graph te maken, waren een aantal SPARQL-constructquery's nodig. Deze zijn als volgt:
  1. Nadat alle gegevens waren gegenereerd met behulp van de constructquery's, werden alle graphs hier geladen, inclusief de datamodelen en is de #Energie Knowledge Graph voltooid.

Voor een compleet en visuele overzicht van het proces zie onderstaande figuur.

Figuur 2. Proces overzicht

Als u een of alle onderliggende datasets wilt downloaden, gebruik dan de query's die in dit story zijn gedefinieerd.

Data Model gebruikt voor Energie Knowledge Graph

De volgende afbeelding belicht het gegevensmodel dat wordt gebruikt bij het transformeren en koppelen van gegevens uit de verschillende gegevenssets om de #Energie Knowlegde Graph te vormen. Als u een interactieve versie van dit model wilt bekijken, gaat u naar: Weaver

Figuur 2. Voorgesteld datamodel voor de eerste iteratie van de #Energie Knowledge Graph

De volgende secties worden gebruikt om de inhoud en het nut van de #Energie Knowledge Graph te benadrukken. Elke sectie beantwoordt een bepaalde vraag zoals gedefinieerd door potentiële gebruikers van de Graph.

Inhoud van de #Energie Knowledge Graph

1. Hoeveel windturbines hebben we in Nederland volgens de #Energie Knowledge Graph en volgens de onderliggende datasets?

Het volgende gedeelte geeft enig inzicht in de inhoud van de #Energie Knowledge Graph. Hieronder ziet u de verschillen in het aantal windturbines dat in elke onderliggende dataset zit en het totale aantal windturbines dat in de #Energie Knowledge Graph staat. Merk op dat topstakels het hoogste aantal windturbines heeft omdat deze dataset ook die in de zee bevat.

Onderstaande kaart geeft een overzicht van alle windturbines in Nederland volgens de #Energie KG. Als u inzoomt op een punt en op het punt klikt, kunt u wat informatie over die windturbine zien. Als u zelf op probeer deze query klikt en de weergave wijzigt in een tabelweergave, kunt u deze informatie downloaden voor gebruik in uw eigen systeem.

2. Toon de windturbines per een bepaalde gemeente.

De volgende query toont alle windturbines die een specifieke bronhouder hebben, in dit geval Amsterdam. Omdat de enige onderliggende dataset die informatie over een bronhouder bevat de BGT is, zijn windturbines in de #Energie KG die een bronhouder hebben ook alleen die welke ook in de BGT voorkomen.

3. Toon de alle windturbines met een hoogte die minder dan 20 meters zijn.

De #Energie KG bevat ook informatie over de hoogte van de turbines. De volgende query toont al die turbines die korter zijn dan 20m.

Toetsing Volledigheid van Bronnen

Onderstaande query geeft enig inzicht in de verschillen tussen de onderliggende basisregistraties.

1. Welke windturbines staan wel in de BRT en niet in de BGT en andersom?

Het antwoord op deze vraag wordt visueel weergegeven. De rode iconen markeren windturbines die zijn gedefinieerd in de BGT en de blauwe iconen markeren windturbines die zijn gedefinieerd in de BRT. Als u op een pictogram klikt, kunt u wat informatie over de windturbine zelf zien.