Inzichten Bouwlagen

Binnen het Data-Science team van Kadaster zijn recent twee voorspelmodellen rondom bouwlagen (verdiepingen) afgerond. De eerste daarvan is het bepalen van, gegeven een verblijfsobject (vbo) zoals een appartement, de verdieping van het pand waarop dit vbo zich bevindt. Deze informatie kan bijvoorbeeld belangrijk zijn voor de tijdsplanning van pakketbezorgers, of om een indicatie te geven van welke vbo's droog blijven bij een overstroming. Het tweede model heeft als doel om het aantal verdiepingen van een gegeven pand te voorspellen. Dit kan onder andere interessant zijn voor de bepaling van energiegebruik, of het voorspellen van renovatiekosten.

Voorspellen van verdieping gegeven een verblijfsobject

Voor dit probleem is een Gradiënt Boosting regressiemodel ontwikkeld op basis van de kenmerken: huisnummer, oppervlakte van het vbo, oppervlakte van het pand, aantal vbo's in het pand en de totale oppervlakte van de vbo's in het pand. De labels/annotaties binnen de trainingsdata zijn afkomstig uit appartementsomschrijvingen van het Kadaster Objecten- en Rechtenregistratie Systeem (KOERS).

Voorspellingen zijn gedaan voor verdiepingen tot en met de 19e verdieping. Voor hogere verdiepingen is alles '20+' gelabeld, wat hier beneden als '20' zal worden getoond. 53% van de voorspellingen kwamen exact overeen met de annotaties, en in 82% van de gevallen zat de voorspelling er maximaal 2 verdiepingen naast. In de toekomst kan dit model verder worden uitgebreid met meer kenmerken, zoals in het onderstaande project. Ook kunnen de voorspellingen van het aantal verdiepingen per pand een waardevolle toevoeging zijn voor een toekomstige revisie.

De voorspellingen zijn als linked data geïmplementeerd en hieronder beschikbaar via een SparQL query. Voer uw gewenste nummeraanduiding in en de voorspelde verdieping zal te vinden zijn onder 'verdiepingsNummer'.

Metadata:

Voorspellen van het aantal verdiepingen gegeven een pand

Vorig jaar is er onderzoek uitgevoerd aan de TU Delft naar dit probleem op een beperkte set gebouwen. Het DST heeft dit uitgebreid naar voorspellingen voor heel Nederland. Er is gekozen voor een XGBoost regressiemodel, dat op basis van geometrische kenmerken zoals hoogte, volume, muuroppervlakte en dak-type uit de 3DBag voorspellingen doet. De informatie in de 3DBag is momenteel gebaseerd op het Algemeen Hoogtebestand Nederland (AHN) versie 3, maar binnenkort zal dit worden bijgewerkt naar AHN4. Andere kenmerken zijn CBS-features uit Kerncijfers Wijken en Buurten 2021, zoals bevolkingsdichtheid, aanwezigheid van horeca in de buurt en het percentage meergezinswoningen. Ten slotte is er informatie gebruikt uit de Basisregistratie Adressen en Gebouwen (BAG), zoals het bouwjaar, aantal aangrenzende gebouwen, aantal hoekpunten van de gebouwgeometrie, gebruiksdoel, aantal vbo's en oppervlakte van de vbo's. De labels binnen de trainingsdata zijn afkomstig uit de gemeenten Amsterdam, Den Haag en Rotterdam, en zijn dus erg gericht op de Randstad.

Voorspellingen zijn gedaan voor elk BAG pand in Nederland. De resultaten zijn opgedeeld in subsets van gebouwen van 1-5 en 6+ verdiepingen. Dit is gedaan om te laten zien dat de kwaliteit van de voorspellingen afneemt voor gebouwen met veel verdiepingen, iets wat we in Nederland niet veel hebben. We zien dat in ongeveer 90,5% van de gevallen het aantal bouwlagen correct wordt voorspeld. Voorheen werden deze voorspellingen puur gebaseerd op geometrie (hoogte gebouw/verwachte verdiepingshoogte) en dit was in minder dan 70% van de gevallen correct.

Metadata:

BouwlagenRMSE (loss)MAEAccuracy (van afgeronde voorspellingen)
1 tm 50.29250.128691.94%
6 tm 471.54820.908642.99%
Totaal0.39480.151990.47%

De query hieronder toont, gegeven een adres dat correspondeert met een verblijfsobject in een bepaald pand, de voorspelling van het aantal bouwlagen van dat pand. De standaardwaarden zijn van het hoofdkantoor van Kadaster: De Grift.

Deze query laat, gegeven een woonplaats, de 10 gebouwen met meeste bouwlagen zien. Klik op een polygoon om de bijbehorende voorspelling te zien.

Ten slotte is het ook interessant om te zien waar in de gespecificeerde woonplaats de hogere gebouwen zich concentreren. Dit kan worden gevisualiseerd met behulp van een heatmap van gebouwen met een totaal aantal verdiepingen boven de aangegeven drempelwaarde.