GeoSPARQL Compliance/Performance Uitdagingen [NL]

Performance

Er zijn verschillende performance uitdagingen op de huidige versie van onze Linked Data bronnen. Deze tonen we hieronder.

Thema 1: Geo-Performance

Er zijn verschillende queries die een slechte geo-spatiële performance hebben. Deze kunnen we onderscheiden in twee problemen:

  • slechte performance qua tijd.
  • inaccurate resultaten.

We kijken eerst naar slechte performance in tijd. Wanneer een andere gemeente (i.e. geen caching) of een groter limiet wordt gekozen komen er meteen grote problemen naar boven.

Wegen binnen een buurt

Inaccurate resultaten

Daarnaast zijn er verschillende geobevragingen die simpelweg incorrecte resultaten geven. Zie onder andere de onderstaande query.

Alle polygonen die een intersect hebben met een punt

Thema 2: Uitdagingen in de SPARQL Query Optimisation

De meeste administratieve queries weren als een trein, maar soms lijkt er om redelijk onverklaarbare redenen een query niet of heel slecht resultaten terug te geven. Dat kan soms komen door één extra attribuut of één extra relatie.

Administratieve Query over alle datasets vh Kadaster

Thema 3: Duplicate Results

In sommige gevallen geeft een SPARQL query onverwachte duplicate resultaten terug. Dit zorgt dus voor foutieve query resultaten. Een minimum working example is hieronder gegeven, wanneer een pand status voor één pand ervoor zorgt dat het aantal rijen verdubbeld wordt, ondanks dat dit één karakteristiek is van een pand.

Deze situatie viel op vanuit de KTH data story, maar zit waarschijnlijk in verschillende queries wel genesteld.

Duplicate resultaten van een bevraging

Thema 4: Federatie

Ook federatieve (geo-) bevragingen werken nog niet. Als er meer dan één service benaderd wordt gaat de performance door de grond.