
Geonick's Diary

Recent diary entries

Wikidata is a free knowledge base for linked open data designed to support Wikipedia and its sister projects, such as Wikivoyage. It contains over 97 million entries structured as a “Labeled Property Graph,” which is more powerful than RDF-based graphs. Like OpenStreetMap (OSM), Wikidata (WD) is an open crowdsourcing project with a large and active community.

Since 2014, OSM can be linked to WD through its tags. Currently, there are about 5.5 million such Wikidata tags with steadily growing popularity. These links can be used to create interesting products, for example a map with castles enriched with factual data from WD. However, the quality of these manually captured links in OSM is as yet unknown and untested. One must also note that the preferred way from WD to OSM - the other way around - is to use only coordinates (WD property P625) - i.e., no WD properties such as P402 are to be used because this covers only OSM relationships.

Now, two computer science students, Jari Elmer and Timon Erhart, from the University of Applied Sciences of Eastern Switzerland (OST), with the help of Sascha Brawer - a young software engineer in “un-retirement” and Wikipedian - have developed an application called “osm wikidata quality checker”. The goal was to check the existing links from OSM to WD. The errors found - for example invalid WD entries in OSM - are also sent to osmose with a suggested correction. Osmose is a quality assurance tool for detecting problems in OSM data. The goal of the application was to become an integral part of OSM’s quality assurance ecosystem. It handles the large amounts of data in the two databases (about 1.5 TB each).

The successful result of the thesis is a data processing pipeline capable of finding diverse types of erroneous Wikidata links in OSM with a high accuracy of >95%. By using multiprocessing and the developed database model, where only the relevant data is extracted, the tool is able to handle the large amount of data and check the whole world on a weekly basis. The difficulties of dealing with crowdsourced data, where unforeseen data errors are to be expected, were also mastered, resulting in a robust software. Documentation and an easy-to-understand architecture allow the tool to be extended and additional checks to be implemented. The optional configuration provides the necessary flexibility in operation and helps with further development.

Currently, a total of over 30,000 errors are found in the following nine categories:

  1. Incorrect value for Wikidata-Tag
  2. Wikidata item does not exist
  3. Redirected value for Wikidata tag
  4. The distance between OSM object and linked Wikidata item is unusually large
  5. Characteristics of the OSM tags and linked Wikidata item do not match
  6. The secondary Wikidata tag and the linked Wikidata item do not match
  7. The OSM object is linked to an unpermitted Wikidata item
  8. Unpermitted link to an instace of living organism on Wikidata
  9. The OSM object does not match the Wikidata item

We are happy that these categories already have been incorporated into Osmose (see e.g. this Tweet) and are ready also to be integrated e.g. in the id editor.

This is the OSM Wiki page of the tool. We are now searching for a permanent place to host this data processing pipeline.

Location: Rapperswil, Rapperswil-Jona, Wahlkreis See-Gaster, St. Gallen, 8640, Switzerland

Bald kann man wieder in der Schweiz die Freizeit draussen verbringen oder Ferien machen. Deshalb möchte ich auch im Namen der Swiss OpenStreetMap Association (SOSM) die Schweiz jetzt schon nach Hause bringen, in Form von Karten - und ganz im Sinne des Slogans “Dream now - travel later!” von Schweiz Tourismus!

Hier eine kleine aber feine Auswahl aus den tausenden von Points-of-Interest (POI), die in OSM zu finden sind. Es ist dies eine Zusammenstellung von Outdoor-Freizeit-Destinationen und Ausflugszielen zum Spazieren, Wandern, Velofahren und allgemein, um Freizeit in der Schweiz zu gestalten, alleine zu zweit oder als Familie - und alles meist kostenlos.

  • Feuerstellen und Grillplätze (Brätlistellen, Brötlistellen): Karten-Demo auf Overpass-Turbo Schweiz (OSM-Tags “leisure=firepit oder amenity=bbq”).
  • Burgen und Schlösser: Burgen-Dossier-Karte der Schweiz und Umgebung.
  • Brunnen (Ziehbrunnen, Sodbrunnen): Brunnen-Karte der Schweiz.
  • Wasserfälle: Karten-Demo auf Overpass-Turbo Schweiz (OSM-Tags “waterway=waterfall” mit Namen).
  • Höhlen und Grotten: Karte tbd. Siehe Taginfo (OSM-Tag “natural=cave_entrance”).
  • Aussichtstürme: Karte tbd. (OSM-Tags "man_made=tower and tourism=viewpoint" oder "tower:type=observation|watchtower").
  • Tischtennistische: Siehe diesen Tweet. (OSM-Tags leisure=pitch mit “sport=table_tennis” oder: “leisure=table_tennis_table”).
  • Kunst im öffentlichen Raum: Karte auf uMap. (OSM-Tags tourism=artwork, artwork_type=installation, name).

Wenn da “Karte tbd.” steht, dann heisst das nicht, dass es die Daten noch nicht in OSM gäbe. Es bedeutet einfach, dass ich noch keine Online-Karte dazu gefunden habe mit offenen Daten. Jede(r) kann mit überschaubarem Aufwand und dem Karteneditor uMap selber eine solche thematische Karte erstellen (vgl. unten).

Man kann übrigens auch jetzt sofort aktiv werden in OpenStreetMap und die eigene Umgebung kartieren helfen mit dem sogenannten uHu-Mapping (“ums-Huus-ume-Kartieren”). Ein Rechtsklick auf genügt, um eine Notiz zu hinterlassen. Auf gibt es Online-Tutorials zum Kartieren und zum uMap-Karteneditor.

Folgen Sie mir und SOSM auf Twitter @sfkeller, @SwissOSM. Kontaktieren uns, wenn Sie Fragen haben: .

Location: Rapperswil, Rapperswil-Jona, Wahlkreis See-Gaster, St. Gallen, 8640, Schweiz