Scott Tiger Tech Blog

Blog technologiczny firmy Scott Tiger S.A.

Polski OpenStreetMap: struktura i zawartość

Autor: Piotr Karpiuk o niedziela 10. Kwiecień 2016

OpenStreetMap to „wikipedia obiektów geograficznych” – baza praktycznych danych geograficznych rozwijana przez wolontariuszy na całym świecie, zbierających dane o swojej okolicy. Na pierwszy rzut oka OSM to po prostu mapa topograficzna, w dodatku niezbyt atrakcyjna w porównaniu z Google Maps czy Bing Maps. To jednak tylko złudzenie. OSM to baza danych, a mapa topograficzna jest tylko jedną z wielu możliwych wizualizacji, która – jak każda wizualizacja – uwypukla niektóre informacje pomijając inne.

Weźmy pod uwagę taki obiekt jak ławeczka w parku, pomijana na mapach topograficznych (nawet tych dokładnych). W OSM możemy się dowiedzieć czy ławeczka ma oparcie (znacznik backrest), ile osób może na niej usiąść (seats), z jakiego materiału jest wykonana (material), na jaki kolor jest pomalowana (colour), w którym kierunku jest skierowana (direction – azymut), czy jest zadaszona (covered), jaka firma się nią opiekuje (operator), a także zdjęcie (image), czy obok stoi kosz na śmieci (waste_basket), w którym roku została postawiona (start_date), itd.

Przykłady innych obiektów:

Żywopłot Wysokość (height), rodzaj liści (leaf_type), czy roślina całoroczna (leaf_cycle), jakiego rodzaju i gatunku (genus, species)
Schody Liczba schodków (step_count), czy ruchome (conveying), czy jest poręcz (handrail)
Winda Producent (brand), pojemność (capacity), czy towarowa (goods), czy wewnątrz budynku (indoor), między którymi piętrami (level, np. -1;0;1;2)
Droga Szerokość (width), liczba pasów (lanes), jakiego rodzaju nawierzchnia (surface), max. wysokość dla pojazdów (maxheight), czy jest chodnik i po której stronie (sidewalk, footway), czy jest oświetlenie (lit), stopień utwardzenia (tracktype), stopień spadku (incline), ograniczenia dostępu (access), czy mogą jeździć ciężarówki (hgv)
Toaleta czy publiczna (access), czy płatna (fee), w jakich godzinach czynna (opening_hours), czy mogą z niej korzystać kobiety/mężczyźni/niepełnosprawni (male, female, wheelchair), sposób spuszczania wody (toilets:disposal), czy jest woda pitna (drinking_water), czy jest miejsce do przewijania pieluch (diaper), czy jest papier toaletowy (toilets:paper_supplied), czy można umyć ręce (toilets:handwashing)
Kościół Religia i wyznanie (religion, denomination), godziny mszy (service_times), adres (addr:*), kontakt (phone, website), link do Wikipedii (wikipedia), data powstania (start_date), czy zabytek (historic), kolor dachu (roof:colour), wysokość (height), nazwisko architekta (architect)
Krawężnik Wysokość (czy można na niego wjechać samochodem, wózkiem inwalidzkim?)

Alternatywą dla mapy topograficznej są nietypowe mapy tematyczne. Można takie znaleźć na product.itoworld.com/map/main (np. które budynki mają w bazie przypisany adres, ulice z podziałem na ograniczenie prędkości itp.) Poniżej kilka przykładów z jeszcze innych źródeł:


Box Locator: biletomaty, skrzynki pocztowe, bankomaty, parkomaty, telefony, kontenery na śmieci

OpenCycleMap: ścieżki rowerowe

Lichtkarte: Oświetlenie ulic

osmtools.org/gniazda/bocian: Bocianie gniazda w Polsce

Tagi

Jak widać powyżej, każdemu obiektowi możemy przypisać znaczniki (tagi), które dokładniej opisują ten obiekt. Dozwolone tagi dla danego typu obiektu są ustalane na zasadzie konsensusu lub głosowania, a efekty są ogłaszane na stronie MapFeatures.

Ktoś pragnący zgłębić zawartość bazy OSM może zainteresować się statystykami użycia tagów, np. na stronie taginfo.openstreetmap.pl, ale nie jest to szczególnie użyteczne dla początkujących. Z takich statystyk nie wynika jakiego typu obiekty są przechowywane w bazie. Trzeba wiedzieć, że pewne tagi pełnią inną funkcję niż inne.

Można powiedzieć, że kilkanaście tagów determinuje typ obiektu:

Tag Wartość
highway infrastruktura dróg samochodowych
shop sklepy
historic obiekty historyczne (zabytki)
military obiekty militarne
waterway cieki wodne
man_made budowle
amenity udogodnienia (POI)
office biura i firmy
tourism obiekty turystyczne
aeroway infrastruktura lotnicza
barrier zapory (np. płoty, mury itp.)
natural obszary naturalne (np. las, jezioro, wrzosowisko)
landuse obszary wykorzystane przez człowieka (np. pastwisko, sad, cmentarz)
railway linie kolejowe
power infrastruktura energetyczna
leisure obiekty wypoczynkowe
cycleway drogi rowerowe
craft zawody, rzemiosła, usługi (np. szewc)
emergency obiekty przydatne w razie nagłego wypadku (np. hydrant, defibrylator, gaśnica, koło ratunkowe, punkt zborny)
boundary granice (np. administracyjne, parki krajobrazowe, parafie)
route trasy (np. trasa autobusu miejskiego 504 w Warszawie, trasa pociągu Hańcza relacji Warszawa-Białystok)

I tak np. highway=motorway oznacza autostradę, landuse=orchard to sad owocowy, natural=wetland to obszar mokradła, amenity=atm to bankomat, power=tower to wieża wysokiego napięcia itd.

Nie ma jednego tagu który określałby „typ obiektu” chociażby dlatego że pojęcie typu nie jest jednoznaczne – historyczny zamek (historic=castle) może być równocześnie hotelem (amenity=hotel), studnia jest budowlą (man_made=water_well) i źródłem wody (amenity=drinking_water), a może być dodatkowo zabytkiem itd. Mogą nas interesować tylko budynki (building=*), które stanowią jeszcze inny wymiar, przeszywający zaprezentowaną typologię na ukos.

Co więcej, nie zawsze jest jasność jak tagować niektóre obiekty, i w praktyce można to robić na kilka sposobów, np. ścieżka rowerowa z dostępem do pieszych:

    highway=path bicycle=designated foot=designated segregated=no

albo

    highway=cycleway foot=designated segregated=no

Ogólnie, highway=cycleway służy to oznaczania drogi głównie lub wyłącznie dla rowerów. Niektórzy uważają, że lepiej używać tag highway=path, jeśli nie jest ona ograniczona dla rowerzystów. Nie ma dwóch rowerzystów który by się zgodzili, co stanowi dobrą trasę rowerową.

Oprócz tagów charakterystycznych tylko dla danego typu obiektu (np. CEMT – klasa czystości wody, glacier:type – typ lodowca itp.), istnieje również cały szereg tagów uniwersalnych stosowanych do obiektów różnych typów, np. height, width, contact:phone, wikipedia, brand, name, surveillance (czy jest monitoring). Wszystkie takie tagi opisane są tu.

Zagłębiamy się w dane

Dane bazy OSM są ogólnodostępne, w postaci pliku XML. Może to być tzw. planet file, czyli plik całej planety (po spakowaniu ok. 52 GB), albo też na stronie download.geofabrik.de można pobrać dane pojedynczego kontynentu, kraju lub nawet województwa.

Intrygujące jest pytanie o to, jakiego rodzaju obiekty są zbierane dla obszaru Polski, i w jakim stopniu te dane są kompletne. W tym celu pokusiłem się o wykonanie paru raportów:

  • Ile jest obiektów każdego typu [8,6 MB]
  • Ile jest relacji każdego typu [0,5 MB] – relacja jest obiektem najwyższego rzędu, można tu sprawdzić ile jest w bazie wprowadzonych granic, kompletnych rzek, dróg krajowych, autostrad czy tras autobusów i pociągów.
  • Statystyki tagów [44 MB] – lista tagów posortowanych według częstości wystąpień. Kliknij lewym przyciskiem myszy na rekord, aby zobaczyć pierwsze 100 najpopularniejszych wartości jakie tag przyjmuje, prawym przyciskiem myszki żeby zobaczyć z jakimi tagami najczęściej dany tag współwystępuje.

Widzimy m.in. że zbierane są dane tylko o niektórych znakach drogowych (m.in. „stop” i „ustąp pierwszeństwa przejazdu”), nie zbiera się w ogóle danych o sieci wodociągowej (np. studzienki) i raczej nie będzie rejestru katastralnego. Są natomiast granice parafii, zbiera się dane o nagrobkach (położenie, inskrypcja, sektor, rząd), a nawet kontenerach na śmieci.

Dołącz do projektu

Aby móc dodawać własne dane, można skorzystać z szeregu edytorów zarówno w przeglądarce (iD, Potlatch 2), na desktopie (JOSM, Merkaartor) jak i na urządzeniach mobilnych (OSM2Go, Vespucci).


Merkaartor: Edytor OSM pod Linuksa (Qt)

Co jakiś czas organizowane są konkursy mające zachęcić ludzi do przystępowania do projektu, np. Konkurs pikietażu (kto zewidencjonuje najwięcej słupków kilometrażu polskich dróg), czy Bocianie gniazda. Istnieje również aplikacja mobilna OSMStrażak do wprowadzania danych o hydrantach i słupkach kilometrażowych.

Ciekawostki

  • Obiekty mają współrzędne geograficzne, ale rzadko wprowadza się informacje o wysokości n.p.m. (głównie dla szczytów gór, przełęczy itp.) – służy do tego osobny znacznik ele
  • Intrygujące obiekty znalezione w dokumentacji OSM (aczkolwiek raczej nie w Polsce): Efektowna szubienica, Bramka, przez którą mogą przejść ludzie, ale nie zwierzęta gospodarskie.
  • Droga ma czasami więcej niż jeden numer – wiele głównych dróg (European „E” routes) ma inną numerację dla tych samych dróg krajowych.
  • Mapy komercyjne zawierają celowo umieszczone tam błędne informacje, tzw. Easter Eggs (jajka wielkanocne), aby umożliwić w przypadku tworzenia pirackich kopii udowodnienie faktu kradzieży danych.
  • Kiedyś w adresach po kodzie pocztowym następowała tzw. poczta, czyli nazwa miejscowości, w której znajduje się poczta obsługująca daną miejscowość. Obowiązujący od 19 lipca 2011 r. regulamin świadczenia powszechnych usług pocztowych upraszcza pisownię adresów. Obecnie po kodzie pocztowym zawsze umieszcza się nazwę miejscowości, niezależnie od tego, czy jest tam poczta, czy nie.

Share and Enjoy:
  • del.icio.us
  • Facebook
  • Google Bookmarks
  • Śledzik
  • Blip
  • Blogger.com
  • Gadu-Gadu Live
  • LinkedIn
  • MySpace
  • Wykop

Zostaw komentarz

XHTML: Możesz użyć następujących tagów: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>