TERYT czyli polskie dane terytorialne

TERYT baza danych, z którą powinien zapoznać się każdy, kto zajmuje się zagadnieniami związanymi z danymi geograficzno-administracyjnymi. Jest to Krajowy Rejestr Urzędowego Podziału Terytorialnego Kraju.

Baza zawiera hierarchiczny podział na województwa, powiaty, gminy i ulice. Aktualnie format danych to spakowany ZIPem zbiór plików XML. Dane można przeglądać za pomocą przeglądarki – dochodząc do najniższego poziomu, finalnie i tak ściągamy plik XML:

Można także pobrać kompletną bazę wszystkich ulic w Polsce (sekcja plików predefiniowanych). Plik jest spory – 77 MB, 3 miliony linii. Średnio radzi sobie z nim notatnik;) Dane najlepiej sparsować (swoim) programem.

Do czego to się może przydać?

  • Do projektowania bazy danych adresów użytkowników. Czy 25 znaków wystarczy na pole zawierające tylko nazwę ulicy? Okazuje się, że niekoniecznie. Wg wpisu na temat najdłuższych i najkrótszych nazw ulic i miejscowości: http://alcik-blog.nemezis.eu/nazwy_ulic_i_miejscowosci_w_Polsce (bazowanego właśnie na danych z TERYT-u), nazwa ulicy może zawierać nawet 74 znaki.
  • Do testowania oczywiście. Po co wymyślać niestworzone dane testowe, skoro można posłużyć się autentycznymi i przy okazji sprawdzić testowany system np. pod kątem dozwolonych znaków czy długości adresów. Okazuje się, że dane adresowe mogą zawierać takie znaki, jak cudzysłów, apostrof i tak dalej.

 

Przydatny wpis? Postaw mi kawę :)

Dodaj komentarz

avatar
  Subscribe  
Powiadom o