Austria/plan.at/Abschluss
Vorwort
Seit dem plan.at Datenimport sind etwa zwei Jahre vergangen, und - wieder einmal - wird diskutiert, ob bzw. wie man die verbliebenen Reste aufarbeiten könnte, um zum "Normalzustand" zurück zu kehren.
Begleitend zur Diskussion und zur Vorbereitung von Aktionen sollen hier die Ideen und Vorschläge an zentraler Stelle gesammelt und diskutiert werden. Ebenso soll - wenn es denn dazu kommt - das Vorgehen hier festgehalten werden.
Manuelle Bereinigung von Tags
Automatische Bereinigung von Tags
Löschung (abgeschlossen 30.07.2011)
Bei der State of the Map EU Konferenz 15.-17.07.2011 in Wien wurde im Rahmen eines Treffens die Möglichkeit zur automatischen Bereinigung bestimmter plan.at Tags diskutiert (siehe Vortrag sowie weiter unten) und vereinbart.
Hier die Eckpunkte:
- Es wird eine automatische Bereinigung von plan.at Tags (nicht Features!) durchgeführt.
- Betroffen sind ausschließlich Linien (ways).
- Die Bereinigung ersetzt nicht die manuelle Kontrolle (fixme=check import)!
- Löschung
- plan.at:acad_id=*, :acad_id=*
- at:maxspeed=Ortsgebiet
- note=imported from plan.at; (C)=CC-by-sa or oDBL; feel free to change if necessary
- uploaded_by=Wolfgang W. Wasserburger, downloaded_by=Wolfgang W. Wasserburger
- addr:postcode=*, addr:city=*, addr:country=* (wenn an highway)
- addr:street=* (wenn an highway und gleichlautendes name=*)
- created_by=* (nur, wenn der way sowieso bearbeitet wird)
- Sonderfälle (z.B. addr:housenumber, addr:street <> name, highway + building) sind manuell zu korrigieren.
- Die zu ändernden ways werden vorher und nachher (zumindest stichprobenartig) überprüft.
- Die Änderungen erfolgen blockweise und objektbezogen (d.h. nur eine Änderung je Objekt in der history).
- Kurzfristiges Rollback möglich, Dokumentation in der history und einer id-Liste, Backup des Datenextrakts vor der Änderung.
- Die Aktion wird von Wolfbert koordiniert bzw. durchgeführt.
- Dokumentation der Schritte und Bereinigungsläufe erfolgt im Wiki.
- Kommunikation über talk-at sowie Feinabstimmung über die Mailingliste data_at.
Änderungs-Log
Änderungen erfolgen unter Userid 'data_at'.
Details zu allen Änderungen: Logbuch
Materialsammlung
Ziele und Rahmenbedingungen
Was soll erreicht werden?
- Es gibt keine "Geister-Objekte" mehr - sind entweder sichtbar oder gelöscht
- Alle Objekte mit fixme=check import sind bearbeitet oder mit aussagekräftigerem fixme=* versehen
- plan.at-spezifische, nicht bedeutungstragende Tags/Keys/Values sind gelöscht
- plan.at-bedingte Unsauberkeiten beim Tagging sind identifiziert und korrigiert oder markiert
--Wolfbert 00:57, 27 March 2011 (UTC)
Was soll nicht (vordringlich) erreicht werden?
- Inhaltliche Ergänzung der Import-Objekte
- Lagekorrektur
- Bereinigung von Problemen, die nicht mit plan.at in Zusammenhang stehen
--Wolfbert 00:57, 27 March 2011 (UTC)
Tags (erledigt)
Welche Tags sollten gelöscht / geändert / behalten werden? Selektionskriterien?
Löschen
Pauschal:
- :acad_id=* (3080), acad_id=* (109), plan.at:acad_id=* (108999)
- at:maxspeed=Ortsgebiet für ways (57101)
- note="imported from plan.at; (C)=CC-by-sa or oDBL; feel free to change if necessary" (113910)
- uploaded_by="Wolfgang W. Wasserburger" (126162)
- downloaded_by="Wolfgang W. Wasserburger" (81) - wird von JOSM beim Ändern der Wegrichtung angelegt :-)) (up -> down) --Wolfbert 10:11, 29 March 2011 (BST)
Mit Einschränkungen:
- addr:*=* nur für ways mit highway=* (102796) - Seiteneffekte in Kombination mit Flächentags möglich; eventuell von eingen Mappern gepflegt; Abgleich mit name=* nötig
--Wolfbert 00:57, 27 March 2011 (UTC)
Ändern
- fixme="check import" - automatisch schwierig; erkennbar sind fehlende name, maxspeed, tracktype; allenfalls pauschal mit fixme="survey" kennzeichnen oder behalten (siehe unten)
- is_in="...," - Mapper eriosw ist hier schon länger aktiv, Abstimmung erforderlich; kann aber entkoppelt passieren, da jederzeit auswertbar
--Wolfbert 00:57, 27 March 2011 (UTC)
Behalten
- Alle nicht genannten Tags
- source=*
--Wolfbert 00:57, 27 March 2011 (UTC)
- fixme="check import" - könnte als Selektionskriterium für nicht ausreichend bearbeitete (speziell nicht lagekorrigerte) Objekte erhalten bleiben; nach Bearbeitung kann ggf. ein spezielleres fixme vergeben werden
--Wolfbert 08:52, 29 March 2011 (BST)
Features
Was muss bei bestimmten Map Features beachtet werden? Selektionskriterien?
Geister
Zu unterscheiden sind "echte Geister" (kein highway=*, ca. 1000) und "unechte Geister" (highway=* und highway:plan_at:*=*, ca. 1000). Für echte Geister nur manuell zu machen.
- waterway=plan.at:*, waterway:plan_at:*=* (ca. 50) - sind erledigt --Wolfbert 10:26, 24 May 2011 (BST)
- highway=plan.at:*, highway:plan_at:*=* (ca. 2000) - sind erledigt --Wolfbert 07:17, 8 June 2011 (BST)
- landuse:plan_at:*=* (ca. 10) - sind erledigt --Wolfbert 21:17, 29 March 2011 (BST)
--Wolfbert 00:57, 27 March 2011 (UTC)
Diverse einzelne Tags
- leisure, man_made, railway, name, service, boundary und Variationen davon, gesamt ca. 30
--Wolfbert 00:57, 27 March 2011 (UTC)
Orte
- place=* (22) und ein amenity=post_office, manuell zu prüfen
--Wolfbert 00:57, 27 March 2011 (UTC)
Straßen
- highway-Typ oft unzutreffend (besonders residential/track/unclassified), das lässt sich aber nur im Einzelfall beheben (und ist bei manuellem Mapping auch nicht immer richtig)
--Wolfbert 00:57, 27 March 2011 (UTC)
Kurze Erläuterung:
- highway=unclassified - niedrigste Kategorie der noch für den allgemeinen (Auto-)Verkehr bestimmten Straßen (unter tertiary, über track/service)
- highway=residential - Sonderfall von unclassified, wenn innerorts in (überwiegend) Wohngegend
- highway=track - i.A. nur land/forstwirtschaftlich genutzt
Grenzfälle sind u.a. "Güterwege", die verstreut liegende Höfe verbinden und der Nutzung nach unclassified sind (Anschluss an das höherrangige Straßennetz, nicht privat und nicht nur landwirtschaftlich genutzt). --Wolfbert 22:53, 30 March 2011 (BST)
- In einigen Gegenden (z.B. Umgebung Amstetten) wurden Haus- und Hofzufahrten mit highway=track importiert und auch schon die fixmes gelöscht , umgekehrt wurden fallweise importierte highway=residential und track in service umgewandelt - lässt sich teilweise über die Länge der highways herausfiltern (kurz tracks und lange services sind verdächtig)
--Wolfbert 21:24, 29 March 2011 (BST)
Gattungsname
- name="Bach", "Weg", "Forstweg", "Graben" etc. (einige 100), müssen nicht zwingend bereinigt werden (Auswertung jederzeit möglich)
--Wolfbert 00:57, 27 March 2011 (UTC)
Flächen
- building=* und landuse=* wurden zumeist zusammen mit area=yes verwendet, area=yes sollte gelöscht werden; ca. 300 Fälle, nur manuell zu machen, da oft noch mehr zu korrigieren
--Wolfbert 00:57, 27 March 2011 (UTC)
Friedhöfe
- Wurden mit landuse=cemetery (großer Friedhof) importiert, sollten aber meistens amenity=grave_yard (kleiner Friedhof) sein; nur Hinweis möglich (ev. Heuristik auf Basis der Fläche), muss letztlich vor Ort oder am Luftbild beurteilt werden
--Wolfbert 00:57, 27 March 2011 (UTC)
Sportanlagen
- Wurden als leisure=nature_reserve/natural_reserve und nature=reserve angelegt. Trotz zahlreicher Korrekturen gibt es immer noch 20 oder 30. Manuell zu bereinigen.
--Wolfbert 22:32, 30 March 2011 (BST)
Wasserburger-Denkmal
- Kann zum Abschluss auch endlich abgerissen werden.
--Wolfbert 08:16, 16 May 2011 (BST)
Vorgehen
Was geht automatisch, was manuell? In welcher Reihenfolge? Wie sichern wir die Qualität und verhindern Seiteneffekte?
- Geister beseitigen
- Manuelle Änderungen
- Automatische Tag-Korrekturen
--Wolfbert 00:57, 27 March 2011 (UTC)
Qualität
- Schrittweises Vorgehen, nicht alles auf einmal
- Zeitgerechte Ankündigung aller Änderungen auf der Mailingliste und bei den Stammtischen
- Keine (Massen)änderungen (manuell oder automatisch) ohne vorhergehende Datenbankauswertung und Analyse
- Komplexe Änderungen mit möglichen Seiteneffekten nur manuell
- Löschung von kompletten Objekten nur manuell
- Automatische Änderungen an Tags nur mit etablierten "offiziellen" Bots (keine Basteleien)
--Wolfbert 00:57, 27 March 2011 (UTC)
Vorgehen aus praktischer Mappersicht?
Ich habe mich mittlerweile auch schon oft mit den plan.at Daten herumgeschlagen. Die von Wolfbert beschriebene Vorgehensweise halte ich für grunsätzlich gut. Offen bleibt aber aus praktischer Mappersicht für mich doch noch einiges. Ich mappe nur selten um direkt gezielt plan.at Fehler zu korrigieren, sondern die plan.at Daten in unterschiedlichsten Qualitäten tauchen einfach so nebenbei auf. Dabei würde ich mir einen Leitfaden bei verschiedenen "Mappingszenarien" wünschen, z.B:
- ich bin einen plan.at Weg langgefahren und hab einen GPS-Track + Notizen/Bilder diverser Wegbezeichnungen: Da habe ich bis alle Korrekturen am Weg gemacht + alle plan.at Hinweise gelöscht. So mache ich es nur dort, wo ich die Lage wirklich gut kenne.
- ich mappe in einen Gebiet über Bing/geoimage.at Luftbilder: Da habe ich bisher an den plan.at Tags selber nichts geändert, was ich nicht durch die Luftbilder anders gesehen habe, typischerweise den highway-Tag. Ansonsten hab ich da dann nur Lagekorrekturen gemacht. Sollte man in dem Fall einen Teil der plan.at Tag entfernen, um zu erkennen dass da dran jemand Hand angelegt hat?
- ... andere Fälle in denen eine einheitliche Vorgehensweise gut wäre?
--Hetzi 21:13, 28 March 2011 (BST)
Ich habe schon sehr viel plan.at Korrekturen vorgenommen, vorallem in OÖ und auch etwas in Salzburg. Ich denke dass wenn man schon Tags von plan.at anrührt auch gleich die Lage anhand von Luftbildern, gps-Spuren, ... kontrollieren und anpassen muß. Sind alle plan.at Tags noch korrekt (also so falsch wie halt immer *g*) drinnen kann man noch sinnvoll filtern und es ist auch klar dass diese Sraßen nocht nicht kontrolliert und bearbeitet wurden. Aus diesem Grund bin ich strikt gegen irgenwelche automatischen Aufräumaktionen. Meine vorgehensweise bisher:
- Wege die in keinen Luftbilder auftauchen (auch nicht näherungsweise) werden einfach gelöscht. (ich mir mir durchaus bewußt dass die Luftbilder vielleicht nicht sehr aktuell sind, aber die plan.at Daten sind teilweise nicht sehr vertrauenswürdig)
- Passe ich Wege an lösche ich immer uploaded_by, fixme, ... Drinnen bleibt immer der source=plan.at tag.
- Falsche Tags anpassen: at:maxspeed (kann man oft auch löschen, stimmt of nicht), at:highway...
- Klassifizierung wenn nicht auf den Luftbilder erkennbar lasse ich wie es ist. Es gibt allerdings viele tracks/path die eigentlich residential sind.
- Straßennamen sind oft drinnen, diese versuche ich immer zu erhalten. Also Wege mit Namen nicht einfach so löschen. ich denke das das so schnell sonst niemand einträgt da man das nur vor Ort aufnehmen kann.
--m5st 9:15, 29 March (BST)
Ein paar Gedanken zum praktischen Vorgehen bei plan.at-Objekten:
- Siehe Anleitung unter WieDamitUmgehen
- Objekte mit Version 1, fixme=check import, source=plan.at*, wurden noch nie bearbeitet
- Objekte mit Version > 1, fixme=check import, wurden nur formal bearbeitet, oder aber der Bearbeiter war sich nicht sicher genug (z.B. keine Lagekorrektur)
- Alles andere unterscheidet sich nicht mehr grundsätzlich von anderen Objekten (unklassifizierte plan.at Objekte wird es nach der Bereinigung der Geister nicht mehr geben), und lässt sich, wenn überhaupt, nur noch aufgrund der history beurteilen
Daher ist mein persönliches Vorgehen bei fixme=check import:
- Existenz des Objekts überprüfen (ja -> möglichst treffend klassifizieren; nein -> löschen; unsicher -> keine Änderung; bereits separat gemapped -> zusammenlegen); dabei auch etwas "Mut zur Lücke", wenn etwas auf gutem und halbwegs aktuellem Luftbild nicht erkennbar oder wenigstens plausibel ist, und keine weiteren Detailinformationen (z.B. name=*) hat, dann weg damit; vorher noch history ansehen
- Lagekorrektur (mindestens grob), Geometriefehler beheben, ev. Tags aufräumen, jetzt fixme auf Details/survey/name o.ä. ändern, ev. auch source ergänzen oder ändern
- danach so behandeln, wie jedes andere Objekt - überprüfen und ändern, was ich "besser" zu wissen glaube
Die zur Löschung vorgeschlagenen Tags haben IMHO keine nutzbare Bedeutung (note, uploaded_by und acad_id sind Kommentare; at:maxspeed ist gleichbedeutend mit "maxspeed noch nicht überprüft/gesetzt"). Definitiv kann man aus diesen Tags nur die Herkunft der Version 1 ablesen (wenn sie noch nicht gelöscht wurden). Für alles andere gibt es bessere Filterkriterien.
--Wolfbert 10:08, 29 March 2011 (BST)
Werkzeuge
Analyse- und Editierhilfen
Editoren
- JOSM
- Stylesheet: plan.at-Stylesheet
- Preset: plan.at-Preset (sinnvoll einsetzbar erst mit gelöstem Bug 6364, zwischenzeitlich kann custom build verwendet werden josm-custom-4263-patched.jar)
- Filter:
fixme:"check import" | highway:"plan.at" | "highway:plan:at" | landuse:"plan.at" | "landuse:plan:at" | waterway:"plan.at" | "waterway:plan:at" | "at:maxspeed" | maxspeed:Ortsgebiet | is_in:"..." | uploaded_by:Wasserburger | downloaded_by:Wasserburger | ":acad_id" | "acad_id" | "plan.at:acad_id" | "plan_at:acad_id"
- Tools » Simplify Way ([Shift]+[Y])