Automated edits/johnparis

From OpenStreetMap Wiki
Jump to navigation Jump to search

Summary: Adding values for two existing tags to bus stops in the Paris area that lack such data.

Résumé: Ajout de valeurs pour deux tags existants aux arrêts de bus dans la région parisienne qui manquent de telles données.

English version

Why

  • STIF:zone -- consumers buying individual tickets want to know the cost, which depends on the zone. STIF provides data on all stops, though I have corrected a few cases manually.
  • ref:FR:STIF -- this value is documented by STIF as ZDEr_ID_REF_A. It apparently has some usefulness for quality control and other purposes. STIF provides data for all but about 2% of stops.

Numbers

Usage as of 2018-06-01.

universe     currently set     to add current
coverage    
proposed
coverage
ref:FR:STIF 11027 5988 4806 54.3% 97.9%
STIF:zone 11027 6315 4664 57.3% 99.5%

Issues

No nodes will be added to OSM; this import adds new key/value pairs for certain tags.

Documentation of the STIF data is at https://opendata.stif.info/explore/dataset/offre-horaires-tc-gtfs-idf/

About 0.5% of the nodes have a STIF:zone value of 101. This is not a real zone; this value in the STIF data represents nodes outside Île-de-France. I plan to exclude applying a value to such stops.

Because STIF is the authoritative source for ref:FR:STIF, I do not expect any issues with that data.

Question: should we try to include wheelchair, which is in the STIF data? Currently, through crowdsourcing, we have tagged 5% of the stops. STIF has tagged 45%. Consumers who use wheelchairs want to know if the stop is accessible. So the question is, is it better to publish the STIF data, whose reliability is unproved, or to ignore it? Alternatively, we could tag the lines that STIF provides data for, but its definition of "wheelchair accessible" for a line is when 70% or more of the stops are wheelchair accessible. For the moment, I do not plan to import anything for this, but I am open to suggestions.

How

General approach: I maintain a database of 11,000 stops that I update regularly. This provides a link between the OSM node and the STIF stop_id. The automated edit would be limited to those. The database represents about 1/4 of all bus stops in Île-de-France. It grows as I add new lines, which are manually checked against existing nodes (if any) and merged as appropriate. From time to time I also prune stops where the stop_id has changed or the stop no longer exists because of route changes. This assures a high level of quality for this automated edit.

I intend to include these two key/value pairs as I add new stops/lines.

This would be a one-time edit. I plan to do a small test (about 100 nodes), verified manually, before doing the automated edit via JOSM. Afterwards, I plan to do a spot check.

Edits will be made from account "johnparis"

Example:
state before automated edit:

state after automated edit:

Changeset comment would be :

Adding values for two existing tags to bus stops in the Paris area that lack such data. Spatial data: existing nodes. Tags affected: STIF:zone; ref:FR:STIF. Data source: Île-de-France Mobilités (formerly STIF) using French ODbL license [1]. Permission to use in OSM under license has previously been obtained. This automated edit is documented at https://wiki.openstreetmap.org/wiki/Automated_edits/johnparis

Contact

message via OSM

Mailing List Announcements

Version française

Pourquoi

  • STIF:zone - les consommateurs qui achètent des billets individuels veulent connaître le coût, qui dépend de la zone. Le STIF fournit des données sur tous les arrêts, bien que j'ai corrigé quelques cas manuellement.
  • ref:FR:STIF - cette valeur est documentée par le STIF sous la forme ZDEr_ID_REF_A. Il a apparemment une certaine utilité pour le contrôle de la qualité et d'autres fins. Le STIF fournit des données pour tous sauf environ 2% des arrêts.

Chiffres

Utilisation au 2018-06-01.

univers     défini actuellement     à ajouter couverture
actuelle    
couverture
proposée
ref:FR:STIF 11027 5988 4806 54,3% 97,9%
STIF:zone 11027 6315 4664 57,3% 99,5%


À considerer

Aucun noeud ne sera ajouté à OSM; cette importation ajoute de nouvelles paires clé / valeur pour certaines tags.

La documentation des données du STIF est disponible sur https://opendata.stif.info/explore/dataset/offre-horaires-tc-gtfs-idf/

Environ 0,5% des nœuds ont une valeur STIF:zone de 101. Il ne s'agit pas d'une zone réelle; cette valeur dans les données du STIF représente des nœuds hors d'Île-de-France. Je prévois d'exclure l'application d'une valeur à de tels arrêts.

Étant donné que le STIF est la source de référence pour FR:STIF, je ne m'attends à aucun problème avec ces données.

Question : devrions-nous essayer d'inclure le tag wheelchair=yes/no, qui est dans les données du STIF? Actuellement, grâce au crowdsourcing, nous avons marqué 5% des arrêts. Le STIF a marqué 45%. Les consommateurs qui utilisent un fauteuil roulant veulent savoir si l'arrêt est accessible. La question est donc : est-il préférable de publier les données du STIF, dont la fiabilité n'est pas prouvée, ou de l'ignorer? Alternativement, nous pourrions marquer les lignes pour lesquelles le STIF fournit des données, mais sa définition de «accessible aux fauteuils roulants» pour une ligne est quand 70% ou plus des arrêts sont accessibles aux fauteuils roulants. Pour le moment, je ne prévois rien importer pour cela, mais je suis ouvert aux suggestions.

Comment

Approche générale: Je gère une base de données de 11 000 arrêts que je mets régulièrement à jour. Ceci fournit un lien entre le noeud OSM et le STIF stop_id. L'édition automatisée serait limitée à ceux-ci. La base de données représente environ 1/4 de tous les arrêts de bus en Île-de-France. Il se développe au fur et à mesure que j'ajoute de nouvelles lignes, qui sont vérifiées manuellement par rapport aux noeuds existants et fusionnées le cas échéant. De temps en temps, j'ameliore aussi les arrêts où le stop_id a changé ou l'arrêt n'existe plus à cause des changements de route. Cela garantit un haut niveau de qualité pour cette édition automatisée.

J'ai l'intention d'inclure ces deux paires clé / valeur lorsque j'ajoute de nouveaux arrêts / lignes.

Ce serait une édition unique. Je prévois de faire un petit test (environ 100 nœuds), vérifié manuellement, avant de faire l'édition automatisée via JOSM. Après, je prévois de faire une vérification de plusieurs arrêts choisis au hasard.

Les modifications seront effectuées à partir du compte "johnparis"

Exemple:
l'état avant automated edit:

l'état après automated edit:

Le commentaire de changeset serait:

Adding values for two existing tags to bus stops in the Paris area that lack such data. Spatial data: existing nodes. Tags affected: STIF:zone; ref:FR:STIF. Data source: Île-de-France Mobilités (formerly STIF) using French ODbL license [2]. Permission to use in OSM under license has previously been obtained. This automated edit is documented at https://wiki.openstreetmap.org/wiki/Automated_edits/johnparis

Contact

message via OSM

Annonces sur les listes de diffusion