User:AMDmi3/Чистка cladr тэгов
Jump to navigation
Jump to search
В базе присутствует большое количество данных, некогда взятых из КЛАДР и массово проставленных на объекты ботом. Эти данные давно не обновляются и потеряли актуальность, и по сути не могут быть практически использованы, а также нарушают TOS КЛАДР, поэтому предлагается очистить от них базу.
Проблемы с данными
- копирование cladr данных в OSM нарущает права на использование базы:
... 3. Настоящая Лицензия является неисключительной. Пользователь получает право использования КЛАДР на территории Российской Федерации в оговоренных ниже пределах. Право использования КЛАДР ограничивается правом на воспроизведение (запись в память ЭВМ, архивное копирование и инсталляция) и правом пользования (осуществление действий, связанных с функционированием КЛАДР в соответствии с ее назначением). Начало использования КЛАДР (установка) означает безусловное согласие Пользователя с условиями настоящей Лицензии. Пользователь КЛАДР обязуется не распространять КЛАДР. Под распространением понимается предоставление доступа третьим лицам к воспроизведенной в любой форме КЛАДР и ее компонентам путем продажи, проката, сдачи внаем, предоставления взаймы или иными способами отчуждения. 4. Пользователь КЛАДР не вправе: - допускать использование КЛАДР лицами, не имеющими прав на такое использование; ...
- так как данные в базе OSM не актуализируются
- они отсутствуют на новых объектах
- на старых объектах зачастую присутствуют неверные данные (например, в ходе уточнения часть одной улицы была отнесена к другой, но cladr данные остались от первой улицы)
- данные из свежих версий КЛАДР не попадают в OSM
При этом следует заметить, что использовать данные КЛАДР с OSM можно без добавления их непосредственно в OSM:
- сопоставляя объекты в OSM и КЛАДР по адресам
- используя корректные тэги cladr:code, которые предлагается оставить в базе OSM как способ связи её с КЛАДР (предполагается, что наличие в OSM только кодов без иного содержимого КЛАДР не будет являться распространением последней или предоставлением доступа к оной третьим лицам)
Для сопоставления данных OSM с другими базами (ОКТМО/ОКАТО/КЛАДР) также можно использовать http://yav.gis-lab.info/trac/wiki/Экспорт
Данные предложенные к удалению
- 17-значные cladr:code на зданиях
- КЛАДР (в числе всего прочего) различает такие объекты как улицы (база данных STREETS.DBF, 17-значные коды) и дома (база данных DOMA.DBF, 19-значные коды).
- если я ничего не путаю, некогда в целях привязки зданий к улицам для программы ПокетГис, пользователем Ezhick на здания были проставлены тэги cladr:code, содержащие код ближайшей улицы.
- Это некорректное использование тэга, т.к. вместо кода здания в cladr:code зависывался код улицы
- Это неверная информация, так как использовался не фактический код, а код с ближайшей улицы, при том что здание могло адресоваться совершенно по другой улице
- Насколько мне известно, этот костыль больше не нужен ПокетГис'у
- 19-значные cladr:code предлагается оставить для связи OSM с КЛАДР (предполагаем что это вручную проставленные корректные коды зданий)
- cladr:name, cladr:suffix по озвученным в начале стрницы причинам
- sorting_name, хотя и не относится к КЛАДР (судя по всему, проставлен только по Москве из ОМКУМ), также не обновляется и подвержен всё тем же проблемам (за исключением нарушения лицензии). В дополнение к этому
- в OSM от местячкового тэга мало смысла; сортировка, работающая только в Москве или работающая по-разному в и вне Москвы не нужна
- существуют готовые общие алгоритмы приведения названий к виду, подходящему для сортировки (как минимум streetmangler, при необходимости более продвинутый алгоритм на его базе)