Brazil/CNEFE 2010/Importação dos endereços
Metodologia
A metodologia não pode ser uma caixa preta, deve ser aberta para aqueles que tiverem interesse, possam contrapor, dar sugestões e entender o processo. Do ponto de vista técnico, dele deve ser totalmente reprodutível.
Proposta 1
(consolidado da sugestão do Santamariense, e-mail de 2016-01-05)
Passos:
- Padronizar uma metodologia (estamos neste momento aqui);
- Processar a cada município, partindo do seu arquivo
.osm
- Criar aqui na Wiki uma tabela ou lista de todos os municípios, com um link para download do arquivo, um campo com data e um campo de assinatura (user na Wiki), para que outra pessoa não conflite em escolher o mesmo município para edição). A cada município:
- Com o arquivo em mãos, vai se trabalhando em cima dele e salvando, e, quando estiver pronto (todo o município) se faz o upload. Não poderá ser baixado dados do OSM sobre o arquivo para evitar potenciais conflitos de edição.
OBS.: Como a ideia é já entregar o arquivo em formato *.osm pronto para ajustes finais, quem não tiver interesse em entender o processo de como se chegou a ele, não precisará aprender a fazer.
Proposta 2
Sugestão e análise de Marcos Medeiros (provenientes de conversas em conversa no telegram OSMBrasil_Suporte):
Umas coisinhas sobre o Cnefe do IBGE:
- Os dados liberados são de 2010 (acho que td mundo já sabia)
- O IBGE adota nas esquinas o critério de "entrada principal" para definir se um domicílio está em uma face, isso pode gerar muita numeração quebrada. Porque ocorre de o poder público fazer a numeração por uma rua e a pessoa usar a entrada por outra rua (eu estimaria em até 5% dos endereços - talvez uns 30% de endereços de esquina)
- A próxima operação censitária (provavelmente em 2020 com cnefe liberado em 2021) contará com coordenadas em todos os endereços (ou algo muito próximo disso)
- Um sistema de endereços que almeja cadastrar o universo (todo o Brasil) como o cnefe tem que criar algumas alternativas para individualizar todos os endereços, então a numeração é só um desses itens, já que um número surpreendente de endereços não possui numeração. No casso do CNEFE do ibge o endereço é composto, basicamente, por Logradouro, Número, Complemento, Localidade e Ponto de Referência. Sendo que quando não existe numeração o ponto de referência é obrigatório.
- Existe um banco de dados mais atualizado do Cnefe, usado para a pesquisa da Pnad Contínua, mas que não cobre todo o território brasileiro, e que conta com coordenadas em todos os endereços (ou quase)
- O aplicativo de coleta de endereços está em atualização atualmente e uma das propostas é usar mapas do OSM como plano de fundo tanto em setores urbanos como em setores rurais
Pessoalmente eu (Marcos) acho que seria mais prudente utilizar esse banco de dados de uma dessas duas formas:
- Utilizar apenas um numero no centro e interpolar toda a rua. Assim seria minimizado o erro dos números de esquina
- Utilizar todos os números (mesmo que existe algum número equivocado na esquina os outros estarão corretos)
OBS.: A pior opção seria pegar os números de esquina e interpolar, já que incluiria todos os erros de números de esquina