(Fernando Gallo)
“Os governos não têm muita noção da quantidade e também de quais dados têm armazenados. Quando têm alguma noção, não têm tempo para poder pensar como é que aqueles dados podem ser aplicados e revertidos em forma de serviços para a população”.
Gerente geral no Brasil do W3C, consórcio de mais de 300 empresas privadas, públicas e universidades que se reúnem para desenvolver padrões para a internet, Vagner Diniz sustenta, nesta entrevista ao Públicos que os governos precisam permitir à sociedade civil que diga quais dados públicos lhe interessam e que as duas partes precisam sentar para fazer convergir a demanda por informação com a oferta de dados.
“Não dá para esperar que o governo saia disponibilizando dados, gastando recursos para fazer isso e depois esses dados não serem de interesse da população. Vamos tentar identificar quais são os dados que podem ser realmente úteis, criar uma demanda para isso e chegar a um acordo com os entes governamentais de fazer uma matriz de prioridades”, diz.
Segundo Diniz, a sociedade civil pode ver nos dados valores que os governos não veem para fazer sua gestão. “Duzentos milhões de pessoas vão enxergar melhor do que 4 ou 5 milhões de servidores públicos”.
Por que é importante que os governos forneçam seus dados em formato aberto?
A existência de muitos dados coletados pelos governos, e o fato de não serem utilizados, acaba criando uma massa, um armazém de dados inúteis. Os governos usam parcialmente aqueles dados, apenas para aquilo que precisam para fazer a sua gestão. A maior parte desses dados não se transforma em informação ou serviços para a população. Os governos não têm muita noção da quantidade e também de quais dados têm armazenados. Quando têm alguma noção, não têm tempo para poder pensar como é que aqueles dados podem ser aplicados e revertidos em forma de serviços para a população.
Para a sociedade civil, qual a importância desses dados?
A importância dos dados abertos reside em mudar esse cenário e deixar que a própria população diga: “esse conjunto de dados pode me interessar, ele tem utilidade para mim. Deixa eu usar esses dados porque vou conseguir pensar situações em que esses dados são relevantes e você que é governo e está preocupado com tantas outras coisas não está vendo o que eu estou vendo”. Ou seja, é a ideia que 200 milhões de pessoas vão enxergar melhor do que 4 ou 5 milhões de servidores públicos. Na medida em que os governos mundo afora começam a disponibilizar os dados em formato aberto, têm surgido organizações, comunidades, interessados, desenvolvedores web e voluntários que geram aplicações muito interessantes a partir desses dados que começam a ficar disponíveis.
E para os governos?
O mais curioso é que têm aparecido subprodutos interessantes que é a troca de informações dentro dos próprios governos. Um ente governamental passa a ter acesso a dados de outro ente governamental que antes ele tinha muita dificuldade para acessar. A burocracia de solicitar, enviar oficio, pedir atualização, gerar a base de dados para devolver, era um processo interminável.
Sem dúvida que isso torna os governos mais eficientes. Mas como é que vamos fazer para convergir a demanda da sociedade por informações com a oferta de dados que ainda estão guardados aos borbotões nos governos?
É uma tarefa difícil. Não vai ser trivial. Não tenho essa expectativa. Será uma trajetória árida para conseguirmos chegar a um estagio ideal de informações fluindo livremente do governo para a sociedade. Terá de ser um processo de conscientização. Há muita resistência com relação aos dados públicos porque o governo tem uma visão sobre os dados que é muito mais de propriedade do que de guarda dos dados. Dados públicos são públicos, da população, e os governos são guardiões dos dados, mas têm um olhar de propriedade. Eles têm medo do que vão fazer com os “meus” dados. Um segundo esforço necessário é a capacitação, porque disponibilizar dados em formato aberto exige uma certa tecnicidade. A gente precisa conhecer as tecnologias que permitem que os dados sejam disponibilizados em formato aberto na web. Precisa capacitar, treinar gente para fazer isso.
Agora…
… por último, ter um diálogo franco e sincero entre aqueles que são os guardiões dos dados, que são os entes governamentais, e aqueles que têm interesses nesses dados, que são as organizações da sociedade civil e muitos cidadãos. Vamos tentar convergir para aquilo que é prioridade. Não dá para esperar que o governo saia disponibilizando dados, gastando recursos para fazer isso e depois esses dados não serem de interesse da população. Vamos tentar identificar quais são os dados que podem ser realmente úteis, criar uma demanda para isso e chegar a um acordo com os entes governamentais de fazer uma matriz de prioridades.
O sr. me disse uma vez que fazer um aplicativo é muito mais fácil do que coletar um dado consistente. Pode trocar isso em miúdos?
Fazer um aplicativo a partir de um dado que está disponível é simplesmente fazer um código que um desenvolvedor web com um pouco de experiência consegue ler e trabalhar no seu aplicativo da forma que ele quiser. Tem sido bastante simples, como desenvolver uma página web. Muitas vezes você nem é um desenvolvedor e consegue montar uma página web pelas ferramentas hoje disponíveis. O mais complicado é disponibilizar o dado em formato aberto porque quando você, que é o guardião do dado, vai disponibilizá-lo, tem que ter uma série de preocupações em torno dessa disponibilização. Não é só uma questão técnica de colocar o dado em um formato que seja aberto. E é mais do que isso…
Sim…
… você tem que garantir para o sujeito que vai utilizar esse dado que ele é consistente. Não pode ter outro dataset com dado divergente daquele que você está disponibilizando. Você vai publicar três, quatro, dez bancos de dados e se você tiver dados semelhantes entre eles, eles não podem ser inconsistentes. Segundo, você tem que se preocupar também com a segurança desses dados. Não pode permitir que o sujeito que vai utilizar esses dados altere o dado original. Terceiro, tem que de alguma forma certificar o dado que você está disponibilizando. Porque se eventualmente quem utilizar esses dados fizer mau uso e alterá-los, e lá na frente disser “esse dado eu peguei lá na secretaria não sei das quantas”, você que ofereceu o dado pode certificar “eu entreguei os dados assim para ele. Ele é que modificou o dado”. Tem um ecossistema que é preciso ser pensado quando se disponibiliza informação.
Tem algum exemplo interessante de disparidade de bases de dados?
Uma experiência que tive quando fui diretor de informática de uma cidade do interior de São Paulo. O caso típico era o cadastro de logradouros do município. Cada secretaria tinha um cadastro de logradouros próprio, e eles continham campos de informação de acordo com a necessidade de cada secretaria. O cadastro da secretaria de finanças tinha muito mais uma visão de cobrança do IPTU. Por outro lado, a secretaria de vias públicas tinha o seu cadastro muito mais interessado na manutenção das vias públicas. O departamento jurídico a mesma coisa: tinha um interesse muito mais de cobrança de dívida ativa, e assim vai. Consegui contar seis ou sete cadastros. Eles continham informações diferentes sobre uma mesma rua. O pior de tudo é que a designação da rua não era feita da mesma maneira entre os cadastros. As abreviações eram diferentes uma da outra. Você não conseguia descobrir facilmente que uma rua era a mesma rua no outro cadastro. Até mesmo a possibilidade de fazer uma junção desses cadastros você não conseguia porque elas não estavam designadas da mesma maneira. Isso é um problema muito sério quando você passa a disponibilizar a informação em dado aberto e em cadastros diferentes eles apresentam a mesma informação de maneira diferente.
Isso dá uma dimensão bastante grande da dificuldade, mas também da necessidade cada vez maior de padronização dos dados dentro dos governos.
Sem dúvida. Isso tem sido essencial desde que a informática se pretendeu a dar uma maior organização nas vidas corporativas. A necessidade de padronização é muito antiga. Quem é da área sempre diz que a informática muitas vezes não vem para dar melhor organização, mas para te ajudar a fazer as mesmas besteiras que fazia sem elas (risos). Quando você informatiza um ambiente sem mexer nos processos e sem padronizar as informações, você vai fazer as mesmas coisas que estava fazendo antes, mas mais rapidamente.
O setor privado pode se beneficiar os dados abertos? Se sim de que forma?
Penso que sim, muito embora isso não tenha sido percebido pelo setor privado. Ele tem muito a se beneficiar em diversos pontos da cadeia de valor de dados abertos, principalmente as empresas de tecnologia. Um exemplo é a área de publicação das informações na web usando dados abertos. Além disso, se for uma empresa criativa, inovadora, vai colocar os olhos bem grandes sobre os dados abertos e ser capaz de descobrir os serviços que podem ser gerados, de valor comercial, a partir da reutilização desses dados e a transformação deles em serviços.
Pode dar um exemplo?
Hoje os dados do Censo do IBGE são riquíssimos. Tem muita informação sobre o país, os cidadãos, como se distribuem, quais as características dessas pessoas. Se esses dados estiverem em formato aberto, mesmo que você faça a preservação da privacidade, ainda assim ela é extremamente útil porque a partir dela você pode gerar, por exemplo, serviços de orientação a novos negócios em função do perfil socioeconômico. Também orientar que tipos de negócios são demandados em função do perfil de amostra domiciliar. Há ainda outro exemplo conhecidos, funcionando no Brasil, que é o Gas Finder, que é um localizador de postos de gasolina e é um aplicativo que foi feito para celular e permite encontrar postos perto de onde se está. É extremamente útil e foi feito utilizando dados da Agência Nacional de Petróleo que estão no site dela. Você pode gerar receita não necessariamente cobrando do cidadão, mas através de propagandas que você insere ao oferecer a informação. Basta que você seja bastante empreendedor e criativo.