Com a crise mundial causada pela pandemia, o Brasil está encabeçando uma nova discussão, não sobre a segurança, mas sobre a transparência de dados.
Transparência de dados não é um tema novo para quem trabalha com internet ou com gestão pública. A Lei Complementar 131, Lei Capiberibe (Lei n° 6.924) ou, se preferir, simplesmente Lei da Transparência, foi sancionada em julho de 2009 e estabelece que a união, os estados e os municípios divulguem seus gastos na internet em tempo real.
Vamos pensar no vereador da sua cidade, que usa o cartão de crédito corporativo para pagar o almoço. Ele recebe o comprovante de pagamento e, caso seja responsável, pedirá uma nota fiscal, a ser entregue a um assessor do seu gabinete e que, por sua vez, irá declarar o gasto no portal da transparência de dados.
O problema é que muitas vezes essa declaração no portal é apenas uma imagem escaneada desta nota fiscal ou do comprovante de pagamento, logo, estes dados não são estruturados.
O parlamentar pode alegar que estas informações estão disponíveis no portal, mas, se a única opção que o cidadão tem disponível para acompanhar estes dados for verificar as declarações item a item, não podemos considerar estes dados transparentes.
Outro exemplo é uma compra de seringas para um hospital. A ordem de serviços desta compra poderia ser preenchida com o seu valor unitário, quantidade e outros detalhes, como tamanho, cor e volume. Então, ao fazer outra compra, por exemplo, de lençóis, os campos para preenchimento seriam completamente diferentes, tornando difícil racionalizar estas informações em grande volume e, logo, também não seriam informações transparentes.
A Lei Geral de Proteção de Dados foi uma excelente iniciativa, mas depende muito do monitoramento dos cidadãos e de entidades interessadas.
Existem muitas tecnologias por todo o mundo nessa área. Sendo o Watson da IBM a mais famosa delas.
Quando a IBM fala de sua computação cognitiva, uma das aplicações é o tratamento de dados não estruturados, como prontuários médicos, pesquisas de campo, livros digitalizados ou prestações de contas.
Dados não estruturados são desafios para o mundo, e profissionais de desenvolvimento de sistemas aceitaram isso e buscam alternativas para analisá-los. Um exemplo é a Operação Serenata do Amor, projeto que utiliza inteligência artificial justamente para monitorar gastos públicos, como os exemplos citados acima.
Este texto foi inicialmente pensado para tratar de gestão de dados e como ela é necessária para termos transparência. Para falar sobre como fomos da era dos Data Warehouses, de grandes corporações, para o cenário que temos hoje, em que a imagem que usaremos em um post do Instagram é decidida com base na performance de um teste A/B que fizemos há 15 dias.
O Ministério da Saúde, responsável pelo fornecimento de dados sobre a COVID-19 mudou ao longo do tempo o método utilizado para apresentação dos índices relacionados à pandemia. Isso ocorreu logo após o dia 4 de junho, data em que o país bateu o recorde de 1.413 mortes.
Inicialmente, eram apresentados os casos de forma acumulada, ou seja, conforme os resultados de exames eram disponibilizados, os números eram somados ao valor diário. O modelo não era utilizado desta forma à toa, praticamente todos os países do mundo apresentam os dados desta forma.
Sabemos que existe defasagem nos dados devido à subnotificação por falta de testes e, também, em razão do intervalo em comunicar os balanços por parte dos laboratórios, hospitais e secretarias de saúde, mesmo assim, era possível realizar análises e estimativas com estes números.
Então, a metodologia foi alterada, e os balanços diários passaram a apresentar apenas os números de casos ou óbitos do dia. Assim, no dia 8 de junho, em um boletim foram apresentadas 1.382 mortes, mas, pouco depois, após uma correção, foram reportados 525 óbitos.
Podemos questionar a mudança da metodologia, uma vez que o mundo todo apresenta os dados de uma forma e nosso governo optou por apresentar de outra. No entanto, não existe aí a ocultação de dados, por isso é chamado “maquiar dados”.
Os números recebidos pelo Ministério da Saúde, mesmo com todos os problemas de defasagem e subnotificação, são muito bem estruturados e não existe motivo para serem distorcidos, mas no boletim diário optam por apresentá-los de uma forma menos chocante, o que não deveria acontecer.
A escolha do governo brasileiro de apresentar os dados desta forma, indo na contramão do que é feito mundialmente, iniciou uma discussão global sobre como estados reportam diversos dados sobre saúde, educação, economia e fatores sociais, mesmo que eles não tenham tido grandes problemas com os dados sobre a COVID-19.
Agora, por questões éticas, diversos governos estão detalhando suas metodologias de apresentação de dados, justificando e tentando torná-las mais eficientes, e isso já está refletindo no setor privado.
Com o Regulamento Geral sobre a Proteção de Dados (GDPR) da União Europeia, conjunto de leis em que foi baseado a nossa Lei Geral de Proteção de Dados (Lei nº 13.709), cidadãos e governos passam a exigir não apenas que seus dados sejam seguros e acessíveis, mas que exista transparência sobre a gestão destes dados.
Principalmente na Europa, mais do que saber se o Facebook mantém os dados de seus usuários seguros, existe demanda crescente em saber quais métodos de segurança são utilizados, sendo que, em pouco tempo, pode ser necessário nos adaptarmos novamente, e a gestão da transparência dados será cada vez mais importante para isso.