Home Comunicação Tenho imensos dados. E agora?

Tenho imensos dados. E agora?

5 Junho, 2024

Uma análise crítica sobre a (im)preparação das empresas para o futuro.

Aos leitores mais impacientes, gostaria de começar por expressar uma verdade que observo frequentemente no meu campo de trabalho: na sua grande maioria, as empresas não estão, efetivamente, preparadas para adotar sistemas inteligentes, como é o caso da Inteligência Artificial (IA). Esta conclusão não é fruto de um pessimismo infundado, mas de uma análise crítica sobre como as tecnologias de informação são geridas nas empresas.

Frequentemente, com a influência dos media, a pressão concorrencial, ou mesmo as diretivas governamentais de incentivo à inovação, algumas organizações decidem “embarcar” na adoção de novas tecnologias de maneira precipitada. Uma decisão, muitas vezes tomada de forma não estruturada, que ignora etapas cruciais, como é o caso do desenvolvimento de um planeamento estratégico adequado, a médio e longo prazo. O contexto dos dados, infelizmente, segue essa mesma tendência de falta de preparação.

Gestão de dados: quantidade versus qualidade

Tenho observado, com interesse e uma certa dose de preocupação, a determinação revigorante de alguns atores empresariais em começar a recolher dados de tudo e mais alguma coisa. À primeira vista, parece uma boa ideia, mas apenas na teoria. A realidade mostra que a recolha de dados, para ser verdadeiramente eficaz e transformadora, depende da forma como é conduzida e por quem é gerida. Não é apenas uma questão de quantidade de dados recolhidos; a qualidade, a relevância e o tratamento dos dados são igualmente importantes.

A utilização eficaz dos dados é um passo fundamental para a modernização de qualquer organização. Quando bem utilizados, os dados podem transformar-se num poderoso diferenciador competitivo, ajudando a descobrir ineficiências internas, identificar novas oportunidades de mercado e até oferecer uma vantagem concorrencial significativa. Contudo, apesar de algumas organizações estarem a obter sucesso na implementação de novos sistemas de recolha de dados, uma pergunta recorrente permanece: "Temos imensos dados, e agora?". Esta interrogação revela uma falta de preparação para a nova era digital que se avizinha.

Explicar esta situação tornou-se uma parte regular do meu trabalho. A recolha massiva de dados não significa que uma organização esteja automaticamente pronta para avançar para um futuro digitalizado. Preparar uma organização para este salto tecnológico implica um pensamento cuidadoso sobre o modelo de dados do domínio, os processos de atualização e integração de novos domínios, os tipos de armazenamento a serem utilizados e os formatos de dados e sua normalização. Estes são apenas alguns dos pontos que muitas vezes são negligenciados em discussões menos técnicas, mas que são absolutamente cruciais para o sucesso a longo prazo de qualquer estratégia de dados.

Quando falo em "poucos, mas bons", refiro-me à qualidade intrínseca e à relevância dos dados recolhidos. Até onde sei, ainda não foi inventado um dispositivo ou ferramenta que possa medir de forma absoluta a qualidade de "dados bons". No entanto, existem várias frameworks e modelos de referência que podem e devem ser utilizados, para melhorar e validar a qualidade dos dados recolhidos. Este processo de melhoria da qualidade dos dados é iterativo, demora o seu tempo e pode exigir ajustes significativos nas implementações existentes.

A qualidade dos dados é absolutamente fundamental para o desenvolvimento subsequente de outros sistemas, aplicações, modelos de IA e relatórios analíticos. É aqui que o princípio GIGO (Garbage-In, Garbage-Out) entra em jogo. Se os dados iniciais forem de baixa qualidade, os insights derivados desses dados também serão pobres. Estou convencido de que muitas organizações acreditam que estão a trabalhar com dados de alta qualidade, mas, frequentemente, essa não é a realidade.

Como processar um grande volume de dados?

Antes de nos orgulharmos dos "imensos dados" que possuímos, talvez seja prudente dar um passo atrás para garantir que a recolha de dados seja completa e o armazenamento escalável e organizado. Só aí é que podemos dar dois passos à frente na adoção de novos sistemas inteligentes baseados nesses dados. Este é um processo que exige uma reconsideração profunda de como os dados são vistos e geridos dentro das organizações.

Quando se trata da quantidade (volume) de dados, impõe-se uma questão: “O que é realmente um grande volume de dados?” A resposta, como em muitos aspetos da tecnologia da informação, é: “Depende”. Adoto geralmente a definição de que: um volume de dados é considerado grande quando os sistemas tradicionais já não conseguem oferecer resposta adequada ao seu processamento. Uma perceção que pode variar muito, dependendo da realidade de cada organização, contudo, alcançar este limiar não é necessariamente um sinal para descartar tudo o que existe e mudar radicalmente de paradigma.

Este é um dos maiores desafios enfrentados pelas organizações. Poucas são aquelas que têm nos seus quadros especialistas nas áreas de ciências de dados e sistemas de informação, capazes de ter uma visão holística sobre os sistemas existentes e de projetar e implementar um plano estruturado para a adoção de novas tecnologias.Por vezes, a solução adotada passa por improvisar, formar alguém saltando várias etapas, ou copiar uma solução que tenha funcionado noutra realidade e implementá-la rapidamente. Embora essa abordagem possa funcionar em alguns casos, sou defensor de uma solução mais fundamentada e deliberada.

Volume de dados

“A capacitação é um processo importante, necessário e, embora lento, extremamente recompensador”

É essencial reconhecer que, nem todas as organizações dispõem dos recursos necessários para manter uma equipa de especialistas neste domínio, no entanto, é possível dar passos conscientes nessa direção. Antes de avançar para uma mudança tecnológica mais ou menos radical, é crucial estabelecer uma base sólida. A capacitação é um processo importante, necessário e, embora lento, extremamente recompensador. De que adianta possuir um Ferrari se não tenho carta de condução, ou se as estradas por onde pretendo conduzir não estão devidamente preparadas?

Este artigo não pretende ser um manifesto contra a inovação tecnológica nas organizações, mas uma à reflexão sobre como estamos a preparar as nossas empresas para o futuro. A engenharia de dados não é apenas uma questão de recolher e armazenar imensas quantidades de informação, mas sim, de fazer isso de forma inteligente, estruturada e, acima de tudo, sustentável. Afinal, na corrida pela inovação tecnológica, não basta apenas correr… é preciso saber onde colocar cada passo.

Autor: Pedro Guimarães
Responsável Técnico da Área de Engenharia de Dados (EPMQ) do CCG/ZGDV Institute

Tenho imensos dados. E agora?

CATEGORIAS

Artigos Relacionados

Fale connosco