A menos que você tenha vivido sob uma rocha que está sob outra rocha enterrada sob 10 pés de terra, você está ciente da IA e do potencial que ela tem de mudar o mundo em que vivemos. Embora você possa ter ideias de como a IA impactará a maneira como trabalhamos, você precisa ser um viajante do tempo para prever todas as maneiras como ela influenciará nosso mundo. Mas podemos assumir que uma certa quantidade de pessoas, automação e governança desempenharão papéis importantes no futuro da IA.
A IA já está impactando como os humanos gerenciam e interagem com dados. Podemos pedir à IA para nos ajudar a transformar dados em insights. A IA também pode ser nosso copiloto para nos ajudar a gerenciar os dados subjacentes que dão suporte a esses insights. Ela também pode operar de forma independente para garantir que os dados em que confiamos para tomada de decisões críticas sejam confiáveis.
Para que a IA desempenhe um papel maior no acesso e gerenciamento de dados, os humanos devem permanecer no centro do processo. Essa abordagem significa monitoramento e alerta próximos e treinamento e retreinamento apropriados.
A IA e, mais especificamente, os modelos de linguagem grande (LLM) estão tomando o centro do palco para ajudar analistas e tomadores de decisão a obter os dados de que precisam em um formato consumível para dar suporte a uma tomada de decisão rápida, mas completa. A tecnologia de texto para SQL reduz a barreira técnica entre analistas, dados e insights. Analistas e tomadores de decisão não precisam mais saber SQL para consultar bancos de dados. Os novos modelos LLM podem criar consultas SQL automaticamente com base em linguagem comum. Se um gerente de vendas estiver interessado em vendas por região e segmento de mercado, ele pode definir os parâmetros com termos comerciais comuns para extrair os dados necessários.
A IA também ajuda a apresentar dados das formas mais consumíveis. Os copilotos de visualização de dados com tecnologia de IA estão automatizando o processo de construção de gráficos e tabelas complexas. Os tomadores de decisão não precisam mais ir e voltar com um analista de dados para obter informações apresentadas de uma forma fácil de entender. Eles podem simplesmente pedir a um assistente de IA para criar um gráfico instantaneamente. Se não estiver exatamente certo, os analistas podem instruir o chatbot a ajustar o visual, o que pode ser concluído em segundos. Esse avanço formata os dados de forma consumível muito rapidamente e elimina a necessidade de aprender a usar várias ferramentas e plataformas de BI.
A IA tem grande potencial para ajudar a buscar dados para tomadores de decisão, mas sem dados confiáveis para alimentar essas saídas, a IA só ajudará a mover dados ruins mais rápido. Felizmente, também há uma grande variedade de aplicações para IA em gerenciamento de dados, governança e qualidade de dados.
A IA está sendo aplicada na governança de dados como um copiloto ou mecanismo de recomendação e também está preparada para governar dados e melhorar a qualidade no futuro de forma autônoma.
Ferramentas de IA estão sendo incorporadas em plataformas de governança de dados para agilizar o processo de exposição de dados de maior qualidade e torná-los disponíveis para mais analistas e tomadores de decisão. Especificamente, a tecnologia está se tornando uma ferramenta essencial no gerenciamento de catálogos de dados para maior descoberta e governança de dados. Por exemplo, a IA oferece suporte à governança de dados ajudando analistas a marcar dados confidenciais, como dados de informações pessoalmente identificáveis (PII). Com base nas características dos dados designados como confidenciais no passado, a IA pode prever quais colunas de dados podem conter dados restritos.
Ajudar a classificar dados e documentar ativos de dados é outra maneira pela qual a IA trabalha com administradores de dados, analistas e engenheiros para tornar os dados mais facilmente descobertos pelos consumidores de dados. Para ajudar a padronizar a terminologia e os conceitos de negócios, a IA pode sugerir o termo mais apropriado para descrever dados em um glossário de dados. Da mesma forma, a IA pode ajudar a documentar ativos de dados sugerindo a melhor maneira de descrevê-los.
Um copiloto também pode desempenhar um papel fundamental nas regras de controle de acesso a dados. A IA pode sugerir quais usuários devem ser autorizados com base nas características e perfis de usuários individuais e como eles correspondem aos usuários já autorizados. Por outro lado, a IA também pode sinalizar indivíduos onde o acesso pode não ser apropriado. Essa capacidade permite que mais usuários com a autoridade adequada aproveitem a vasta quantidade de dados corporativos que as organizações coletam para gerar valor comercial.
Ajudar a garantir que as entradas de dados sejam válidas é outra maneira pela qual um mecanismo de sugestão ou copiloto alimentado por IA pode dar suporte a uma melhor governança de dados. Os modelos podem aprender a identificar entradas que podem ser erros com base no que a IA espera ver como uma entrada. Por exemplo, se uma entrada estiver fora de um intervalo específico, o campo pode ser sinalizado e uma sugestão pode ser feita para corrigi-lo antes que o erro entre no banco de dados. Ao apresentar essa opção, os erros podem ser resolvidos em tempo real, evitando problemas posteriores.
Os modelos de IA são tão bons quanto os dados usados para treiná-los. Quando dados ruins são usados para treinar IA, o ruído os confunde, levando a um desempenho ruim e saída errônea. Isso é particularmente problemático para IA Generativa, que é muito mais opaca, e os efeitos de dados ruins são muito mais difíceis de identificar.
Dado esse fato, garantir que as plataformas que fornecem dados para modelos de IA estejam trabalhando com dados da mais alta qualidade é essencial para produzir modelos de IA downstream de qualidade. É essencial que os profissionais de dados trabalhem em estreita colaboração com processos assistidos por IA para ensiná-los a monitorar e limpar dados corretamente e de forma mais autônoma.
À medida que os profissionais de dados marcam os dados, essas informações são usadas para produzir sugestões para marcação no futuro. Garantir que as pessoas certas conduzam o processo de marcação de dados e documentação de ativos terá efeitos compostos no futuro. Os profissionais devem marcar efetivamente os dados PII para que a IA aprenda com precisão a aparência dos dados PII e os sinalize no futuro. Continuar a ensinar a IA por meio da aprovação ou negação apropriada de sugestões de IA para documentação também ajuda a IA a se tornar mais inteligente e eficaz ao longo do tempo. Incorporar gerentes e profissionais de linha de negócios que estejam próximos de onde os dados são coletados e entendam suas nuances é importante para criar com precisão a documentação que reflita o contexto no qual os dados são coletados.
Marcar dados em um nível mais granular também pode ajudar os modelos de IA a ter melhor desempenho e produzir resultados mais precisos. Com metadados granulares mais ricos, a IA tem dados mais diferenciados que podem dar suporte a regras mais específicas. Por exemplo, a IA pode sugerir regras que pertencem a colunas únicas dentro de uma tabela ou personalizar regras que se aplicam a personas específicas. Isso permite uma abordagem mais sutil para autorizar o acesso aos dados, fornecendo maiores insights para mais tomadores de decisão.
Muitos problemas de qualidade de dados se originam com a ingestão de dados ou quando os ativos de dados são criados. Adotar uma abordagem proativa por meio da validação de dados pode eliminar problemas no futuro. Quanto mais problemas de qualidade de dados forem permitidos a apodrecer, maior a probabilidade de eles contaminarem o desempenho da IA em toda a sua organização, levando a um desempenho competitivo mais baixo. O momento em que a IA é incorporada ao seu processo de governança de dados também pode influenciar o resultado.
Aproveitar a IA para dar suporte à qualidade dos dados e aos protocolos de governança no minuto em que eles chegam aos seus sistemas pode limitar o risco de dados sujos degradarem seus modelos. Ao deslocar a governança de dados e as verificações de qualidade de dados para a esquerda e integrar verificações de qualidade orientadas por IA mais cedo em seu processo, muito mais pessoas estarão envolvidas para garantir que os dados que você está usando para treinar seus modelos de IA sejam da mais alta qualidade. Além disso, ao integrar a IA ao seu fluxo de trabalho de gerenciamento de dados, as pessoas podem colaborar com a IA para melhorar a qualidade e a governança em tempo real — sem necessidade de sair do seu fluxo de trabalho ou revisitar problemas de qualidade de dados após o fato.
Se você tomou as medidas adequadas para integrar a IA ao seu processo de governança de dados e treinou sua IA com dados limpos, surgem oportunidades que permitem que a IA assuma um papel mais ativo em sua estratégia de governança de dados.
Se treinarmos bem nossos modelos, ficaremos mais confiantes de que eles podem lidar com tarefas que um profissional de dados pode executar. A IA tem o potencial de aprender a criar linhagem de dados automaticamente ou automatizar a governança de dados adequada.
Identificar automaticamente anomalias em seus dados e corrigir erros é uma área em que a IA pode dar suporte à qualidade dos dados de forma mais autônoma. A IA é particularmente boa em identificar padrões em grandes conjuntos de dados e pode apontar anomalias grandes e pequenas. Os modelos podem prever quais pontos de dados devem ser e, com intervenção humana limitada, ajustar um ponto de dados que não se encaixa nas expectativas. Com o treinamento adequado, a IA pode limpar conjuntos de dados, encontrar e preencher valores ausentes ou corrigir dados imprecisos ou inconsistentes. A IA também pode padronizar dados em formatos padrão. Por exemplo, abreviações de estado podem ser ajustadas para o formato tradicional de duas letras, ou diferentes formatos de endereço podem ser padronizados.
Com treinamento mais sofisticado, a IA pode ser confiável para criar suas próprias regras de qualidade de dados ou criar metadados para organizar melhor os dados. Ao integrar chatbots de IA para trabalhar com humanos, os modelos podem aprender estruturas de regras e parâmetros e criar estruturas para governar seus próprios processos. Da mesma forma, a IA pode criar metadados e documentação por conta própria para construir um contexto mais rico em torno dos dados, tornando-os mais utilizáveis. Um exemplo é identificar dados PII, como um número de previdência social em dados não estruturados, e marcá-los como um ponto de dados sensível.
Esses processos não só podem economizar muito tempo dos humanos, como também podem reduzir o risco de dados confidenciais chegarem às mãos erradas, ao mesmo tempo em que tornam dados menos confidenciais mais acessíveis aos tomadores de decisão.
Mesmo que você tenha feito um ótimo trabalho de treinamento e implementação de seus modelos de IA para automatizar seus processos de governança de dados, os humanos devem permanecer envolvidos.
Mesmo que seus modelos estejam funcionando bem agora, não há garantia de que eles continuarão a ter um bom desempenho no futuro. As coisas mudam, os modelos desviam e podem surgir vieses. Mecanismos devem ser implementados para que os humanos sejam capazes de monitorar a IA em busca de erros e desempenho degradante. Isso pode incluir pedir a um modelo de IA uma saída e compará-la com dados reais para ver se o modelo produziu as respostas certas ou o que poderíamos esperar que o modelo produzisse.
Estruturar sua organização para maior saúde de IA é essencial para estratégias bem-sucedidas. É importante colocar os profissionais mais próximos dos dados e seu contexto na melhor posição para treinar modelos de governança de dados em um papel central. Ao treinar IA, quanto mais granulares os dados, melhor, então integrar mais maneiras pelas quais os profissionais podem fornecer feedback aos modelos melhorará o desempenho.
Alinhar profissionais de linha de negócios com TI será essencial para um processo de treinamento eficaz. Tanto a TI quanto as pessoas de negócios podem trabalhar juntas para melhorar o desempenho. A TI pode testar modelos e implementar processos de treinamento para garantir o desempenho ideal enquanto os líderes de negócios continuam a integrar feedback em seus fluxos de trabalho. Este ciclo constante de treinamento e retreinamento reduzirá o risco ao mesmo tempo em que melhora a acessibilidade dos dados.
À medida que os modelos melhoram, eles se tornarão mais precisos e capazes de construir um contexto maior em torno de conjuntos de dados. Com maior precisão e contexto, esses dados se tornam muito mais valiosos para impulsionar a tomada de decisões e a estratégia de negócios. Aqueles com a melhor estratégia e tomada de decisões manterão uma vantagem competitiva no mercado.