oHub Base TI Dados e BI Primeiros passos com dados

Avaliação de fontes de dados na empresa

Como inventariar e avaliar fontes de dados existentes antes de iniciar projetos de BI.
Atualizado em: 25 de abril de 2026
Neste artigo: Como este tema funciona na sua empresa Por que avaliar fontes antes de investir em BI Metodologia de descoberta: como encontrar todas as fontes Critérios de avaliação prática Matriz de avaliação: ferramenta prática Classificação de fontes por categoria Identificação de proprietários (data stewardship) Análise de dependências: qual iniciativa usa qual fonte Roadmap de melhoria por fonte Documentação de linhagem (data lineage) Indicadores de que avaliação de fontes é urgente Caminhos para avaliar fontes de dados Precisa avaliar e catalogar suas fontes de dados? Perguntas frequentes Como mapear todas as fontes de dados em uma empresa? Quais critérios usar para avaliar qualidade de uma fonte? Como saber se uma fonte é confiável para BI? Por que precisamos catalogar fontes de dados? Qual é a diferença entre fonte operacional e analítica? Qual é o impacto de usar fontes ruins em BI? Fontes e referências
Compartilhar:
Este conteúdo foi gerado por IA e pode conter erros. ⚠️ Reportar | 💡 Sugerir artigo

Como este tema funciona na sua empresa

Pequena empresa

Poucas fontes (3 a 10 sistemas/planilhas). Mapeamento rápido via entrevistas informais com 2 a 3 dias. Foco em confiabilidade e completude. Resultado: planilha com inventário básico de fontes e responsáveis. Avaliar em 1 a 2 semanas.

Média empresa

Múltiplas fontes (20 a 100 sistemas). Mapeamento formal por departamento em 2 a 3 semanas. Avaliação em matriz estruturada. Resultado: catálogo estruturado em ferramenta simples (planilha, Airtable) com matriz de qualidade e roadmap de melhoria.

Grande empresa

Centenas de fontes. Mapeamento técnico via auditoria de sistemas, entrevistas com data stewards, análise de fluxos. Leva 4 a 8 semanas. Resultado: ferramenta de catalogação robusta (Alation, Collibra) com metadados completos, linhagem de dados, SLAs.

Avaliação de fontes de dados é o processo de inventariar, documentar e avaliar sistemas, bancos de dados e arquivos que contêm informações críticas para o negócio — usando critérios objetivos de qualidade, confiabilidade, cobertura e conformidade para priorizar quais são candidatas a BI[1].

Por que avaliar fontes antes de investir em BI

Muitas empresas pulam avaliação de fontes e vão direto para BI. Resultado: ferramenta bonita servindo dados ruins. Avaliação estruturada de fontes é investimento que se paga rápido evitando esse desperdício.

Avaliação responde: quais dados nós temos? Onde estão? Quem é responsável? Qual é a qualidade? Podemos confiar? Estão atualizados? Atendem conformidade? Essa informação permite tomar decisão inteligente sobre qual ferramenta de BI usar, como estruturar integração, se é necessário limpeza antes de usar.

Além disso, avaliação de fontes cria catálogo que serve de base para toda governança futura. Uma vez catalogadas, fontes podem ser monitoradas, documentadas, rastreadas.

Metodologia de descoberta: como encontrar todas as fontes

Primeiro desafio é fazer inventário completo. Empresas nunca sabem quantas fontes têm até fazer mapeamento disciplinado — dados estão em CRM, ERP, data warehouse antigo, planilhas pessoais, API de ferramenta, arquivo CSV no email de alguém.

Método 1 — Entrevistas com proprietários de dados: Para cada departamento (vendas, financeiro, operações, RH), entreviste responsáveis de dados. Pergunta: "onde estão dados críticos para sua área?" Resultado: lista inicial de fontes. Rápido, mas pode perder fontes que ninguém mantém formalmente.

Método 2 — Auditoria técnica: TI faz varredura de infraestrutura para encontrar todos os bancos de dados, servidores, integrações. Mais completo mas mais demorado. Identifica até fontes "órfãs" que ninguém sabe que existe.

Método 3 — Rastreamento de fluxo de dados: Siga o fluxo de informação. Escolha um dado importante (ex: "cliente"). Trace aonde vem, que sistemas o usam, que transformações sofre. Resultado: mapa de fluxo que identifica todas as fontes que toca esse dado.

Método 4 — Combinação: Melhor abordagem é combinar. Comece com entrevistas (rápido, gera lista inicial). Valide com auditoria técnica. Rastreie fluxos dos dados mais críticos. Resultado é inventário completo e confiável.

Organizar descoberta em fases: fase 1 (2 semanas) — inventário inicial de todas as fontes. Fase 2 (2 semanas) — rastreamento de fluxo das fontes críticas. Fase 3 (contínua) — documentação detalhada conforme evolui BI.

Critérios de avaliação prática

Uma vez descobertas, avaliar usando critérios objetivos. Não é "achismo", é verificação concreta.

Pequena empresa

Avaliação simples: para cada fonte, responda 5 perguntas (quem mantém? com que frequência? qual qualidade percebida? tem backup? atende conformidade?). Score 1-5. Rápido, suficiente para priorizar.

Média empresa

Matriz de avaliação com 7-8 critérios (qualidade, completude, atualização, cobertura, conformidade, documentação, capacidade). Score ponderado. Resultado visualiza quais fontes são candidatas a BI e quais precisam melhoria primeiro.

Grande empresa

Avaliação formal com auditoria técnica, entrevistas estruturadas, análise de SLA, testes de qualidade. Resultado é relatório detalhado com scoring, recomendação por fonte, roadmap de melhoria.

Critério 1 — Qualidade: Dados têm completude (nulos/faltando?), acurácia (estão corretos?), consistência (batem com outras fontes?)? Teste em amostra de 100 registros. Score 1-5 onde 5 é qualidade excelente.

Critério 2 — Completude: Fonte tem cobertura de todos os clientes/produtos/transações relevantes? Ou há gaps onde informação crítica está faltando? Score 1-5 onde 5 é cobertura 100%.

Critério 3 — Atualização (oportunidade): Com que frequência dados são atualizados? Última atualização foi quando? Para BI, dados devem ser pelo menos daily (exceto histórico). Score 1-5 onde 5 é atualização contínua ou daily.

Critério 4 — Confiabilidade de acesso: Você consegue acessar dados facilmente? Há permissões adequadas? Há SLA de disponibilidade? Score 1-5 onde 5 é acesso garantido com SLA.

Critério 5 — Documentação: Há documentação clara sobre o que cada campo significa? Há data dictionary? Score 1-5 onde 5 é documentação completa e atualizada.

Critério 6 — Conformidade: Dados atendem LGPD (se dados pessoais)? Atendem reqs regulatórias do setor (SOX, etc)? Score 1-5 onde 5 é compliance garantido.

Critério 7 — Linhagem (data lineage): Você consegue rastrear origem de cada dado? Que transformações sofre? Score 1-5 onde 5 é linhagem completamente documentada.

Critério 8 — Capacidade técnica: Sistema está operacional? Há risco de descontinuidade? Há suporte ativo? Score 1-5 onde 5 é sistema robusto e bem mantido.

Matriz de avaliação: ferramenta prática

Use matriz para documentar achados e comparar fontes.

Fonte de dados Sistema/Banco Proprietário Qualidade (1-5) Completude (1-5) Atualização (1-5) Documentação (1-5) Conformidade (1-5) Score Total Pronto para BI? Ações Necessárias
Clientes CRM (Salesforce) VP Sales 4 5 5 3 4 21/25 (84%) Sim, com ressalva Melhorar documentação de campos customizados
Transações ERP (SAP) CFO 5 5 5 4 5 24/25 (96%) Sim Nenhuma, usar como está
Produtos Planilha manual Ops Manager 2 3 2 1 2 10/25 (40%) Não Migrar para banco de dados; criar SOP de atualização

Essa matriz ajuda a responder: qual fonte é confiável para BI hoje? Qual precisa limpeza? Qual está inadequada?

Classificação de fontes por categoria

Diferentes tipos de fontes têm diferentes características e manutenção.

Sistema operacional (CRM, ERP, HR system): Mantém dados do dia-a-dia de negócio. Frequentemente é source of truth. Qualidade varia por quanto cuidado há na entrada de dados. Desafio: dados estão otimizados para operação, não para análise — campos podem estar ocultos ou não documentados bem.

Data warehouse: Banco de dados construído especificamente para análise. Dados já estão limpos e estruturados. É fonte ideal para BI se tiver sido bem implementado. Risco: se não for mantido, degrada rápido.

Data lake: Armazém de dados em estado bruto (não limpo). Requer processamento antes de usar em BI. Útil para casos de uso avançados (machine learning), mas não para BI operacional. Requer governança forte.

Arquivo/planilha: CSV, Excel, etc. Frequentemente tem qualidade baixa (duplicatas, nulos, inconsistências). Difícil de manter. Risco de versões desatualizadas espalhadas. Necessário migrar para banco ou integração automática se for crítico.

API/integração: Dados de ferramenta externa (Stripe, HubSpot, etc). Qualidade controlada pelo vendor. Vantagem: suporte do vendor. Desafio: pode ter latência, pode mudar sem aviso.

Sensor/IoT/log: Dados gerados automaticamente por sistema. Volume massivo. Qualidade é mais previsível (errôs são sistemáticos, não aleatórios). Desafio: requer infraestrutura robusto para processar volume.

Mistura de tipos de fonte é normal. Cada tipo tem estratégia diferente de integração e manutenção.

Identificação de proprietários (data stewardship)

Sem proprietário, dados degradam. Proprietário é a pessoa responsável por que dados estejam corretos, atualizados, documentados.

Quem deve ser proprietário? Não é TI (eles são guardiões técnicos). É alguém de negócio que entende o significado dos dados — um gerente de vendas para dados de cliente, um controller para dados de financeiro, etc. Pessoa que sofre quando dados estão errados.

O que proprietário faz? Responde perguntas sobre dados, autoriza mudanças em definições, valida qualidade, coordena limpeza de erros, garante conformidade regulatória. Não precisa de dedicação full-time em empresa pequena — pode ser 10% do tempo.

Como designar? Escolha alguém na área que conhece dados e tem influência. Formalize: carta de designação, clara em responsabilidades (que dados? quais SLAs?), inclua na avaliação de desempenho.

Sem designação formal, proprietário é indefinido — resultado é que ninguém é responsável e dados caem no descuido.

Análise de dependências: qual iniciativa usa qual fonte

Mapeie que iniciativa de BI depende de qual fonte. Isso ajuda a priorizar: fonte crítica para 3 iniciativas tem prioridade maior do que fonte crítica para 1.

Exemplo:

  • Dashboard de receita depende de: dados de transações (ERP), dados de cliente (CRM)
  • Dashboard de RH depende de: dados de pessoas (HR system), dados de folha (payroll)
  • Dashboard operacional depende de: dados de operação (custom system), dados de cliente (CRM), dados de transação (ERP)

Com esse mapeamento, fica claro que dados de cliente e transação têm prioridade alta (usados em múltiplas iniciativas). HR system tem prioridade menor (usado em apenas 1 dashboard).

Roadmap de melhoria por fonte

Uma vez avaliadas, priorizar quais fontes precisam investimento antes de usar em BI.

Categoria A — Pronto para BI agora: Score acima de 80%. Use como está. Apenas manter documentação.

Categoria B — Pronto com ressalva: Score 60-80%. Pode usar mas com cuidados. Exemplo: documentar limitações, usar em BI mas com disclaimer aos usuários, planejar melhoria.

Categoria C — Precisa limpeza antes: Score 40-60%. Pode ser crítica mas qualidade é questionável. Criar plano de limpeza e melhoria de 2 a 6 meses antes de usar em BI.

Categoria D — Não está pronta para BI: Score abaixo de 40%. Não use em BI até investimento significativo. Exemplo: planilha manual, sistema obsoleto, sem documentação. Migrar ou descontinuar.

Roadmap realista: comece com Categoria A no BI, enquanto melhora B e C em paralelo. D é para futuro ou descontinuar.

Documentação de linhagem (data lineage)

Para cada dado crítico, rastrear: de onde vem? Que transformações sofre? Para onde vai?

Exemplo de linhagem para "receita":

  • Origem: tabela "orders" no ERP
  • Transformações: 1) filtrar status = "delivered", 2) somar quantity x price, 3) aplicar desconto, 4) aplicar imposto
  • Destino: "sales_revenue" no data warehouse, que alimenta dashboard de vendas
  • Proprietário: VP de Vendas
  • SLA: atualização daily, latência máxima de 2 horas

Linhagem documentada permite: rastrear erro na fonte, entender transformações, medir impacto de mudança, garantir conformidade.

Ferramentas como Alation, Collibra, Apache Atlas automatizam descoberta de linhagem. Em empresa pequena, documentar manualmente em Wiki ou planilha é suficiente.

Indicadores de que avaliação de fontes é urgente

Se você reconhece dois ou mais cenários abaixo, avaliação estruturada de fontes deve ser prioridade antes de investir em BI.

  • Você está considerando investir em BI mas não tem visibilidade de qualidade das fontes de dados disponíveis.
  • Diferentes áreas usam dados de fontes diferentes para a mesma métrica, criando inconsistência.
  • Há incerteza sobre que dados você tem e onde eles estão localizados na infraestrutura.
  • Não há documentação clara de quem é responsável por manter cada fonte de dados crítica.
  • Você está sofrendo com dados de qualidade questionável em BI atual, mas não sabe qual é a fonte do problema.
  • Auditoria ou compliance questiona a origem e confiabilidade dos dados que você reporta.
  • Há planos para integrar dados de múltiplas fontes mas falta mapa de como fazer de forma confiável.

Caminhos para avaliar fontes de dados

Avaliação pode ser iniciada internamente se há disciplina. Consultor ajuda a estruturar para empresa complexa.

Avaliação interna

Viável para pequena ou média empresa com TI engajada.

  • Perfil necessário: Analista de TI ou BI que conhece infraestrutura e consegue fazer entrevistas de negócio
  • Tempo estimado: 2 a 4 semanas para pequena, 4 a 8 semanas para média empresa
  • Faz sentido quando: Escala é pequena, infraestrutura é relativamente simples
  • Risco principal: Falta de rigor; pode deixar fontes não documentadas
Com apoio especializado

Indicado para empresa complexa ou quando há múltiplas sources de dados.

  • Tipo de fornecedor: Consultoria de BI, consultoria de dados, especialistas em catalogação
  • Vantagem: Experiência em descobrir fontes ocultas, método estruturado, credibilidade para viabilizar roadmap
  • Faz sentido quando: Infraestrutura é complexa; há muitos sistemas; planejamento de BI é ambicioso
  • Resultado típico: Catálogo estruturado com roadmap de integração em 4 a 8 semanas

Precisa avaliar e catalogar suas fontes de dados?

Consultores especializados em BI e catalogação de dados podem ajudar a criar inventário estruturado e avaliar qualidade de fontes. O oHub conecta você com especialistas que já fizeram isso em dezenas de empresas. Descreva sua infraestrutura em 3 minutos e receba propostas de abordagem.

Encontrar fornecedores de TI no oHub

Sem custo, sem compromisso. Você recebe propostas e decide se e com quem avançar.

Perguntas frequentes

Como mapear todas as fontes de dados em uma empresa?

Combine entrevistas com departamentos (para descobrir fontes conhecidas), auditoria técnica (para descobrir fontes ocultas) e rastreamento de fluxos de dados críticos. Em pequena empresa, leva 1 a 2 semanas. Em média, 2 a 4 semanas. Em grande, 4 a 8 semanas.

Quais critérios usar para avaliar qualidade de uma fonte?

Critérios objetivos: qualidade (completude, acurácia, consistência), atualização (frequência), documentação (se está clara), conformidade (LGPD, regulatória), linhagem (rastreabilidade). Para cada um, score 1-5. Score total informa se fonte está pronta para BI.

Como saber se uma fonte é confiável para BI?

Fonte é confiável para BI se: score total de avaliação acima de 80%, tem proprietário designado, tem SLA de atualização, há documentação de linhagem, atende conformidade regulatória. Se score é 60-80%, pode usar com ressalvas. Abaixo de 60%, não use até melhorar.

Por que precisamos catalogar fontes de dados?

Catálogo permite: rastrear que iniciativa usa qual fonte, garantir consistência de dados entre sistemas, planejar integração, documentar propriedade e responsabilidade, facilitar conformidade regulatória, servir como base para governança contínua.

Qual é a diferença entre fonte operacional e analítica?

Operacional é otimizada para inserção/atualização rápida (CRM, ERP). Analítica é otimizada para leitura e agregação (data warehouse). Dados de fonte operacional podem ser usados em BI mas frequentemente precisa de transformação (limpeza, agregação) antes.

Qual é o impacto de usar fontes ruins em BI?

Análises incorretas levam a decisões ruins baseadas em informação falsa — pior do que não ter informação. Além disso, desconfiança em dados (usuários duvidam de relatórios) reduz adoção de BI. Custo estimado: 5% a 15% de receita deixada de lado por decisões erradas.

Fontes e referências

  1. DAMA International. DMBOK 2 — Guide to the Data Management Body of Knowledge. Framework para catalogação e governança de fontes de dados.
  2. DataHub Project. Open source data cataloging and discovery platform. Ferramenta para estruturar catálogo de fontes em empresas maiores.