Como este tema funciona na sua empresa
O foco é nos dois primeiros níveis do modelo Kirkpatrick. Reação é simples: após cada treinamento, um formulário rápido (online ou em papel) coleta satisfação. Aprendizagem é observação do gestor — o colaborador está aplicando o que aprendeu? O retorno é imediato e visível no dia a dia.
Estrutura os três primeiros níveis: Reação com formulário padronizado, Aprendizagem com avaliação pós-treinamento (teste ou exercício), Comportamento com acompanhamento de gestor após 30-60 dias. Resultado é mais difícil de medir diretamente, mas sinais de impacto começam a aparecer em métricas de performance.
Implementa os quatro níveis com rigor. Reação + Aprendizagem + Comportamento com acompanhamento estruturado + Resultados com análise de dados: impacto em performance, retenção, produtividade. Integração com sistemas de gestão de talento e analytics permite correlação entre treinamentos e resultados de negócio.
O modelo Kirkpatrick é o framework mais utilizado no mundo para medir o impacto real de treinamentos. Criado por Donald Kirkpatrick em 1959, ele estabelece que todo programa de aprendizagem e desenvolvimento deve ser avaliado em quatro níveis progressivos: Reação (como as pessoas se sentiram), Aprendizagem (o que as pessoas aprenderam), Comportamento (o que as pessoas fazem de forma diferente no dia a dia) e Resultados (qual é o impacto nos objetivos do negócio). A maioria das organizações para no primeiro nível; as que implementam os quatro obtêm evidência clara de retorno sobre investimento em treinamento.
Os 4 níveis de Kirkpatrick: entender a progressão
O modelo funciona como uma progressão em dificuldade: cada nível exige mais esforço para medir, mas oferece informação mais valiosa sobre impacto real.
Nível 1 — Reação: "Como as pessoas se sentiram?" É a avaliação de satisfação imediata. O treinamento foi agradável? O instrutor foi claro? O local era confortável? Formulários preenchidos ao final da aula medem reação emocional. É simples, rápido e barato — mas mede apenas satisfação, não aprendizado. Uma pessoa pode sair satisfeita e não ter aprendido nada.
Nível 2 — Aprendizagem: "O que as pessoas aprenderam?" Avalia conhecimento adquirido. Prova, simulação, exercício prático — medem se a pessoa dominou o conteúdo. Mais rigoroso que reação, mas ainda no contexto do treinamento. Uma pessoa pode passar na prova e não aplicar o conhecimento no dia a dia.
Nível 3 — Comportamento: "O que as pessoas fazem de forma diferente no trabalho?" Observa mudança efetiva no desempenho. O colaborador que fez treinamento de comunicação agora faz reuniões mais produtivas? O que fez treinamento de liderança coaching agora cria espaço para seu time falar? Exige acompanhamento 30-60 dias após treinamento — quando comportamento novo (ou não) virou rotina.
Nível 4 — Resultados: "Qual é o impacto nos objetivos do negócio?" Mede resultado final: a empresa lucrou mais? Retenção aumentou? Segurança melhorou? Qualidade aumentou? Este nível é o mais difícil porque exige isolamento de variáveis — o resultado aconteceu por causa do treinamento ou por outros fatores?
A progressão é sequencial: se nível 3 (comportamento) não acontece, nível 4 (resultados) também não acontecerá. Se nível 2 (aprendizagem) não acontece, comportamento muda apenas por sorte. Se nível 1 (reação) é negativa, os outros níveis enfrentam resistência emocional.
Por que as organizações param no nível 1
Pesquisa da ATD (Association for Talent Development) mostra que 98% das organizações medem reação, 50% medem aprendizagem, 10% medem comportamento e apenas 2% medem resultados de negócio.[1] O padrão é claro: quanto mais rigoroso o nível, menos organizações implementam.
A razão é simples: reação é fácil. Um formulário de três perguntas respondido ao final da aula. Aprendizagem exige um pouco mais de rigor — uma prova. Comportamento exige disciplina — acompanhamento após o treinamento com o gestor. Resultados exigem sofisticação — dados, análise, isolamento de variáveis.
O risco disso: medir apenas reação oferece falso senso de segurança. "Os colaboradores saíram satisfeitos — o treinamento funcionou." Mas satisfação não é impacto. O treinador mais carismático gera reação excelente e aprendizado mínimo. O melhor treinador gera reação boa e aprendizado transformador.
Organizações que implementam até comportamento (nível 3) têm evidência clara de que o treinamento impacta o dia a dia. Organizações que implementam até resultados (nível 4) têm evidência de impacto no negócio — e isso justifica investimento futuro em programas similares.
Implementando o nível 2: Aprendizagem
Avaliar aprendizagem exige rigor sobre o que foi ensinado. A pergunta é simples: "O que a pessoa precisa aprender?" A resposta exige clareza.
Técnicas práticas:
Teste de conhecimento: Prova ao final do treinamento. Eficaz para conteúdo objetivo (conceitos, procedimentos, ferramentas). Menos eficaz para competências comportamentais (liderança, comunicação).
Simulação ou role-play: Prática do aprendizado em contexto similar ao real. O treinado de vendas faz simulação de atendimento. Treinado de mediação treina como lidar com conflito. Oferece feedback imediato e prático.
Projeto ou case: Aplicação do aprendizado em um desafio real ou similar. Exemplo: treinamento de análise de dados termina com projeto analisando dados reais da empresa. Avalia se conseguem usar o aprendizado em contexto complexo.
Discussão facilitada: Menos formal, mas valioso. Instrutor pergunta: "Como vocês aplicariam isso no seu contexto?" Respostas revelam se compreenderam (ou não) o conceito.
O desafio do nível 2 é que nem todo aprendizado é testável. Como testar se alguém internalizou um valor? Competências comportamentais são melhor avaliadas no nível 3 (comportamento).
Implementando o nível 3: Comportamento — onde impacto fica visível
Este é o nível crítico. Um colaborador pode estar satisfeito (nível 1) e saber o conteúdo (nível 2) e mesmo assim não mudar seu comportamento no trabalho. O treinamento fica teórico — conhecimento sem aplicação.
Implementar nível 3 exige observação estruturada:
Acompanhamento por gestor: 30-60 dias após treinamento, o gestor observa: está aplicando? Em que contextos? O que facilitou? O que dificultou? Conversas periódicas (não formais, integradas no 1-on-1) revelam adoção real.
Auto-relato do treinado: Fazer o colaborador refletir: "Como você aplicou isso esta semana?" Menos objetivo que observação, mas oferece insights sobre intenção e barreiras.
Feedback de pares ou clientes: Para competências interpessoais, perguntar a quem interage com o treinado: "Você notou mudança?" Exemplo: após treinamento de comunicação, colegas percebem melhor escuta?
Métricas comportamentais: Dados que refletem comportamento. Exemplo: após treinamento de gestão de tempo, dias de entrega dentro do prazo aumentaram? Após treinamento de segurança, comportamentos inseguros diminuíram?
O nível 3 revela a verdade: o treinamento mudou ou não mudou o dia a dia. Muitos treinamentos falham aqui não por falta de qualidade do treinamento, mas por falta de suporte pós-treinamento. O colaborador aprendeu, mas voltou para um ambiente que não incentiva a aplicação. Gestor não deu espaço. Sistema não foi ajustado. Pressão do dia a dia sobrepesou a mudança.
Conversas diretas. O gestor (muitas vezes o dono) está próximo e observa naturalmente. O acompanhamento é informal, mas efetivo. O desafio é consistência — alguns colaboradores recebem acompanhamento, outros não.
Estruturado, mas ágil. RH estabelece protocolo: 30 dias após treinamento, gestor preenche formulário simples sobre aplicação e resultados. Coleta dados sem burocratizar. Identifica padrões de sucesso e barreiras comuns.
Sistemático e com rigor. Protocolo estruturado com marcos (15 dias, 30 dias, 60 dias). Gestor registra observações em plataforma. RH acompanha taxa de adoção. Para competências críticas, feedback de pares via pesquisa. Integração com sistema de desempenho identifica correlação entre treinamento e performance.
Implementando o nível 4: Resultados — conectando treinamento ao negócio
Medir resultados é o objetivo final, mas é complexo porque o resultado final tem muitas causas. Um aumento de vendas pode ser por treinamento de vendas, ou por melhor economia, ou por concorrente saindo do mercado, ou pura sorte.
Estratégias práticas para isolar o efeito do treinamento:
Grupo de controle: Treina um grupo, deixa outro igual sem treinamento. Compara resultados. Se grupo treinado tem 20% mais vendas e grupo de controle está igual, o treinamento tem impacto. Desafio ético e prático: nem sempre é viável deixar grupo sem treinamento.
Antes e depois: Mede resultado no período pré-treinamento e pós-treinamento no mesmo grupo. Desafio: outras variáveis podem ter mudado entre antes e depois (economia melhorou, concorrência mudou, etc).
Análise correlacional: Dados dos treinados que completaram vs. que não completaram. Começaram com performance similar? Quem completou tem resultado melhor? Correlação não prova causalidade, mas oferece sinal.
Indicadores substituição: Quando resultado final é difícil medir, usar indicador substituto. Exemplo: treinamento de segurança — resultado final seria "zero acidentes" (raro). Indicador substituto: comportamentos de segurança aumentaram, resposta a risco melhorou, reportes de quase-acidentes aumentaram (sinal de maior consciência).
Métricas comuns de resultado:
Retenção: programa de desenvolvimento reduz turnover? Produtividade: treinamento de ferramenta aumenta output? Qualidade: treinamento de processo reduz defeitos ou retrabalho? Segurança: reduz incidentes? Satisfação de cliente: melhora NPS ou satisfação relatada? Receita: correlação com resultado financeiro?
O nível 4 exige disciplina de dados, mas quando implementado bem, oferece justificativa incontestável para investimento em treinamento. Executivos que precisam de ROI ganham evidência.
Limitações e evolução do modelo Kirkpatrick
O modelo Kirkpatrick é robusto, mas tem limitações que pesquisadores identificaram ao longo dos anos:
Assume linearidade: O modelo assume que nível 1 leva a nível 2, que leva a nível 3, que leva a nível 4. Na prática, nem sempre. Uma pessoa pode não gostar (reação ruim) mas aprender muito. Ou gostar muito e aplicar (nível 3) mas não impactar resultado mensurável (nível 4).
Ignora contexto organizacional: O melhor treinamento do mundo não muda comportamento se a organização não suporta. Se treino como fazer reunião produtiva mas a cultura é de email infinito, a aplicação é bloqueada. O modelo culpa o treinamento; a culpa é do contexto.
Dificuldade em medir resultados: Nível 4 é tão complexo que poucas organizações implementam. Resultado tem múltiplas causas. Causação é impossível provar sem experimento controlado rigoroso.
Foco em individual, não em sistema: O modelo acompanha se o indivíduo mudou. Menos útil para programas que visam mudar a organização (cultura, estrutura, processos).
Tempo de medição: Quando medir nível 3 e 4? 30 dias? 90 dias? 1 ano? Comportamento novo leva tempo para estabilizar. Resultado às vezes é ainda mais lento.
Pesquisadores (Kirkpatrick Partners — evolução criada pelo próprio Donald e sua filha Wendy) evoluíram o modelo: adicionaram contexto (suporte pós-treinamento importa), nível de intenção de uso (antes mesmo do treinamento, qual é a motivação?) e isolamento de variáveis (reconhecer que resultado tem múltiplas causas, não só treinamento).[2]
Mas o core permanece válido: medir em progressão oferece rigor crescente. Reação oferece feedback imediato. Aprendizagem valida se conteúdo foi compreendido. Comportamento valida se aplicação é real. Resultados validam se impacto no negócio existe.
Guia prático: começar de onde sua empresa está
Se sua empresa mede só reação: Adicione um nível: aprendizagem. Um formulário pós-treinamento ("O que você aprendeu? Como pretende usar?") ou uma discussão facilitada oferece nível 2 com pouco esforço. Resultado: primeira validação de que aprendizado realmente aconteceu.
Se sua empresa mede reação + aprendizagem: Próximo passo é comportamento. Estabeleça protocolo simples: 30 dias após treinamento, gestor de cada treinado responde "aplicou?" em forma de rápida pesquisa (3-5 perguntas). Resultado: você verá que nem tudo que é aprendido é aplicado — e por quê.
Se sua empresa mede até comportamento: Adicione resultado. Escolha um programa crítico (liderança, vendas, segurança). Para esse, coleta dado de resultado (promoção, vendas, incidentes). Compara treinados vs. não-treinados. Resultado: primeira evidência de impacto real.
Investimento necessário: Nível 1-2 é baixo (formulários). Nível 3 exige disciplina de acompanhamento (30-60 dias por gestor). Nível 4 exige data literacy e análise (mais alguém dedicado ou sistema). Comece onde está, melhore gradualmente. O valor cresce exponencialmente.
A pesquisa do LinkedIn Learning mostra que organizações que medem até nível 3 (comportamento) têm 50% maior retenção e 40% maior produtividade em treinados comparado a organizações que só medem reação.[3] O investimento em medir além do nível 1 paga.
Por que medir impacto importa para desenvolvimento de pessoas
Sem medição, treinamento é gasto de esperança. Com medição, é investimento com retorno comprovado. A diferença é fundamental para como executivos financiam — ou não — programas de aprendizagem e desenvolvimento.
Medir impacto também retroalimenta: você descobre quais treinamentos funcionam e quais não. Qual instrutor gera aprendizado real vs. satisfação performática. Qual timing (antes do evento crítico? depois?) gera maior aplicação. Essas insights permitem que você otimize continuamente o portfólio de treinamentos — investindo mais onde há comprovado retorno.
A organização que implementa o modelo Kirkpatrick rigorosamente ganha vantagem competitiva: desenvolvimento de pessoas deixa de ser iniciativa periódica para se tornar estratégia contínua, refinada por dados de impacto real.
Foque nos niveis 1 e 3 de Kirkpatrick: pesquisa de satisfacao simples e conversa com gestor sobre mudanca de comportamento. Com equipes pequenas, observacao direta e a ferramenta mais poderosa de avaliacao de impacto.
Implemente os 4 niveis progressivamente: reacao por pesquisa, aprendizagem por avaliacao pre e pos, comportamento por feedback de gestor em 60 dias e resultados por metricas de area. Dashboard trimestral consolida visao de impacto.
Sistema integrado de medicao em todos os niveis com analytics avancado. Grupo controle para programas estrategicos. Correlacao com metricas de negocio (produtividade, retencao, qualidade). Report para board com ROI documentado por programa.
Nao precisa medir tudo. Escolha um programa critico e aplique Kirkpatrick completo como piloto. O aprendizado do processo e mais valioso que a sofisticacao da medicao. Documente resultados para construir credibilidade de L&D.
Padronize formularios de avaliacao e frequencia de medicao para todos os programas. Nivel 1 e 2 para todos, nivel 3 e 4 para programas estrategicos. Treine gestores para dar feedback estruturado sobre transferencia de aprendizagem.
Invista em plataforma de learning analytics que automatize coleta e consolidacao. Equipe de dados dedicada para analise de impacto. Publique internamente resultados para fortalecer cultura de investimento em desenvolvimento baseado em evidencia.
Sinais de que sua empresa precisa estruturar a área de treinamento e desenvolvimento
Se você se reconhece em três ou mais cenários abaixo, é provável que a falta de estratégia em T&D esteja limitando o crescimento das pessoas e da organização.
- Treinamentos são contratados de forma reativa — surgem quando alguém reclama ou quando há orçamento sobrando, sem conexão com a estratégia do negócio.
- Não existe levantamento estruturado de necessidades de treinamento — as demandas chegam por achismo ou por pressão da liderança.
- A área de T&D não consegue demonstrar o impacto do que faz — quando questionada sobre ROI, não tem dados para responder.
- Os mesmos treinamentos são oferecidos há anos, independentemente de mudanças no mercado, na tecnologia ou na estratégia da empresa.
- Colaboradores consideram os treinamentos obrigatórios perda de tempo — a taxa de conclusão é baixa e o NPS dos programas é mediano.
- Não há trilha de desenvolvimento para nenhum público — cada treinamento é um evento isolado sem continuidade.
- A empresa investe em treinamento, mas o aprendizado não se transfere para o trabalho — as pessoas voltam ao modo anterior em poucas semanas.
Caminhos para estruturar treinamento e desenvolvimento na sua organização
Não existe formato único de área de T&D que funcione para toda empresa. A melhor abordagem depende do porte, da maturidade de RH e das prioridades estratégicas.
Viável quando a empresa tem profissional de RH dedicado a desenvolvimento e acesso a plataformas de aprendizagem.
- Perfil necessário: profissional de T&D ou L&D com experiência em levantamento de necessidades, desenho instrucional e gestão de programas de aprendizagem
- Tempo estimado: 4 a 8 meses para estruturar a área, definir prioridades e lançar os primeiros programas
- Faz sentido quando: a empresa tem clareza sobre as competências que precisa desenvolver e busca execução, não diagnóstico
- Risco principal: a área virar uma "fábrica de cursos" desconectada do negócio — muito conteúdo, pouco impacto
Indicado quando a empresa precisa de diagnóstico, desenho estratégico da área ou metodologias que exigem expertise externa.
- Tipo de fornecedor: Consultoria de T&D, Consultoria de Educação Corporativa, Plataforma de Aprendizagem com serviço consultivo
- Vantagem: visão estratégica, benchmark de mercado, experiência com múltiplos contextos e acesso a conteúdos e metodologias atualizadas
- Faz sentido quando: a empresa está criando a área do zero, precisa reposicionar T&D como função estratégica, ou quer implementar universidade corporativa
- Resultado típico: diagnóstico em 1 a 2 meses, estratégia e roadmap em 2 a 3 meses, primeiros programas rodando em 4 a 6 meses
Quer estruturar ou fortalecer o treinamento e desenvolvimento na sua empresa?
Se investir no desenvolvimento das pessoas de forma estratégica é prioridade, o oHub conecta você gratuitamente a consultorias e fornecedores especializados em T&D e educação corporativa. Em menos de 3 minutos, sem compromisso.
Encontrar fornecedores de RH no oHub
Sem custo, sem compromisso. Você recebe propostas e decide se e com quem avançar.
Perguntas frequentes
Qual é a diferença entre os 4 níveis de Kirkpatrick?
Nível 1 (Reação) mede satisfação imediata — como a pessoa se sentiu. Nível 2 (Aprendizagem) valida se aprendeu o conteúdo. Nível 3 (Comportamento) observa se aplicou no dia a dia. Nível 4 (Resultados) mede impacto no negócio. Cada nível é progressivamente mais difícil de medir, mas mais valioso para validar impacto real.
Por que a maioria das organizações para no nível 1?
Reação é fácil e barata de medir — um formulário ao final da aula. Comportamento exige acompanhamento após o treinamento. Resultados exigem análise de dados. Quanto mais rigoroso, mais trabalho. A maioria não vai além do nível 1, mas organizações que medem até nível 3 (comportamento) ganham 50% maior retenção e 40% maior produtividade nos treinados.
Como medir o nível 3 (Comportamento)?
Acompanhamento estruturado 30-60 dias após o treinamento. O gestor observa: está aplicando o aprendizado? Como? Quais facilitadores e barreiras? Formulário simples ou conversa no 1-on-1 coleta dados. Para competências interpessoais, feedback de pares ou clientes oferece perspectiva adicional.
É possível medir o nível 4 (Resultados) com rigor?
É desafiador porque resultado tem múltiplas causas. Grupo de controle oferece máximo rigor (treina um grupo, deixa outro igual sem treinar, compara). Análise antes-e-depois ou correlacional oferece nível inferior de rigor, mas viável. Começar com um programa crítico e indicadores claros (vendas, retenção, produtividade) simplifica a medição.
Fontes e referências
- Association for Talent Development. 2025 State of the Industry Report: Learning and Development in Organizations.
- Kirkpatrick Partners. The Kirkpatrick Model: A Four-Level Approach to Evaluating Training Programs.
- LinkedIn Learning. Workplace Learning Report 2025: Impact of Learning on Retention and Productivity.
- McKinsey & Company. Beyond Hiring: How Companies Are Reskilling to Address Talent Gaps.