Como este tema funciona na sua empresa
Operação produz poucos vídeos por mês — institucional curto, posts de redes sociais, ocasionalmente um tutorial. Acessibilidade entra como legenda automática gerada na própria plataforma (YouTube, Instagram, CapCut) com revisão manual rápida. Audiodescrição e Libras geralmente não fazem parte do fluxo padrão, e a empresa apoia-se em transcrição quando precisa publicar conteúdo crítico. O risco principal é confiar 100% na legenda automática sem revisão — erros em nome de produto, jargão técnico e pontuação prejudicam compreensão e credibilidade.
Volume de vídeos cresce para dezenas por mês, somando posts orgânicos, anúncios, webinars e casos de cliente. Processo de acessibilidade é padronizado: closed caption (legenda selecionável) em todo vídeo público de YouTube e site; legenda queimada (aberta) em vídeo de feed social. Transcrição é publicada como ativo de SEO em páginas de vídeo. Janela de Libras e audiodescrição aparecem em institucional corporativo importante. Equipe interna ou agência mantém manual de boas práticas com tempo de tela, contraste e sincronização.
Centenas de vídeos por mês, com biblioteca estruturada por tipo (institucional, ad, treinamento, suporte). Política formal de acessibilidade cobre legenda, closed caption multilíngue, audiodescrição em narrativos, janela de Libras em institucional corporativo e eventos. Há time dedicado ou parceria com fornecedores especializados (revisores de legenda, intérpretes de Libras certificados, audiodescritores). Conformidade com a Lei Brasileira de Inclusão é validada por jurídico interno, e a empresa publica relatório de acessibilidade para partes interessadas.
Acessibilidade em vídeo
é o conjunto de recursos que tornam o conteúdo audiovisual compreensível para pessoas com deficiência auditiva, visual ou cognitiva — bem como para quem consome com o som desligado: legenda aberta (queimada no vídeo), closed caption (legenda selecionável), transcrição publicada como texto, audiodescrição (narração de elementos visuais relevantes) e janela de Libras (Língua Brasileira de Sinais), seguindo padrões de tempo de tela, contraste, sincronização e densidade de informação.
Por que legenda virou padrão em vídeo
Legenda em vídeo deixou de ser cortesia opcional por três razões convergentes. Primeira: comportamento de consumo. A maioria dos vídeos no feed de redes sociais é consumida com som desligado — usuário rola o feed em transporte público, em escritório aberto, na fila do mercado. Sem legenda, o vídeo passa como ruído visual e a mensagem se perde. Plataformas registram que vídeo com legenda gera mais tempo de visualização e mais conclusão.
Segunda: SEO e descobrimento. Plataformas de busca indexam transcrição e legenda. Vídeo do YouTube com legenda própria (não a automática gerada pela plataforma) tem mais chance de aparecer em busca relevante, porque o algoritmo lê o texto como sinal forte de conteúdo. Transcrição publicada em página de site multiplica o conteúdo indexável e melhora ranking do próprio vídeo na busca interna.
Terceira: acessibilidade e conformidade legal. A Lei Brasileira de Inclusão (Lei 13.146/2015) reforça o direito da pessoa com deficiência a acesso à comunicação em formato adequado. Para vídeo público de empresa — site institucional, anúncios, conteúdo educacional, comunicação com cliente — recursos de acessibilidade são padrão esperado, não bônus. A interpretação detalhada do escopo da obrigação legal específica cabe a assessoria especializada, mas o consenso de mercado é tratar legenda como item obrigatório em qualquer vídeo público.
O resultado é simples: vídeo sem legenda hoje é vídeo subotimizado. Perde alcance, perde busca e perde compatibilidade com normas de inclusão.
Tipos de recurso de acessibilidade em vídeo
Legenda aberta (queimada). Texto incorporado à imagem do vídeo, sempre visível. Usuário não pode desligar. Vantagem: garante que a legenda apareça mesmo quando a plataforma não exibe legenda nativa (como em vídeo de feed do Instagram, Facebook, TikTok). Desvantagem: ocupa espaço fixo na imagem, dificulta tradução multilíngue (precisaria queimar versão por idioma) e prejudica acessibilidade para quem prefere ler legenda em fonte maior.
Closed caption (legenda selecionável). Arquivo separado (SRT, VTT) que o usuário ativa ou desativa na plataforma. Padrão em YouTube, site institucional com player próprio (Wistia, Vimeo, Vidyard, JW Player), plataformas de streaming. Vantagem: usuário escolhe se quer ver e em qual idioma; permite múltiplas faixas de legenda no mesmo vídeo; geralmente exibe nome do falante e indicações sonoras (ex: "[música suave]", "[risos]"). Padrão tecnicamente mais completo.
Transcrição. Texto integral do que é dito no vídeo, publicado como texto na página. Diferente da legenda, não tem marcação de tempo nem aparece sobre o vídeo — é um documento paralelo. Funciona como ativo de SEO (texto indexável) e como recurso de acessibilidade para quem prefere ler em vez de assistir, ou para quem usa leitor de tela. Em vídeo longo (webinar de 60 minutos, podcast), transcrição é praticamente obrigatória para acessibilidade plena.
Audiodescrição. Narração extra que descreve elementos visuais relevantes que não são óbvios pelo áudio principal — quem está em cena, qual é a expressão, o que está acontecendo visualmente, qual texto aparece na tela. Indicada para vídeo narrativo (campanha publicitária, documentário, vídeo de marca com forte componente visual) e institucional importante. Roteiro é gravado por locutor profissional e mixado como faixa separada (geralmente acionada pelo usuário).
Janela de Libras. Intérprete de Língua Brasileira de Sinais aparece em janela sobreposta ao canto do vídeo. Indicada para institucional corporativo importante, comunicação com público amplo, conteúdo público de governo e órgãos regulados. Intérprete deve ser certificado e a janela deve ter tamanho mínimo para permitir leitura da sinalização. Em comunicação ao vivo (live, webinar institucional), Libras costuma ser feita por intérprete em quadro separado durante a transmissão.
Quando usar cada recurso
A escolha do recurso depende do canal de publicação, do tipo de conteúdo e da política da empresa.
Vídeo de feed social (Instagram, TikTok, Reels, LinkedIn, X): legenda queimada é o padrão. A maioria das plataformas oferece legenda nativa, mas a exibição depende da configuração do usuário e nem sempre é consistente. Queimar garante visibilidade universal e cobre o consumo em mute, que é dominante nesse canal.
YouTube: closed caption é o padrão. Faça upload de arquivo SRT próprio (revisado) em vez de confiar 100% na legenda automática gerada pela plataforma. Quando o vídeo for traduzido para outros idiomas, suba arquivos separados — múltiplas faixas de legenda no mesmo vídeo.
Player próprio em site (Wistia, Vimeo, Vidyard): closed caption como padrão e transcrição publicada na página como texto.
Anúncio em vídeo: legenda queimada é praticamente obrigatória — autoplay em mudo é regra em feed e em site com vídeo. Sem legenda, o anúncio passa sem comunicar.
Vídeo institucional crítico (CEO falando, comunicação ao mercado, comunicado público): closed caption, transcrição publicada e — quando aplicável — janela de Libras. Audiodescrição quando o vídeo tem componente visual narrativo forte.
Webinar e live: legenda automática ao vivo (oferecida por Zoom, Google Meet, plataformas de webinar) cobre o evento; transcrição limpa publicada depois cobre acessibilidade plena. Para institucional grande com público amplo, contratar intérprete de Libras ao vivo é a prática consolidada.
Conteúdo educacional e treinamento corporativo: closed caption, transcrição e — em conteúdo público — janela de Libras. Conteúdo de treinamento interno costuma seguir o mesmo padrão da comunicação externa, por consistência.
Comece pelo básico bem feito: legenda em todo vídeo publicado, sem exceção. Use legenda automática do YouTube, Instagram ou CapCut como ponto de partida e dedique 10-15 minutos por vídeo a revisar nomes próprios, jargão técnico, pontuação e quebras de linha. Para vídeo de até 5 minutos, esse esforço é viável e suficiente. Janela de Libras e audiodescrição entram só quando houver demanda específica do contexto (vídeo institucional crítico, conteúdo público). Para esses casos, contrate fornecedor especializado.
Padronize o processo. Documente manual de acessibilidade: tempo máximo de legenda na tela (2 segundos), número máximo de caracteres por linha (32-37), regra de quebra, contraste mínimo, identificação de falante. Defina padrão por tipo de vídeo: feed social = queimada; YouTube + site = closed caption; institucional crítico = closed caption + Libras + transcrição. Trabalhe com revisor de legenda interno ou freelancer dedicado — pular revisão manual é o erro mais caro em volume médio.
Política formal de acessibilidade documentada, aprovada pela diretoria e auditada por jurídico. Biblioteca de vídeo classificada por nível de acessibilidade exigido (público amplo, público restrito, treinamento, ad). Time interno ou contrato com fornecedores especializados (revisor de legenda, intérprete de Libras certificado, audiodescritor). Padrão multilíngue para vídeo de marca global. Indicador interno de cobertura — percentual de vídeos publicados com legenda revisada, com closed caption, com Libras quando aplicável.
Geradores automáticos de legenda
Várias ferramentas geram legenda automática a partir do áudio. Útil como ponto de partida — nenhuma substitui revisão manual.
YouTube. Geração automática de legenda nativa em vídeos enviados ao canal, com transcrição editável. Qualidade depende muito da clareza do áudio e do idioma. Para português brasileiro, costuma errar nome próprio, jargão técnico e palavras com pronúncia regional. Use como base, edite no estúdio do YouTube e publique versão revisada.
CapCut. Geração de legenda automática integrada ao editor, com customização visual fácil (fonte, tamanho, contorno, animação). Indicado para vídeo de feed social — legenda queimada com estética alinhada à plataforma.
Descript. Editor que transcreve o vídeo e permite editar o áudio editando o texto. Útil para podcast em vídeo e webinar — facilita corte por trecho de fala.
Rev. Combina transcrição automática (mais barata) com transcrição feita por humano (mais cara e mais precisa). Padrão internacional para vídeo profissional. Para conteúdo crítico de empresa grande, Rev humano cobre nomes próprios e jargão técnico melhor que automático.
Pictory, HappyScribe, Otter, Sonix. Plataformas que combinam transcrição, legenda e edição de texto-para-vídeo. Cada uma com nicho — Pictory para reaproveitamento de conteúdo, HappyScribe para multi-idioma, Otter para reunião e webinar, Sonix para arquivo de podcast.
Custo de geração automática: gratuito (YouTube, CapCut tier básico) a R$ 1,00-R$ 3,00 por minuto de vídeo em ferramentas pagas. Custo de transcrição humana profissional: R$ 8,00 a R$ 25,00 por minuto, dependendo de prazo, idioma e revisão técnica.
Por que a revisão manual nunca pode ser pulada
Legenda automática melhorou muito, mas ainda erra de formas que comprometem o vídeo:
Nome próprio e marca. "RD Station", "Mailchimp", "HubSpot", "oHub", "Pix", "Bradesco" — algoritmos transcrevem foneticamente e produzem versões erradas que o leitor humano nota imediatamente. Erro em nome de marca em vídeo institucional é constrangedor.
Jargão técnico. Termos específicos de cada indústria (DRE, ESG, ICMS, CRM, B2B, kanban, API, microsserviço) costumam virar palavras genéricas ou erros foneticamente próximos. Em vídeo educacional ou demo de produto, isso compromete a credibilidade do conteúdo.
Pontuação. Legenda automática raramente coloca pontuação correta. Sem pontuação, a leitura fica truncada e a mensagem perde nuance. Revisão precisa adicionar vírgula, ponto, interrogação.
Quebra de linha e ritmo. Algoritmo quebra linha por intervalo de áudio, não por unidade de sentido. Resultado: frases cortadas no meio que dificultam leitura rápida. Revisão precisa reordenar quebras para que cada linha contenha uma unidade compreensível.
Sincronização. Legenda atrasada ou adiantada em mais de 0,5 segundo quebra a relação entre fala e texto. Revisão checa pontos críticos de transição.
Identificação de falante e indicação sonora. Em vídeo com duas pessoas conversando, legenda automática geralmente não identifica quem está falando. Revisão adiciona "[Entrevistador]" e "[Cliente]" para clareza, especialmente importante em vídeo testemunhal.
Padrões técnicos a respeitar
Tempo de tela. Cada bloco de legenda deve permanecer entre 1,5 e 6 segundos. Menos que isso, o leitor não consegue ler; mais que isso, fica preso na mesma frase enquanto a fala já avançou.
Caracteres por linha. 32 a 37 caracteres por linha é o padrão para legibilidade em tela. Mais que isso, a linha extrapola a área segura em mobile vertical.
Linhas por bloco. Máximo duas linhas por bloco de legenda. Três linhas ocupam espaço excessivo na imagem e dispersam atenção.
Contraste. Texto branco com contorno preto fino (ou sombra) é o padrão universal — funciona sobre qualquer fundo. Texto branco puro sobre fundo claro fica ilegível; texto preto sobre fundo escuro também. Para vídeo com áreas variadas, contorno é obrigatório.
Tipografia. Fonte sem serifa, tamanho proporcional ao vídeo (em vídeo vertical para mobile, fonte maior). Evite fonte decorativa, itálico extenso, caps em todo bloco.
Posição. Centralizada e na parte inferior da tela, com margem inferior suficiente para não conflitar com elementos de interface da plataforma (botão de pausa, barra de tempo, watermark).
Densidade. Em fala rápida, legenda pode condensar (resumir) em vez de transcrever palavra por palavra — desde que mantenha o sentido. Transcrição literal de fala muito rápida resulta em legenda que ninguém consegue ler.
Erros comuns que comprometem a acessibilidade
Publicar com legenda automática sem revisão. O risco já discutido — erros em nome de marca, jargão técnico, pontuação. Revisar é regra básica.
Legenda muito rápida ou muito densa. Bloco de 4 linhas que aparece 2 segundos é ilegível. Revise tempo de tela e densidade.
Sem contraste suficiente. Texto branco puro sem contorno sobre fundo claro desaparece. Sempre use contorno ou caixa de fundo.
Confiar só em legenda em vídeo institucional crítico. Vídeo de comunicação importante (CEO falando ao mercado, mensagem da diretoria, evento público) demanda mais que legenda — closed caption, transcrição publicada e, quando aplicável, janela de Libras.
Ignorar transcrição como ativo de SEO. Vídeo de webinar de 60 minutos sem transcrição publicada perde valor enorme em busca. Publicar texto integral em página dedicada ao vídeo multiplica o conteúdo indexável.
Janela de Libras em tamanho insuficiente. Intérprete em janela minúscula no canto da tela cumpre função decorativa, não acessível. A janela precisa ter tamanho que permita leitura clara da sinalização.
Audiodescrição como narração paralela ao áudio principal. Audiodescrição é faixa separada, geralmente acionada pelo usuário, que cobre o silêncio entre falas. Sobrepor narração ao áudio principal confunde em vez de ajudar.
Sinais de que a acessibilidade de vídeo na sua empresa precisa de processo
Se três ou mais cenários abaixo descrevem a sua operação atual, vale estruturar um padrão escrito antes de continuar publicando.
- Vídeos do site institucional são publicados sem legenda.
- Legenda automática gerada pela plataforma nunca é revisada antes da publicação.
- Não existe padrão escrito de tempo de tela, contraste, caracteres por linha e identificação de falante.
- Vídeo institucional importante (CEO, comunicado ao mercado, evento público) é publicado sem janela de Libras nem transcrição.
- Vídeo narrativo com componente visual forte (campanha, documentário) é publicado sem audiodescrição.
- Webinar e live são realizados sem transcrição publicada depois.
- Acessibilidade é tratada como obrigação burocrática, não como padrão de qualidade do conteúdo.
- Vídeo de feed social é publicado sem legenda queimada, com a expectativa de que a plataforma exiba automaticamente.
Caminhos para estruturar acessibilidade em vídeo
A decisão entre estruturar internamente ou contratar fornecedores especializados depende do volume de vídeos, da criticidade do conteúdo e da maturidade do time de marketing.
Equipe de marketing usa geradores automáticos (YouTube, CapCut, Descript) como ponto de partida, revisa manualmente cada vídeo seguindo manual interno, e publica com legenda queimada ou closed caption conforme o canal.
- Perfil necessário: analista de conteúdo ou editor de vídeo com noção de acessibilidade + revisor de texto
- Quando faz sentido: volume mensal de até 30-40 vídeos, conteúdo majoritariamente padrão (sem narrativo crítico), idioma único
- Investimento: tempo do time (10-30 min por vídeo) + assinatura de ferramenta (R$ 50,00 a R$ 300,00 por mês)
Produtora audiovisual ou fornecedor especializado entrega vídeo com legenda revisada, closed caption, transcrição, audiodescrição e janela de Libras quando aplicável. Intérprete de Libras certificado é contratado para institucional crítico e eventos.
- Perfil de fornecedor: produtora audiovisual com pacote de acessibilidade, intérprete de Libras certificado, audiodescritor profissional; consultoria jurídica para interpretação de escopo legal
- Quando faz sentido: volume alto, vídeo institucional crítico, multi-idioma, evento público amplo, exigência regulatória específica
- Investimento típico: R$ 200,00 a R$ 600,00 por vídeo curto com pacote completo; R$ 1.500,00 a R$ 4.000,00 por sessão de intérprete de Libras em evento
Seus vídeos cumprem o padrão de acessibilidade ou ainda dependem só da legenda automática?
O oHub conecta sua empresa a produtoras audiovisuais com pacote de acessibilidade, intérpretes de Libras certificados, audiodescritores e consultoria jurídica especializada. Em poucos minutos, descreva o tipo de vídeo e o canal de publicação e receba propostas de quem entende a operação no Brasil.
Encontrar fornecedores de Marketing no oHub
Sem custo, sem compromisso. Você recebe propostas e decide se e com quem avançar.
Perguntas frequentes
Legenda é obrigatória em vídeo?
Para conteúdo de empresa, legenda é prática consolidada como padrão em todo vídeo publicado, tanto por razões de acessibilidade quanto por consumo em mute no feed social e por SEO. A Lei Brasileira de Inclusão (Lei 13.146/2015) estabelece direito à comunicação acessível para pessoa com deficiência; a interpretação detalhada do escopo exato de obrigação por tipo de vídeo cabe a assessoria jurídica especializada. Independente da obrigação formal, vídeo sem legenda perde alcance e busca — então o consenso de mercado é tratar legenda como item padrão.
Como gerar legenda automática?
Várias ferramentas geram legenda automática: YouTube (no estúdio do criador), CapCut (no editor), Descript, Rev (automático), HappyScribe, Pictory, Otter, Sonix. Custo varia de gratuito (YouTube, CapCut básico) a R$ 1,00 a R$ 3,00 por minuto em ferramentas pagas. Toda legenda automática precisa de revisão manual antes da publicação — algoritmos erram em nome próprio, jargão técnico, pontuação e quebra de linha. Para vídeo crítico, considere transcrição feita por humano (R$ 8,00 a R$ 25,00 por minuto).
Diferença entre legenda aberta e closed caption?
Legenda aberta (também chamada de queimada) é incorporada à imagem do vídeo e está sempre visível — usuário não pode desligar. Padrão para vídeo de feed social (Instagram, TikTok, Reels). Closed caption é arquivo separado (SRT, VTT) que o usuário ativa ou desativa na plataforma, com identificação de falante e indicação sonora — padrão para YouTube, site institucional, plataformas de streaming. Closed caption é tecnicamente mais completa porque permite múltiplos idiomas, ajuste de fonte pelo usuário e leitor de tela.
Quando usar audiodescrição?
Audiodescrição é indicada para vídeo com componente visual narrativo forte — vídeo de marca, campanha publicitária, documentário, vídeo institucional importante com cenas onde elementos visuais carregam informação não óbvia pelo áudio (quem está em cena, o que aparece na tela, expressão de quem fala). Geralmente é gravada por locutor profissional e mixada como faixa de áudio separada, acionada pelo usuário. Em vídeo só de fala (entrevista, webinar), audiodescrição não é necessária — transcrição cobre a função.
Libras em vídeo institucional?
Janela de Libras é recomendada em institucional corporativo importante, comunicação ao mercado, vídeo público amplo e conteúdo de evento aberto. O intérprete deve ser certificado e a janela precisa ter tamanho suficiente para permitir leitura clara da sinalização — janela minúscula no canto não cumpre a função. Em comunicação ao vivo (live, webinar grande), o intérprete aparece em quadro separado durante a transmissão. Para vídeo de feed social rotineiro, Libras não costuma ser padrão; para vídeo institucional crítico, é prática consolidada em empresas maduras.
O que a LBI exige em vídeo?
A Lei Brasileira de Inclusão (Lei 13.146/2015) estabelece o direito da pessoa com deficiência ao acesso à comunicação em formato adequado, inclusive em meios audiovisuais. A interpretação detalhada do escopo de obrigação para cada tipo de vídeo (institucional, ad, conteúdo educativo, comunicação interna) e cada porte de empresa cabe a assessoria jurídica especializada. Para evitar exposição e construir prática alinhada à norma, o padrão de mercado é cobrir legenda em todo vídeo público, closed caption em vídeo de site e YouTube, e janela de Libras com transcrição em institucional crítico — consulte advocacia para parâmetros específicos da sua operação.
Fontes e referências
- W3C — Web Content Accessibility Guidelines (WCAG). Padrões internacionais de acessibilidade digital, incluindo critérios para conteúdo multimídia.
- Lei 13.146/2015 — Lei Brasileira de Inclusão da Pessoa com Deficiência. Marco legal de acessibilidade comunicacional.
- HubSpot. Closed Caption Best Practices — guia de boas práticas para legenda em vídeo de marketing.
- YouTube Creator Academy. Accessibility — diretrizes para criadores sobre legenda, transcrição e acessibilidade em vídeo.
- ANATEL. Normas de acessibilidade em radiodifusão — referência setorial sobre legenda, audiodescrição e Libras em conteúdo audiovisual brasileiro.