Ferramentas relacionadas
Por que usar texto em fala?
Acessibilidade, prática de línguas, rever à escuta ou consumo mãos livres — sem instalar uma app TTS no desktop só para uma passagem rápida.
Benefícios
- Acessibilidade: ouvir o conteúdo lido em voz alta.
- Aprendizagem: pronúncia e audição.
- Multitarefa: ouvir enquanto faz outra coisa.
- Privado: o texto permanece no fluxo do separador do navegador.
- Grátis: reprodução básica sem registo.
Como funciona
A página encapsula a Web Speech API padrão: uma locução por acção Falar, ligada aos seus controlos.
O que o navegador faz
- Vozes: enumeradas localmente; a qualidade varia com o motor.
- Locução: um SpeechSynthesisUtterance com o seu texto.
- Parâmetros: rate, pitch e volume aplicados antes de speak().
- Ciclo de vida: pausa/retomar/cancelar chamam as APIs de síntese.
- Sem servidor: não emitimos áudio a partir de um backend.
Fluxo de trabalho
- Colar: texto limpo ajuda pausas naturais.
- Voz: alinhe idioma e conteúdo quando possível.
- Controlos: ajuste após uma frase de teste curta.
- Falar: inicie; use pausa/parar conforme necessário.
- Exportar: .txt opcional de definições, não WAV/MP3.
Factos
O comportamento do fabricante difere; Safari móvel e Chrome no desktop não são idênticos.
Pontos-chave
- O controlo de velocidade vai de 0,5× a 2× em passos de 0,1.
- O tom usa 0–2 com 1 por defeito.
- O volume é um ganho 0–1 mostrado como percentagem.
- As vozes podem carregar de forma assíncrona após a primeira pintura.
- Gravar áudio do sistema depende de permissões e ferramentas do SO.
Boas práticas
Afine a clareza antes de sessões longas.
Dicas
- Use pontuação para marcar pausas entre frases.
- Experimente outra voz se as palavras soarem cortadas.
- Uma velocidade ligeiramente mais lenta ajuda muitas vezes com texto denso.
- Pare antes de mudar de voz a meio da locução em navegadores exigentes.
- Verifique o texto exportado antes de partilhar o .txt.
Casos ideais
- A11y: pausas para fadiga visual.
- Estudo: ouvir apontamentos.
- Redacção: ouvir frases estranhas.
- Demos rápidas: pré-visualizações internas, não pós-produção para emissão.
Quando não confiar
- Locuções de qualidade de emissão ou masterização em estúdio.
- Idiomas que as vozes instaladas não cobrem bem.
- Fonética garantida para leituras legais ou médicas sem revisão humana.
Limitações
Suporte à API, inventário de vozes e fluxo de gravação dependem do dispositivo e do navegador.
Alimentado por processamento no lado do cliente.
Perguntas frequentes
Como funciona?
O motor speechSynthesis do seu navegador transforma a área de texto em áudio localmente. O texto não é enviado aos nossos servidores.
Que vozes aparecem?
As que o navegador expõe via getVoices() — normalmente vozes do sistema. As listas diferem em Windows, macOS, Linux, iOS e Android.
Posso alterar velocidade e tom?
Sim. A velocidade por defeito é 1× (intervalo 0,5–2×), o tom por defeito é 1 (intervalo 0–2). O som exacto depende da voz escolhida.
Descarrega um MP3?
Não. A reprodução é ao vivo. A exportação guarda só um resumo .txt; use captura do sistema ou extensões para gravar a saída do altifalante se permitido.
Texto longo é suportado?
Pode enfileirar uma locução longa; os navegadores podem variar com entradas muito grandes. Pausar/parar se necessário.
O meu texto é privado?
O processamento fica no seu dispositivo através da API do navegador.
E se o navegador não tiver speechSynthesis?
Use Chrome, Edge, Safari ou Firefox recente com suporte à API.