Texto em fala

Ferramentas relacionadas

Por que usar texto em fala?

Acessibilidade, prática de línguas, rever à escuta ou consumo mãos livres — sem instalar uma app TTS no desktop só para uma passagem rápida.

Benefícios

Acessibilidade: ouvir o conteúdo lido em voz alta.
Aprendizagem: pronúncia e audição.
Multitarefa: ouvir enquanto faz outra coisa.
Privado: o texto permanece no fluxo do separador do navegador.
Grátis: reprodução básica sem registo.

Como funciona

A página encapsula a Web Speech API padrão: uma locução por acção Falar, ligada aos seus controlos.

O que o navegador faz

Vozes: enumeradas localmente; a qualidade varia com o motor.
Locução: um SpeechSynthesisUtterance com o seu texto.
Parâmetros: rate, pitch e volume aplicados antes de speak().
Ciclo de vida: pausa/retomar/cancelar chamam as APIs de síntese.
Sem servidor: não emitimos áudio a partir de um backend.

Fluxo de trabalho

Colar: texto limpo ajuda pausas naturais.
Voz: alinhe idioma e conteúdo quando possível.
Controlos: ajuste após uma frase de teste curta.
Falar: inicie; use pausa/parar conforme necessário.
Exportar: .txt opcional de definições, não WAV/MP3.

Factos

O comportamento do fabricante difere; Safari móvel e Chrome no desktop não são idênticos.

Pontos-chave

O controlo de velocidade vai de 0,5× a 2× em passos de 0,1.
O tom usa 0–2 com 1 por defeito.
O volume é um ganho 0–1 mostrado como percentagem.
As vozes podem carregar de forma assíncrona após a primeira pintura.
Gravar áudio do sistema depende de permissões e ferramentas do SO.

Boas práticas

Afine a clareza antes de sessões longas.

Dicas

Use pontuação para marcar pausas entre frases.
Experimente outra voz se as palavras soarem cortadas.
Uma velocidade ligeiramente mais lenta ajuda muitas vezes com texto denso.
Pare antes de mudar de voz a meio da locução em navegadores exigentes.
Verifique o texto exportado antes de partilhar o .txt.

Casos ideais

A11y: pausas para fadiga visual.
Estudo: ouvir apontamentos.
Redacção: ouvir frases estranhas.
Demos rápidas: pré-visualizações internas, não pós-produção para emissão.

Quando não confiar

Locuções de qualidade de emissão ou masterização em estúdio.
Idiomas que as vozes instaladas não cobrem bem.
Fonética garantida para leituras legais ou médicas sem revisão humana.

Limitações

Suporte à API, inventário de vozes e fluxo de gravação dependem do dispositivo e do navegador.

A conversao de texto para voz roda totalmente no navegador sem upload para servidor; voz, velocidade e tom mudam na hora.

Perguntas frequentes

Como funciona?

O motor speechSynthesis do seu navegador transforma a área de texto em áudio localmente. O texto não é enviado aos nossos servidores.

Que vozes aparecem?

As que o navegador expõe via getVoices() — normalmente vozes do sistema. As listas diferem em Windows, macOS, Linux, iOS e Android.

Posso alterar velocidade e tom?

Sim. A velocidade por defeito é 1× (intervalo 0,5–2×), o tom por defeito é 1 (intervalo 0–2). O som exacto depende da voz escolhida.

Descarrega um MP3?

Não. A reprodução é ao vivo. A exportação guarda só um resumo .txt; use captura do sistema ou extensões para gravar a saída do altifalante se permitido.

Texto longo é suportado?

Pode enfileirar uma locução longa; os navegadores podem variar com entradas muito grandes. Pausar/parar se necessário.

O meu texto é privado?

O processamento fica no seu dispositivo através da API do navegador.

E se o navegador não tiver speechSynthesis?

Use Chrome, Edge, Safari ou Firefox recente com suporte à API.

Gerador online de texto para voz