Texto a voz

Herramientas relacionadas

¿Para qué usar texto a voz?

Accesibilidad, práctica de idiomas, escuchar borradores o consumir contenido a manos libres—sin instalar una app TTS de escritorio solo para una pasada rápida.

Ventajas

Accesibilidad: oír el contenido en voz alta.
Aprendizaje: pronunciación y comprensión oral.
Multitarea: escuchar mientras haces otra cosa.
Privado: el texto permanece en el flujo de la pestaña del navegador.
Gratis: reproducción básica sin registro.

Cómo funciona

La página envuelve la Web Speech API estándar: una locución por acción Hablar, enlazada a tus controles.

Qué hace el navegador

Voces: enumeradas en local; la calidad varía según el motor.
Locución: un SpeechSynthesisUtterance con tu texto.
Parámetros: rate, pitch y volume aplicados antes de speak().
Ciclo de vida: pausa/reanudar/cancelar llaman a las APIs de síntesis.
Sin servidor: no transmitimos audio desde un backend.

Flujo de trabajo

Pegar: texto claro ayuda a las pausas naturales.
Voz: alinea idioma y contenido cuando puedas.
Deslizadores: ajústalos tras una frase de prueba corta.
Hablar: inicia; usa pausa/detener según necesites.
Exportar: .txt opcional de ajustes, no WAV/MP3.

Datos

El comportamiento del fabricante difiere; Safari móvil y Chrome de escritorio no son idénticos.

Puntos clave

El deslizador de velocidad va de 0,5× a 2× en pasos de 0,1.
El tono usa 0–2 con 1 por defecto.
El volumen es una ganancia 0–1 mostrada como porcentaje.
Las voces pueden cargarse de forma asíncrona tras el primer pintado.
Grabar el audio del sistema depende de permisos y herramientas del SO.

Buenas prácticas

Afina la claridad antes de sesiones largas.

Consejos

Usa puntuación para marcar pausas entre frases.
Prueba otra voz si las palabras suenan cortadas.
Una velocidad algo más lenta suele ayudar con texto denso.
Detén antes de cambiar de voz a mitad de la locución en navegadores exigentes.
Verifica el texto exportado antes de compartir el .txt.

Casos de uso ideales

A11y: descansos ante fatiga visual.
Estudio: escuchar apuntes.
Redacción: oír frases que suenan raras.
Demos rápidas: previsualizaciones internas, no postproducción para emisión.

Cuándo no fiarse

Locuciones de calidad broadcast o masterizado en estudio.
Idiomas que tus voces instaladas no cubren bien.
Fonética garantizada para lecturas legales o médicas sin revisión humana.

Limitaciones

Soporte de API, catálogo de voces y flujo de grabación dependen del dispositivo y del navegador.

La conversion de texto a voz se ejecuta completamente en tu navegador sin subir contenido; voz, velocidad y tono cambian al instante.

Preguntas frecuentes

¿Cómo funciona?

El motor speechSynthesis de tu navegador convierte el área de texto en audio de forma local. El texto no se envía a nuestros servidores.

¿Qué voces aparecen?

Las que el navegador expone con getVoices(), normalmente voces del sistema. Las listas difieren en Windows, macOS, Linux, iOS y Android.

¿Puedo cambiar velocidad y tono?

Sí. La velocidad por defecto es 1× (intervalo 0,5–2×), el tono por defecto es 1 (intervalo 0–2). El sonido exacto depende de la voz elegida.

¿Descarga un MP3?

No. La reproducción es en vivo. La exportación solo guarda un resumen .txt; usa la captura del sistema o extensiones para grabar la salida del altavoz si está permitido.

¿Se admite texto largo?

Puedes poner en cola una locución larga; los navegadores pueden variar con entradas muy grandes. Pausa o detén si hace falta.

¿Mi texto es privado?

El procesamiento permanece en tu dispositivo a través de la API del navegador.

¿Y si mi navegador no tiene speechSynthesis?

Usa una versión reciente de Chrome, Edge, Safari o Firefox que admita la API.

Generador de voz texto a voz online