Herramientas relacionadas
¿Para qué usar texto a voz?
Accesibilidad, práctica de idiomas, escuchar borradores o consumir contenido a manos libres—sin instalar una app TTS de escritorio solo para una pasada rápida.
Ventajas
- Accesibilidad: oír el contenido en voz alta.
- Aprendizaje: pronunciación y comprensión oral.
- Multitarea: escuchar mientras haces otra cosa.
- Privado: el texto permanece en el flujo de la pestaña del navegador.
- Gratis: reproducción básica sin registro.
Cómo funciona
La página envuelve la Web Speech API estándar: una locución por acción Hablar, enlazada a tus controles.
Qué hace el navegador
- Voces: enumeradas en local; la calidad varía según el motor.
- Locución: un SpeechSynthesisUtterance con tu texto.
- Parámetros: rate, pitch y volume aplicados antes de speak().
- Ciclo de vida: pausa/reanudar/cancelar llaman a las APIs de síntesis.
- Sin servidor: no transmitimos audio desde un backend.
Flujo de trabajo
- Pegar: texto claro ayuda a las pausas naturales.
- Voz: alinea idioma y contenido cuando puedas.
- Deslizadores: ajústalos tras una frase de prueba corta.
- Hablar: inicia; usa pausa/detener según necesites.
- Exportar: .txt opcional de ajustes, no WAV/MP3.
Datos
El comportamiento del fabricante difiere; Safari móvil y Chrome de escritorio no son idénticos.
Puntos clave
- El deslizador de velocidad va de 0,5× a 2× en pasos de 0,1.
- El tono usa 0–2 con 1 por defecto.
- El volumen es una ganancia 0–1 mostrada como porcentaje.
- Las voces pueden cargarse de forma asíncrona tras el primer pintado.
- Grabar el audio del sistema depende de permisos y herramientas del SO.
Buenas prácticas
Afina la claridad antes de sesiones largas.
Consejos
- Usa puntuación para marcar pausas entre frases.
- Prueba otra voz si las palabras suenan cortadas.
- Una velocidad algo más lenta suele ayudar con texto denso.
- Detén antes de cambiar de voz a mitad de la locución en navegadores exigentes.
- Verifica el texto exportado antes de compartir el .txt.
Casos de uso ideales
- A11y: descansos ante fatiga visual.
- Estudio: escuchar apuntes.
- Redacción: oír frases que suenan raras.
- Demos rápidas: previsualizaciones internas, no postproducción para emisión.
Cuándo no fiarse
- Locuciones de calidad broadcast o masterizado en estudio.
- Idiomas que tus voces instaladas no cubren bien.
- Fonética garantizada para lecturas legales o médicas sin revisión humana.
Limitaciones
Soporte de API, catálogo de voces y flujo de grabación dependen del dispositivo y del navegador.
La conversion de texto a voz se ejecuta completamente en tu navegador sin subir contenido; voz, velocidad y tono cambian al instante.
Preguntas frecuentes
¿Cómo funciona?
El motor speechSynthesis de tu navegador convierte el área de texto en audio de forma local. El texto no se envía a nuestros servidores.
¿Qué voces aparecen?
Las que el navegador expone con getVoices(), normalmente voces del sistema. Las listas difieren en Windows, macOS, Linux, iOS y Android.
¿Puedo cambiar velocidad y tono?
Sí. La velocidad por defecto es 1× (intervalo 0,5–2×), el tono por defecto es 1 (intervalo 0–2). El sonido exacto depende de la voz elegida.
¿Descarga un MP3?
No. La reproducción es en vivo. La exportación solo guarda un resumen .txt; usa la captura del sistema o extensiones para grabar la salida del altavoz si está permitido.
¿Se admite texto largo?
Puedes poner en cola una locución larga; los navegadores pueden variar con entradas muy grandes. Pausa o detén si hace falta.
¿Mi texto es privado?
El procesamiento permanece en tu dispositivo a través de la API del navegador.
¿Y si mi navegador no tiene speechSynthesis?
Usa una versión reciente de Chrome, Edge, Safari o Firefox que admita la API.