Text zu Sprache

Wozu Text-zu-Sprache?

Barrierefreiheit, Sprachübung, Korrekturlesen mit den Ohren oder konsumieren ohne die Hände — ohne separate Desktop-TTS-App für einen schnellen Durchgang.

Vorteile

Barrierefreiheit: Inhalt vorgelesen hören.
Lernen: Aussprache und Hörverständnis.
Multitasking: zuhören, während Sie etwas anderes tun.
Privat: Text bleibt im Ablauf des Browser-Tabs.
Kostenlos: Basisfunktion ohne Anmeldung.

Funktionsweise

Die Seite kapselt die Standard-Web-Speech-API: eine Äußerung pro Sprechen-Aktion, an Ihre Steuerung gebunden.

Was der Browser tut

Stimmen: lokal aufgezählt; Qualität je nach Engine.
Äußerung: ein SpeechSynthesisUtterance mit Ihrem Text.
Parameter: rate, pitch, volume vor speak() gesetzt.
Lebenszyklus: Pause/Fortsetzen/Abbrechen rufen Synthese-APIs auf.
Kein Server: wir streamen kein Audio von einem Backend.

Ablauf

Einfügen: sauberer Text hilft bei natürlichen Pausen.
Stimme: Sprache möglichst an den Inhalt anpassen.
Regler: nach kurzem Test justieren.
Sprechen: starten; Pause/Stopp bei Bedarf.
Export: optionale .txt der Einstellungen, nicht WAV/MP3.

Fakten

Herstellerverhalten differiert; mobiles Safari und Desktop-Chrome sind nicht identisch.

Kernpunkte

Tempo-Regler von 0,5× bis 2× in 0,1-Schritten.
Tonhöhe 0–2, Standard 1.
Lautstärke ist 0–1-Verstärkung als Prozentlabel.
Stimmen können nach dem ersten Rendern asynchron laden.
Systemaudio aufnehmen hängt von OS-Berechtigungen und Tools ab.

Best Practices

Vor langen Sessions auf Klarheit trimmen.

Tipps

Interpunktion für Phrasenpausen nutzen.
Andere Stimme probieren, wenn Wörter abgehackt klingen.
Etwas langsameres Tempo hilft oft bei dichtem Stoff.
Stoppen, bevor Sie mitten in der Äußerung die Stimme wechseln — bei kritischen Browsern.
Exporttext prüfen, bevor Sie die .txt teilen.

Ideale Einsatzfälle

A11y: Pausen bei Bildschirmermüdung.
Studium: Notizen anhören.
Texten: holprige Sätze hören.
Schnelle Demos: interne Vorschau, kein Broadcast-Mastering.

Wann nicht darauf vertrauen

Broadcast-taugliche Voiceovers oder Studio-Mastering.
Sprachen, die Ihre installierten Stimmen schlecht abdecken.
Garantierte Phonetik für rechtliche oder medizinische Vorleseprotokolle ohne menschliche Prüfung.

Einschränkungen

API-Unterstützung, Stimmenbestand und Aufnahme-Workflow hängen von Gerät und Browser ab.

Die Text-zu-Sprache Ausgabe laeuft komplett im Browser ohne Server-Upload; Stimme, Tempo und Tonhoehe werden sofort uebernommen.

Häufige Fragen

Wie funktioniert das?

Die speechSynthesis-Engine Ihres Browsers wandelt das Textfeld lokal in Audio um. Text wird nicht an unsere Server gesendet.

Welche Stimmen erscheinen?

Was der Browser über getVoices() bereitstellt — typischerweise Systemstimmen. Listen unterscheiden sich auf Windows, macOS, Linux, iOS und Android.

Kann ich Tempo und Tonhöhe ändern?

Ja. Standardtempo 1× (Bereich 0,5–2×), Standardtonhöhe 1 (Bereich 0–2). Der Klang hängt von der gewählten Stimme ab.

Lädt es eine MP3 herunter?

Nein. Wiedergabe ist live. Export speichert nur eine .txt-Zusammenfassung; nutzen Sie Systemaufnahme oder Erweiterungen, um die Lautsprecherausgabe aufzuzeichnen, sofern erlaubt.

Wird langer Text unterstützt?

Sie können eine lange Äußerung einreihen; Browser können bei sehr großen Eingaben variieren. Bei Bedarf pausieren/stoppen.

Ist mein Text privat?

Die Verarbeitung bleibt auf Ihrem Gerät über die Browser-API.

Was, wenn mein Browser keine speechSynthesis hat?

Nutzen Sie eine aktuelle Chrome-, Edge-, Safari- oder Firefox-Version mit API-Unterstützung.

Online Text zu Sprache Sprachgenerator

Verwandte Tools