Text zu Sprache

Text in Stimme verwandeln

Sprachsynthese im Browser mit Tempo, Tonhöhe, Lautstärke und Systemstimmen.

Zeichenanzahl: 0

Tipp: Zum Aufnehmen: Sprechen drücken, dann Ihren Systemrekorder nutzen (z. B. Windows-Spielleiste: Win+G; macOS-Aufnahmeleiste: Cmd+Umschalt+5) oder eine vertrauenswürdige Browser-Erweiterung.

Verwandte Tools

Wozu Text-zu-Sprache?

Barrierefreiheit, Sprachübung, Korrekturlesen mit den Ohren oder konsumieren ohne die Hände — ohne separate Desktop-TTS-App für einen schnellen Durchgang.

Vorteile

  • Barrierefreiheit: Inhalt vorgelesen hören.
  • Lernen: Aussprache und Hörverständnis.
  • Multitasking: zuhören, während Sie etwas anderes tun.
  • Privat: Text bleibt im Ablauf des Browser-Tabs.
  • Kostenlos: Basisfunktion ohne Anmeldung.

Funktionsweise

Die Seite kapselt die Standard-Web-Speech-API: eine Äußerung pro Sprechen-Aktion, an Ihre Steuerung gebunden.

Was der Browser tut

  • Stimmen: lokal aufgezählt; Qualität je nach Engine.
  • Äußerung: ein SpeechSynthesisUtterance mit Ihrem Text.
  • Parameter: rate, pitch, volume vor speak() gesetzt.
  • Lebenszyklus: Pause/Fortsetzen/Abbrechen rufen Synthese-APIs auf.
  • Kein Server: wir streamen kein Audio von einem Backend.

Ablauf

  • Einfügen: sauberer Text hilft bei natürlichen Pausen.
  • Stimme: Sprache möglichst an den Inhalt anpassen.
  • Regler: nach kurzem Test justieren.
  • Sprechen: starten; Pause/Stopp bei Bedarf.
  • Export: optionale .txt der Einstellungen, nicht WAV/MP3.

Fakten

Herstellerverhalten differiert; mobiles Safari und Desktop-Chrome sind nicht identisch.

Kernpunkte

  • Tempo-Regler von 0,5× bis 2× in 0,1-Schritten.
  • Tonhöhe 0–2, Standard 1.
  • Lautstärke ist 0–1-Verstärkung als Prozentlabel.
  • Stimmen können nach dem ersten Rendern asynchron laden.
  • Systemaudio aufnehmen hängt von OS-Berechtigungen und Tools ab.

Best Practices

Vor langen Sessions auf Klarheit trimmen.

Tipps

  • Interpunktion für Phrasenpausen nutzen.
  • Andere Stimme probieren, wenn Wörter abgehackt klingen.
  • Etwas langsameres Tempo hilft oft bei dichtem Stoff.
  • Stoppen, bevor Sie mitten in der Äußerung die Stimme wechseln — bei kritischen Browsern.
  • Exporttext prüfen, bevor Sie die .txt teilen.

Ideale Einsatzfälle

  • A11y: Pausen bei Bildschirmermüdung.
  • Studium: Notizen anhören.
  • Texten: holprige Sätze hören.
  • Schnelle Demos: interne Vorschau, kein Broadcast-Mastering.

Wann nicht darauf vertrauen

  • Broadcast-taugliche Voiceovers oder Studio-Mastering.
  • Sprachen, die Ihre installierten Stimmen schlecht abdecken.
  • Garantierte Phonetik für rechtliche oder medizinische Vorleseprotokolle ohne menschliche Prüfung.

Einschränkungen

API-Unterstützung, Stimmenbestand und Aufnahme-Workflow hängen von Gerät und Browser ab.

Betrieben durch clientseitige Verarbeitung.

Häufige Fragen

Wie funktioniert das?

Die speechSynthesis-Engine Ihres Browsers wandelt das Textfeld lokal in Audio um. Text wird nicht an unsere Server gesendet.

Welche Stimmen erscheinen?

Was der Browser über getVoices() bereitstellt — typischerweise Systemstimmen. Listen unterscheiden sich auf Windows, macOS, Linux, iOS und Android.

Kann ich Tempo und Tonhöhe ändern?

Ja. Standardtempo 1× (Bereich 0,5–2×), Standardtonhöhe 1 (Bereich 0–2). Der Klang hängt von der gewählten Stimme ab.

Lädt es eine MP3 herunter?

Nein. Wiedergabe ist live. Export speichert nur eine .txt-Zusammenfassung; nutzen Sie Systemaufnahme oder Erweiterungen, um die Lautsprecherausgabe aufzuzeichnen, sofern erlaubt.

Wird langer Text unterstützt?

Sie können eine lange Äußerung einreihen; Browser können bei sehr großen Eingaben variieren. Bei Bedarf pausieren/stoppen.

Ist mein Text privat?

Die Verarbeitung bleibt auf Ihrem Gerät über die Browser-API.

Was, wenn mein Browser keine speechSynthesis hat?

Nutzen Sie eine aktuelle Chrome-, Edge-, Safari- oder Firefox-Version mit API-Unterstützung.

Text zu Sprache: online kostenlos in Stimme umwandeln