Keyword-Extraktor

Keywords und Phrasen

Nach Häufigkeit sortierte Wörter und optionale N-Gramme aus eingefügtem Text.

Verwandte Tools

Wozu ein Keyword-Extraktor?

Wiederholte Begriffe skizzieren, Tag-Ideen oder zwei Einfügungen vergleichen — ohne Copy an einen Server zu schicken.

Vorteile

  • Rangliste: sehen, was als Unigramm am häufigsten vorkommt.
  • Steuerung: Top N, Mindestlänge, Stoppwort-Schalter.
  • Phrasen: optionale 2–5-Wort-N-Gramme.
  • Export: schnelle .txt der Keyword-Tokens.
  • Privat: nur clientseitig.

Funktionsweise

Naives Bag-of-Words und gleitende Fenster — Exploration, kein Ersatz für SEO-Suites oder Linguistik-Tools.

Was der Code tut

  • Normalisieren: Kleinbuchstaben; Nicht-\w zu Leerzeichen; Split an Whitespace.
  • Unigramme: Zählen von Tokens über Mindestlänge; optionale englische Stoppliste.
  • Sortieren & Kappen: absteigende Häufigkeit; Top N (≤ verfügbare Unique).
  • N-Gramme: gleicher Strom, zusammenhängende n-Wort-Fenster; Rang nach Häufigkeit.
  • Export: nur Keywords, zeilenweise.

Wann nutzen

Blog-Gliederungen, Studienzusammenfassungen, leichte Content-QA und schnelle „was habe ich überstrapaziert?“-Checks.

Ideale Einsatzfälle

  • Redaktion: übernutzte Wörter erkennen.
  • Entwurf: Phrasen-Echos via N-Grammen.
  • Lehre: Grenzen der Tokenisierung zeigen.
  • Privatsphäre: Offline-Einfügungen.
  • Vorbereitung: vor spezialisiertem NLP.

Fakten

Interpretation hängt von Token-Regeln und Sprache ab.

Kernpunkte

  • Stoppwortliste ist englisch und fest im Code.
  • N-Gramm-Ranking ignoriert Mindestlänge und Stoppwörter der Unigramme.
  • Hohe Häufigkeit ist nicht thematische Wichtigkeit oder Suchintention.
  • Sehr große Einfügungen können Browser-Speichergrenzen erreichen.
  • \w umfasst Buchstaben, Ziffern und Unterstrich in ECMAScript.

Best Practices

Abgleich mit Redaktions- oder SEO-Prozess.

Qualitätstipps

  • Markup zuerst in Klartext wandeln für faire Zähler.
  • Mehrere Mindestlängen testen, um Rauschen zu reduzieren.
  • Mit Lesbarkeit oder Korpus für ernsthafte Analyse kombinieren.
  • Exportlisten nicht als fertige Keyword-Strategie behandeln.
  • Bei Code-Schnipseln können Bezeichner dominieren.

Wann nicht darauf vertrauen

  • Mehrsprachige Stopplisten oder Lemmatisierung nötig.
  • Rechtlich, medizinisch oder compliance Keyword-Reporting.
  • Exakte Übereinstimmung mit Verlagsspezifikation Keywords.

Grenzen und Kompatibilität

Englisch-lastige Stoppwörter; heuristische Tokenisierung; JavaScript erforderlich.

Betrieben durch clientseitige Verarbeitung.

Häufige Fragen

Ist das kostenlos und privat?

Ja. Alles läuft im Browser; für die Extraktion wird nichts hochgeladen.

Was sind hier Stoppwörter?

Eine feste kleine englische Liste häufiger Wörter, die Sie herausfiltern können, damit Unigramme stärker inhaltliche Wörter zeigen. In der UI nicht anpassbar.

Nutzen N-Gramme Stoppwort-Entfernung?

Nein. N-Gramme werden aus allen nicht leeren normalisierten Tokens gebaut; nur die Unigramm-Liste nutzt Stoppwort- und Mindestlängen-Optionen.

Was enthält der Export?

Nur die sichtbaren Keyword-Tokens (eine pro Zeile). Zähler und N-Gramme sind nicht in der Datei.

Entspricht das Google-Keyword-Volumen?

Nein. Das ist eine naive Häufigkeitsansicht Ihres eingefügten Texts, kein Suchvolumen- oder Ranking-Tool.

Funktioniert es für Nicht-Englisch?

Tokenisierung folgt JavaScript-\w-Regeln; Stoppwortfilter ist englisch-lastig. Ergebnisse können in anderen Sprachen weniger sinnvoll sein.

Keyword-Extraktor – Begriffe und Phrasen online kostenlos