Ekstraktor kata kunci: kata kunci & frasa

Alat terkait

Mengapa memakai ekstraktor kata kunci?

Tinjau istilah berulang, gagasan tag, atau bandingkan dua tempelan tanpa mengirim salinan ke server.

Manfaat

Daftar terurut: lihat yang paling sering sebagai unigram.
Kontrol: top N, panjang min, tombol stopword.
Frasa: n-gram opsional 2–5 kata.
Ekspor: .txt cepat token kata kunci.
Privat: hanya klien.

Cara kerja

Kantong kata naif dan jendela geser — eksplorasi, bukan pengganti suite SEO atau linguistik.

Yang dilakukan kode

Normalisasi: huruf kecil; non-\w ke spasi; pisah spasi.
Unigram: hitung token lewat panjang min; daftar stop Inggris opsional.
Urut & potong: hitung menurun; simpan top N (≤ unik tersedia).
N-gram: aliran sama, jendela n kata berurutan; peringkat hitung.
Ekspor: hanya kata kunci, dipisah baris baru.

Kapan memakai

Kerangka blog, ringkasan mahasiswa, QA konten ringan, cek cepat «kata apa yang kebablasan?».

Kasus ideal

Sunting: temukan kata berlebihan.
Naskah: gema frasa lewat n-gram.
Mengajar: tunjukkan batas tokenisasi.
Privasi: tempel tanpa jaringan.
Persiapan: sebelum NLP khusus.

Fakta

Interpretasi bergantung aturan token dan bahasa.

Poin utama

Daftar stopword bahasa Inggris dan tetap di kode.
Peringkat n-gram mengabaikan panjang min dan stop yang dipakai unigram.
Frekuensi tinggi bukan pentingnya topik atau niat pencarian.
Tempel sangat besar bisa memenuhi batas memori peramban.
\w mencakup huruf, angka, dan garis bawah di ECMAScript.

Praktik terbaik

Selaraskan dengan alur editorial atau SEO Anda.

Tips kualitas

Bersihkan markup ke teks biasa dulu untuk hitung adil.
Coba beberapa panjang min untuk kurangi noise.
Gabungkan dengan keterbacaan atau korpus untuk analisis serius.
Jangan anggap daftar ekspor sebagai strategi kata kunci final.
Pada potongan kode, pengenal bisa mendominasi.

Kapan tidak mengandalkan

Daftar stop multibahasa atau kebutuhan lematisasi.
Pelaporan kata kunci hukum, medis, atau compliance.
Kesetaraan tepat dengan spesifikasi penerbit.

Keterbatasan dan kompatibilitas

Stopword berorientasi Inggris; tokenisasi heuristik; perlu JavaScript.

Ekstraksi kata kunci berjalan sepenuhnya di browser tanpa unggah server; hasil dan filter diperbarui seketika.

Pertanyaan umum

Apakah gratis dan privat?

Ya. Semua berjalan di peramban; tidak ada unggahan untuk ekstraksi.

Apa itu stopword di sini?

Daftar tetap kecil bahasa Inggris kata sangat umum yang bisa Anda filter agar unigram condong ke kata konten. Tidak bisa disesuaikan di UI.

Apakah n-gram memakai penghapusan stopword?

Tidak. N-gram dibuat dari semua token dinormalisasi tak kosong; hanya daftar unigram yang memakai opsi stopword dan panjang min.

Apa isi ekspor?

Hanya token kata kunci yang terlihat (satu per baris). Hitungan dan n-gram tidak ada di berkas.

Apakah ini sama dengan volume pencarian Google?

Tidak. Ini tampilan frekuensi naif dari teks tempel Anda, bukan alat volume atau peringkat.

Apakah cocok untuk teks non-Inggris?

Tokenisasi mengikuti aturan \w JavaScript; filter stop berorientasi Inggris. Hasil bisa kurang bermakna untuk bahasa lain.

Alat Keyword dan Frasa