Alat terkait
Mengapa memakai ekstraktor kata kunci?
Tinjau istilah berulang, gagasan tag, atau bandingkan dua tempelan tanpa mengirim salinan ke server.
Manfaat
- Daftar terurut: lihat yang paling sering sebagai unigram.
- Kontrol: top N, panjang min, tombol stopword.
- Frasa: n-gram opsional 2–5 kata.
- Ekspor: .txt cepat token kata kunci.
- Privat: hanya klien.
Cara kerja
Kantong kata naif dan jendela geser — eksplorasi, bukan pengganti suite SEO atau linguistik.
Yang dilakukan kode
- Normalisasi: huruf kecil; non-\w ke spasi; pisah spasi.
- Unigram: hitung token lewat panjang min; daftar stop Inggris opsional.
- Urut & potong: hitung menurun; simpan top N (≤ unik tersedia).
- N-gram: aliran sama, jendela n kata berurutan; peringkat hitung.
- Ekspor: hanya kata kunci, dipisah baris baru.
Kapan memakai
Kerangka blog, ringkasan mahasiswa, QA konten ringan, cek cepat «kata apa yang kebablasan?».
Kasus ideal
- Sunting: temukan kata berlebihan.
- Naskah: gema frasa lewat n-gram.
- Mengajar: tunjukkan batas tokenisasi.
- Privasi: tempel tanpa jaringan.
- Persiapan: sebelum NLP khusus.
Fakta
Interpretasi bergantung aturan token dan bahasa.
Poin utama
- Daftar stopword bahasa Inggris dan tetap di kode.
- Peringkat n-gram mengabaikan panjang min dan stop yang dipakai unigram.
- Frekuensi tinggi bukan pentingnya topik atau niat pencarian.
- Tempel sangat besar bisa memenuhi batas memori peramban.
- \w mencakup huruf, angka, dan garis bawah di ECMAScript.
Praktik terbaik
Selaraskan dengan alur editorial atau SEO Anda.
Tips kualitas
- Bersihkan markup ke teks biasa dulu untuk hitung adil.
- Coba beberapa panjang min untuk kurangi noise.
- Gabungkan dengan keterbacaan atau korpus untuk analisis serius.
- Jangan anggap daftar ekspor sebagai strategi kata kunci final.
- Pada potongan kode, pengenal bisa mendominasi.
Kapan tidak mengandalkan
- Daftar stop multibahasa atau kebutuhan lematisasi.
- Pelaporan kata kunci hukum, medis, atau compliance.
- Kesetaraan tepat dengan spesifikasi penerbit.
Keterbatasan dan kompatibilitas
Stopword berorientasi Inggris; tokenisasi heuristik; perlu JavaScript.
Didukung pemrosesan sisi klien.
Pertanyaan umum
Apakah gratis dan privat?
Ya. Semua berjalan di peramban; tidak ada unggahan untuk ekstraksi.
Apa itu stopword di sini?
Daftar tetap kecil bahasa Inggris kata sangat umum yang bisa Anda filter agar unigram condong ke kata konten. Tidak bisa disesuaikan di UI.
Apakah n-gram memakai penghapusan stopword?
Tidak. N-gram dibuat dari semua token dinormalisasi tak kosong; hanya daftar unigram yang memakai opsi stopword dan panjang min.
Apa isi ekspor?
Hanya token kata kunci yang terlihat (satu per baris). Hitungan dan n-gram tidak ada di berkas.
Apakah ini sama dengan volume pencarian Google?
Tidak. Ini tampilan frekuensi naif dari teks tempel Anda, bukan alat volume atau peringkat.
Apakah cocok untuk teks non-Inggris?
Tokenisasi mengikuti aturan \w JavaScript; filter stop berorientasi Inggris. Hasil bisa kurang bermakna untuk bahasa lain.