Alat terkait
Mengapa memakai penghitung frekuensi kata?
Temukan istilah yang dipakai berlebihan, gambaran keseimbangan kata kunci, bandingkan draf, atau siapkan daftar istilah cepat tanpa mengunggah naskah.
Manfaat
- Daftar peringkat: jumlah tertinggi di atas.
- Filter: stop word, panjang, ambang kemunculan.
- CSV: bawa tabel ke spreadsheet.
- Langsung: diperbarui saat Anda mengedit.
- Privat: hanya sisi klien.
Cara kerjanya
Alur sederhana: normalisasi huruf, ubah tanda baca jadi spasi, pisah berdasarkan spasi, agregasi jumlah, urutkan, lalu terapkan filter tampilan Anda.
Fitur
- Aturan token: normalisasi bergaya “karakter kata” JavaScript sebelum pemisahan.
- Stop word: kumpulan kecil bahasa Inggris opsional.
- Penggeser: panjang min. 1–10; kemunculan min. 1–10.
- Ekspor: CSV dua kolom.
- UI: kisi responsif yang dapat digulir.
Kapan memakai
Putaran penyuntingan, cek SEO ringan, demo korpus kelas, atau survei kosakata pada teks yang ditempel.
Kasus penggunaan ideal
- Menulis: tangkap pengisi yang berulang.
- Kata kunci: ketenaran istilah kasar (bukan pelacak peringkat).
- Mengajar: tunjukkan tokenisasi naif.
- Log: penghitungan istilah informal.
- QA: sebelum alat NLP khusus.
Fakta
Catatan interpretasi.
Poin utama
- Penghapusan stop word hanya untuk Inggris dan terbatas pada daftar bawaan.
- Tidak ada stemming atau lematisasi — run, runs, running dihitung terpisah.
- Aksara non-Latin mungkin tidak cocok dengan tokenisasi “karakter kata” seperti yang Anda harapkan.
- Panjang minimum memakai jumlah karakter string token setelah normalisasi.
- Input sangat besar dapat mencapai batas memori browser.
Praktik terbaik
Gunakan secara bertanggung jawab.
Pertimbangan kualitas
- Untuk SEO produksi, gabungkan dengan alat khusus dan pemrosesan yang sadar locale.
- Pratinjau CSV di spreadsheet sebelum berbagi.
- Coba pengaturan panjang min. berbeda untuk mengurangi noise dari token pendek.
- Simpan salinan teks mentah sebelum penyaringan agresif.
- Untuk kode, perkirakan kata kunci dan string mendominasi frekuensi.
Kapan tidak memakai
- Saat Anda butuh daftar stop word multibahasa atau normalisasi morfologis.
- Saat hukum atau kepatuhan mewajibkan pipeline NLP yang diaudit.
- Saat batas token harus persis sesuai spesifikasi penerbit tertentu.
Keterbatasan dan kompatibilitas
Tokenisasi naif; daftar stop word Inggris; hanya ekspor CSV. Membutuhkan JavaScript.
Didukung pemrosesan di sisi klien.
Pertanyaan yang sering diajukan
Apakah penghitung frekuensi kata gratis?
Ya. Analisis berjalan di browser Anda. Tanpa pendaftaran atau unggahan.
Apa itu stop word?
Kata bahasa Inggris yang sangat umum (mis. the, and, of) yang dapat Anda sembunyikan secara opsional agar daftar menonjolkan kata bermakna. Daftarnya tetap dan berorientasi Inggris.
Bagaimana kata dideteksi?
Teks dijadikan huruf kecil; tanda baca diubah menjadi spasi; token lalu dipisah berdasarkan spasi. Hanya token yang memenuhi panjang minimum Anda yang dihitung (dan stop word dapat dihapus).
Apa fungsi kemunculan minimum?
Setelah frekuensi dihitung, hanya token yang jumlahnya setidaknya sebesar itu yang muncul dalam kisi dan ekspor.
Bisakah saya mengekspor hasilnya?
Ya. Ekspor CSV mengunduh tabel terfilter (kolom kata dan jumlah).
Apakah teks saya aman?
Ya. Pemrosesan tetap di perangkat Anda.
Apa bedanya dengan penghitung kata?
Penghitung kata menampilkan total. Di sini Anda melihat setiap token berbeda dan berapa kali muncul.