Penganalisis teks

Analisis statistik teks

Alat online gratis untuk hitungan, waktu baca, frekuensi kata, dan frekuensi karakter.

Alat terkait

Mengapa memakai penganalisis teks?

Penuhi batas kata, periksa draf, temukan istilah yang berlebihan, atau ekspor snapshot metrik sebelum menerbitkan—tanpa mengirim draf ke server.

Manfaat

  • Metrik langsung: diperbarui saat mengetik.
  • Waktu baca: perkiraan sederhana 200 KPM.
  • Campuran kata: menampilkan token panjang berulang.
  • Campuran karakter: frekuensi huruf dan angka sekilas.
  • Privat: hanya di klien.

Cara kerja

Alat ini meng-tokenize dengan pisahan string JavaScript dan heuristik regex yang cocok untuk teks biasa mirip bahasa Inggris—bukan parsing linguistik.

Yang diukur

  • Karakter: panjang total dan panjang tanpa spasi putih.
  • Kata: dipisah spasi setelah trim seluruh input.
  • Baris dan paragraf: pisahan baris baru; paragraf pisah pada baris kosong.
  • Kalimat: pisah pada ., !, dan ? (naif).
  • Daftar: token teratas dan simbol a–z / 0–9 utama.

Kapan memakai

Posting blog, tugas, buletin, keterangan gambar, dan pass edit atau SEO ringan.

Kasus ideal

  • Batas kata: esai dan formulir dengan batas kata.
  • Penyuntingan: kata berulang terlihat di grid.
  • Perencanaan: bandingkan draf menurut panjang dan waktu.
  • Pengajaran: tunjukkan tokenisasi naif.
  • QA cepat: sebelum tempel ke CMS atau email.

Fakta

Catatan interpretasi.

Poin penting

  • Waktu baca dibulatkan ke atas ke menit penuh pada 200 KPM.
  • «Kalimat» menghitung segmen setelah pisah pada . ! ?—kutipan dan singkatan bisa memiringkan hitungan.
  • Bahasa dengan aksara non-Latin tidak akan di-tokenize sama seperti Inggris untuk daftar kata.
  • Kata paling umum memakai karakter kata ASCII gaya /\w/ di regex pemindai.
  • Teks kaya dari Word atau HTML sebaiknya ditempel sebagai teks biasa untuk hitungan bermakna.

Praktik terbaik

Gunakan angka secara bertanggung jawab.

Pertimbangan kualitas

  • Untuk batas akademis atau hukum, konfirmasi dengan aturan penghitungan panduan gaya Anda.
  • Pasangkan dengan alat keterbacaan khusus jika Anda perlu skor bertingkat.
  • Untuk kode, gunakan penghitung yang sadar kode—komentar dan string berbeda dari prosa.
  • Periksa input sangat pendek di mana heuristik berfluktuasi kuat.
  • Simpan cadangan asli sebelum sunting keras demi panjang.

Kapan tidak mengandalkan ini

  • Saat Anda perlu batas kata sadar lokal atau hitungan suku kata.
  • Saat segmentasi kalimat atau paragraf harus sama dengan CMS penerbit.
  • Sebagai pengganti alat plagiarisme, SEO, atau audit hukum.

Keterbatasan dan kompatibilitas

Hanya hitungan heuristik; teks biasa di textarea; laporan yang disalin adalah teks biasa. Memerlukan JavaScript.

Didukung pemrosesan di sisi klien.

Pertanyaan umum

Apakah penganalisis teks gratis?

Ya. Semuanya berjalan di peramban Anda. Tanpa pendaftaran atau unggah.

Statistik apa yang ditampilkan?

Karakter (total dan tanpa spasi), kata, baris, paragraf, hitungan kalimat dari pemisahan tanda baca sederhana, perkiraan waktu baca, hingga 10 kata sering, dan hingga 10 huruf atau angka sering.

Bagaimana waktu baca dihitung?

Kami membagi jumlah kata dengan 200 kata per menit, membulatkan ke menit penuh berikutnya, dan menampilkan perkiraan itu. Kecepatan baca nyata bervariasi.

Mengapa beberapa kata tidak muncul di «paling umum»?

Hanya token lebih dari tiga karakter yang diurutkan, setelah huruf kecil dan menghapus tanda baca non-kata untuk daftar itu.

Apakah teks saya aman?

Ya. Teks Anda tidak pernah meninggalkan perangkat Anda.

Bisakah saya menganalisis dokumen panjang?

Ya. Tempelan sangat besar bisa mencapai batas memori peramban, tetapi artikel dan laporan biasanya baik-baik saja.

Penganalisis teks: statistik online gratis