Analisis Frekuensi

Kata dan karakter teratas dalam teks Anda

0 total kata
Kata
Belum ada kata
Karakter (tanpa spasi)
Belum ada karakter

Apa yang diberitahukan frekuensi kata kepada Anda?

Analisis frekuensi menunjukkan kata-kata mana yang paling sering muncul dalam sebuah teks. Ini adalah bentuk paling sederhana dari penambangan teks — digunakan untuk penelitian kata kunci SEO (kata mana yang mendominasi halaman pesaing), untuk mengidentifikasi kata pengisi yang terlalu sering Anda gunakan dalam tulisan, dan untuk memeriksa topik dokumen panjang sebelum membacanya.

Kata-kata dinormalisasi menjadi huruf kecil dan dihapus dari tanda baca di sekitarnya, jadi 'Hello,' dan 'hello' dihitung sebagai kata yang sama. Kata penghubung (the, a, of, dan, dll.) tetap ada — saring input Anda terlebih dahulu jika Anda ingin menghapusnya.

Kasus penggunaan

  • Analisis teks untuk pengulangan — hitung seberapa sering setiap kata muncul dalam esai atau transkrip pidato.
  • Buat awan kata — masukkan sebuah paragraf untuk mendapatkan token teratas untuk generator awan tag.
  • QA keluaran AI — hitung pengulangan untuk melihat apakah model terlalu mengandalkan satu frasa.
  • Pecahkan sandi sederhana — analisis frekuensi huruf untuk teka-teki sandi substitusi atau tantangan CTF.

Contoh

Counting a short paragraph
Input
The quick brown fox jumps over the lazy dog. The dog barks.
Output
the    3
dog    2
quick  1
brown  1
fox    1
...

Pertanyaan yang sering diajukan

Apakah kata-kata sensitif terhadap huruf besar?

Tidak. 'Hello' dan 'hello' dihitung sebagai kata yang sama. Kapitalisasi dinormalisasi sebelum dihitung.

Apakah kata penghubung disaring?

Tidak — kata-kata umum seperti 'the', 'a', 'of' termasuk. Jika Anda ingin mereka dikecualikan, hapus dari input Anda terlebih dahulu.

Bagaimana batasan kata terdeteksi?

Spasi dan tanda baca. Kata yang dipisahkan dengan tanda hubung seperti 'long-term' tetap sebagai satu token; kontraksi seperti 'don't' juga satu token.

Apakah ada batasan ukuran input?

Hanya memori browser Anda. Penghitung dapat menangani puluhan ribu kata dengan nyaman; teks multi-megabyte mungkin memperlambat UI sebentar.

Apakah ada yang keluar dari browser saya?

Tidak — analisis berjalan sepenuhnya di perangkat Anda. Tidak ada unggahan, tidak ada pemrosesan server, tidak ada telemetri.