频率分析

你文本中出现频率最高的单词和字符

0 个单词
单词
还没有单词
字符(不含空格)
还没有字符

词频告诉您什么?

频率分析显示哪些单词在文本中出现得最频繁。这是文本挖掘的最简单形式 — 用于SEO关键词研究(哪些术语主导竞争对手的页面)、识别您在写作中过度使用的填充词,以及在阅读长文档之前进行主题检查。

单词被规范为小写,并去除周围的标点,因此 'Hello,' 和 'hello' 被视为相同的单词。停用词(the, a, of, and 等)被保留 — 如果您希望它们被移除,请先从输入中删除它们。

使用场景

  • 分析文本重复度——统计一篇文章或演讲稿中每个词的出现次数。
  • 词云素材——把段落喂进去拿到 top 词,丢给 tag-cloud 生成器。
  • AI 输出 QA——通过重复词检测模型是否过度依赖某个短语。
  • 破解简单密码——替换密码或 CTF 题用字母频率分析。

示例

Counting a short paragraph
输入
The quick brown fox jumps over the lazy dog. The dog barks.
输出
the    3
dog    2
quick  1
brown  1
fox    1
...

常见问题

单词是否区分大小写?

不。'Hello' 和 'hello' 被视为相同的单词。计数前会规范化大小写。

停用词是否被过滤?

不 — 常见词如 'the', 'a', 'of' 被包含。如果您希望它们被排除,请先从输入中删除它们。

如何检测单词边界?

空格和标点。连字符单词如 'long-term' 被视为一个标记;缩写如 'don't' 也是一个标记。

输入大小有限制吗?

仅受您浏览器的内存限制。计数器可以轻松处理数万个单词;多兆字节的文本可能会暂时减慢UI。

有什么数据会离开我的浏览器吗?

没有 — 分析完全在您的设备上进行。无需上传,无需服务器处理,无需遥测。