频率分析
你文本中出现频率最高的单词和字符
0 个单词
单词
还没有单词
字符(不含空格)
还没有字符
词频告诉您什么?
频率分析显示哪些单词在文本中出现得最频繁。这是文本挖掘的最简单形式 — 用于SEO关键词研究(哪些术语主导竞争对手的页面)、识别您在写作中过度使用的填充词,以及在阅读长文档之前进行主题检查。
单词被规范为小写,并去除周围的标点,因此 'Hello,' 和 'hello' 被视为相同的单词。停用词(the, a, of, and 等)被保留 — 如果您希望它们被移除,请先从输入中删除它们。
使用场景
- 分析文本重复度——统计一篇文章或演讲稿中每个词的出现次数。
- 词云素材——把段落喂进去拿到 top 词,丢给 tag-cloud 生成器。
- AI 输出 QA——通过重复词检测模型是否过度依赖某个短语。
- 破解简单密码——替换密码或 CTF 题用字母频率分析。
示例
Counting a short paragraph
输入
The quick brown fox jumps over the lazy dog. The dog barks.输出
the 3
dog 2
quick 1
brown 1
fox 1
...常见问题
单词是否区分大小写?
不。'Hello' 和 'hello' 被视为相同的单词。计数前会规范化大小写。
停用词是否被过滤?
不 — 常见词如 'the', 'a', 'of' 被包含。如果您希望它们被排除,请先从输入中删除它们。
如何检测单词边界?
空格和标点。连字符单词如 'long-term' 被视为一个标记;缩写如 'don't' 也是一个标记。
输入大小有限制吗?
仅受您浏览器的内存限制。计数器可以轻松处理数万个单词;多兆字节的文本可能会暂时减慢UI。
有什么数据会离开我的浏览器吗?
没有 — 分析完全在您的设备上进行。无需上传,无需服务器处理,无需遥测。
