빈도 분석

텍스트의 상위 단어 및 문자

0 총 단어
단어
아직 단어가 없습니다
문자 (공백 제외)
아직 문자가 없습니다

단어 빈도가 무엇을 알려주나요?

빈도 분석은 텍스트 본문에서 가장 자주 나타나는 단어를 보여줍니다. 이는 텍스트 마이닝의 가장 간단한 형태로, SEO 키워드 연구(경쟁자의 페이지에서 어떤 용어가 지배적인지), 글쓰기에서 과도하게 사용하는 필러 단어를 식별하는 데 사용되며, 긴 문서를 읽기 전에 주제를 sanity-check하는 데 유용합니다.

단어는 소문자로 정규화되고 주변 구두점이 제거되므로 'Hello,'와 'hello'는 같은 단어로 계산됩니다. 불용어(the, a, of, and 등)는 유지되며, 제거하고 싶다면 입력에서 먼저 제거하세요.

사용 사례

  • 텍스트 반복 분석 — 에세이나 연설 원고에서 각 단어가 얼마나 자주 나타나는지 계산합니다.
  • 단어 구름 생성 — 단락을 입력하여 태그 클라우드 생성기를 위한 상위 토큰을 얻습니다.
  • QA AI 출력 — 반복을 계산하여 모델이 한 문구에 너무 의존했는지 확인합니다.
  • 간단한 암호 해독 — 대체 암호 퍼즐이나 CTF 도전을 위한 문자 빈도 분석.

예시

Counting a short paragraph
입력
The quick brown fox jumps over the lazy dog. The dog barks.
출력
the    3
dog    2
quick  1
brown  1
fox    1
...

자주 묻는 질문

단어는 대소문자를 구분하나요?

아니요. 'Hello'와 'hello'는 같은 단어로 계산됩니다. 대문자는 계산 전에 정규화됩니다.

불용어는 필터링되나요?

아니요 — 'the', 'a', 'of'와 같은 일반 단어는 포함됩니다. 제외하고 싶다면 먼저 입력에서 제거하세요.

단어 경계는 어떻게 감지되나요?

공백과 구두점입니다. 'long-term'과 같은 하이픈이 있는 단어는 하나의 토큰으로 유지되며, 'don't'와 같은 축약형도 하나의 토큰입니다.

입력 크기에 제한이 있나요?

오직 브라우저의 메모리만 있습니다. 카운터는 수만 개의 단어를 편안하게 처리하며, 다중 메가바이트 텍스트는 UI를 잠시 느리게 할 수 있습니다.

내 브라우저에서 어떤 것이 나가나요?

아니요 — 분석은 전적으로 귀하의 장치에서 실행됩니다. 업로드 없음, 서버 처리 없음, 텔레메트리 없음.