Häufigkeitsanalyse
Häufigste Wörter und Zeichen in deinem Text
Was sagt die Wortfrequenz aus?
Die Häufigkeitsanalyse zeigt, welche Wörter am häufigsten in einem Textkörper erscheinen. Es ist die einfachste Form des Text-Mining — verwendet für SEO-Keyword-Recherche (welche Begriffe dominieren die Seite eines Mitbewerbers), um Füllwörter zu identifizieren, die Sie beim Schreiben übermäßig verwenden, und um das Thema eines langen Dokuments vor dem Lesen zu überprüfen.
Wörter werden in Kleinbuchstaben normalisiert und von umgebender Interpunktion befreit, sodass 'Hallo,' und 'hallo' als dasselbe Wort zählen. Stoppwörter (die, ein, von, und, usw.) werden beibehalten — filtern Sie Ihre Eingabe vorab, wenn Sie sie entfernen möchten.
Anwendungsfälle
- Text auf Wiederholungen analysieren — zählen, wie oft jedes Wort in einem Aufsatz oder einer Rede erscheint.
- Wortwolken erstellen — einen Absatz eingeben, um die häufigsten Tokens für einen Tag-Cloud-Generator zu erhalten.
- QA-AI-Ausgabe — Wiederholungen zählen, um zu erkennen, ob ein Modell zu stark auf einen Satz fokussiert hat.
- Einfache Chiffren knacken — Buchstabenfrequenzanalyse für Substitutionschiffrenrätsel oder CTF-Herausforderungen.
Beispiele
The quick brown fox jumps over the lazy dog. The dog barks.the 3
dog 2
quick 1
brown 1
fox 1
...Häufig gestellte Fragen
Sind Wörter fallabhängig?
Nein. 'Hallo' und 'hallo' werden als dasselbe Wort gezählt. Die Großschreibung wird vor dem Zählen normalisiert.
Werden Stoppwörter gefiltert?
Nein — gängige Wörter wie 'die', 'ein', 'von' sind enthalten. Wenn Sie sie ausschließen möchten, entfernen Sie sie zuerst aus Ihrer Eingabe.
Wie werden Wortgrenzen erkannt?
Leerzeichen und Interpunktion. Getrennte Wörter wie 'langfristig' werden als ein Token beibehalten; Kontraktionen wie 'nicht' sind ebenfalls ein Token.
Gibt es eine Begrenzung der Eingabegröße?
Nur der Speicher Ihres Browsers. Der Zähler verarbeitet problemlos Zehntausende von Wörtern; mehrmegabyte große Texte können die Benutzeroberfläche kurz verlangsamen.
Verlässt irgendetwas meinen Browser?
Nein — die Analyse läuft vollständig auf Ihrem Gerät. Kein Upload, keine Serververarbeitung, keine Telemetrie.
