Seiten

Sonntag, 8. November 2009

Link der Woche: Textanalyse-Tools


Auf https://www.schreiblabor.com/textlabor/statistic/* und http://www.stilversprechend.de/stil/bericht.html gibt es sehr empfehlenswerte Tools zur Textanalyse. Dabei werden außer der Zeichenzahl die Anzahl der Sätze, der Wörter pro Satz, der einzelnen Wörter und der unterschiedlichen Wörter ausgewertet, aber auch die der Silben insgesamt, der Silben pro Wort und der Kommata pro Satz. Außerdem werden bei beiden Anbietern lange Wörter und Sätze, Phrasen, Füllwörter (siehe auch hier) und Anglizismen ausgewertet und vor allem markiert. Bei stilversprechend.de werden außerdem Satzanfänge mit „Es“ (sehr empfehlenswert!), Passivsätze sowie Redundanzen (siehe auch hier) angezeigt. Fehlt eigentlich bei beiden nur noch die Angabe der Substantive.

Bei der Auswertung meines Textes fand schreiblabor.de 12 Füllwörter, stilversprechend.de dagegen nur eine Redundanz. Das kann aber auch daran liegen, dass schreiblabor.de zusätzlich zur Textanalyse einen Füllwörter-Test anbietet, bei dem 264 Füllwörter berücksichtigt werden (in meiner Giftliste habe ich nur 200 aufgeführt). Interessant dabei ist, dass Sie Ihr Ergebnis mit dem von Leseproben bekannter Autoren vergleichen können.

Die Auswertung bei schreiblabor.de ist insgesamt ausführlicher als die bei stilversprechend.de. Allerdings werden dort nicht soviele „Stilsünden“ berücksichtigt wie bei stilversprechend.de.

Das Besondere an beiden Seiten ist aber der Lesbarkeitsindex, der mit dem Flesch Reading Ease, auch Flesch-Grad genannt, berechnet wird. Gut verständliche Texte weisen einen Wert von etwa 60 bis 70 auf (einfach = Anleitungen, Rezepte, Belletristik).

Auf beiden Seiten wird der Flesch-Grad, den Toni Amstad für deutsche Texte in seiner Dissertation „Wie verständlich sind unsere Zeitungen?“ (Zürich 1978) entwickelt hat, angegeben. Dabei berechnete er vor allem den Wortfaktor neu, da die deutschen Wörter im allgemeinen länger sind als englische; die Sätze sind in beiden Sprachen etwa gleich lang.

Schreiblabor.de berechnet zusätzlich zum Flesch-Grad für deutsche Texte den für englische, außerdem den Kincaid Grade Level sowie die 1., 2., 3. und 4. Wiener Sachtextformel für die Lesbarkeit (nähere Angaben zu den einzelen Verfahren finden Sie hier).

Auf http://www.leichtlesbar.ch/html/faq.html gibt es Fragen und Antworten zur Flesch-Formel. Dort können Sie ebenfalls Ihren Text auf Lesbarkeit überprüfen lassen, allerdings ohne die Zusatzfunktionen der anderen beiden Anbieter, außerdem wird nur der Flesch Reading Ease für englische Texte berücksichtigt. Die Begründung erfahren Sie hier.

Übrigens: bei http://blog.stilversprechend.de/ können Sie mit seitenreport.de Ihre Webseite nach Zugriffszahlen, der technischen Qualität und Benutzerfreundlichkeit, aber auch auf Lesbarkeit analysieren lassen. Sie erhalten den Flesch-Wert samt Erläuterung. Mit dem Flesch-Widget können Sie auf Ihrer Webseite oder Ihrem Blog den aktuellen Flesch-Wert anzeigen lassen.

Warnung: Die Lesbarkeitsformel hat nichts mit dem Inhalt und der Qualität des Textes zu tun. Dabei können nur Testleser oder Lektoren helfen. Ein Tool dafür gibt es meines Wissens (noch) nicht.

Eine Textanalyse auf Füll- oder Unwörter gibt es auch im e-Lektorat von letter-factory.com. Wobei ich grundsätzlich gegen den Ausdruck Unwörter bin. Füllwörter müssen nicht überflüssig sein, denn  sparsam(!) angewandt geben sie einem Text die Würze, die er braucht, um nicht eintönig zu wirken, oder, da Sprache immer auch Musik ist: Sie können einen Text melodisch machen und ihm einen Rhythmus geben. Und nicht zuletzt können sie ihm eine unbeabsichtigte Schärfe nehmen.

*Der auf autorenlektorat.com angebotene Füllwörtertest (http://www.autorenlektorat.com/fuellwoerter/) und der ebenfalls dort angebotene Textanalysetool (http://www.autorenlektorat.com/textanalyse/) sind mit denen auf schreiblabor.com identisch. Beide Sites gehören denselben Betreibern.

Weitere Textanalyse-Tools habe ich hier beschrieben: http://juttas-schreibblog.blogspot.com/2009/04/tool-zum-anzeigen-von-fullwortern.html für Füllwörter und http://juttas-schreibblog.blogspot.com/2009/04/tool-zum-anzeigen-von.html für Wortwiederholungen (auch Wortdoppelungen oder Wortdopplungen** genannt).

**beide Versionen nur wegen der Suchmaschinen erwähnt … Laut Duden ist die Schreibung Wortdopplungen richtig.

http://www.canoo.net/services/GermanSpellingChecker/ueberblick/index.html bietet eine kostenlose Rechtschreibprüfung an.

Auf WriteWords gibt es für englische Texte einen Word Frequency Counter und  einen Phrase Frequency Counter. Das im Kommentar von anonym empfohlene TextLab bietet die kostenpflichtige TextLab-Analyse-Software mit vielen zusätzlichen Funktionen an, die aber eher für die Unternehmenskommunikation gedacht ist.

In dem Zusammenhang wichtig ist der Hinweis von schreiblabor.com (der Name hat übrigens nichts mit mir zu tun) und autorenlektorat.com, dass die Analysen nicht lokal auf dem eigenen Browser durchgeführt werden,  sondern zu deren  Server übertragen, mittels eines Perl-Scripts geprüft und wieder zurückgesandt werden. Sie könnten den Text also speichern. Sie garantieren aber, dass das nicht tun werden. Wie das bei den anderen Anbietern ist, weiß ich nicht, ist aber eine Überlegung wert, wenn man Angst hat, dass sein Text anderweitig verwendet wird

Sollte es noch mehr solcher Textanalyse-Tools geben, bin ich für Hinweise sehr dankbar

Inzwischen habe ich ein ähnliches Tool entdeckt, das BlaBlaMeter. Allerdings wird dort nur "schonungslos" entlarvt, „wieviel heisse Luft sich in Texte eingeschlichten hat“ und der „Bullshit-Index“ errechnet.  Das ist doch ein bisschen wenig, weil nicht angegeben wird, was denn nun am Text heiße Luft ist. Aber da dieses Tool offensichtlich neu ist, wird sicher bald eine bessere Version zur Verfügung stehen. Zu empfehlen ist es jedenfalls im Moment noch nicht.

Kommentare:

  1. Füllwörter werden auch beim Programm »Papyrus Autor« angezeigt, weiter lassen sich Stilanalysen hinzuschalten die nach Verbfaulheit, Adjektiven, Phrasen, Konjunktionen etc. suchen. Der Vorteil ist, dass man den Text nicht erst ins Internet übertragen muss, sondern beim Schreiben schon entsprechende Stilprüfungen hinzunehmen kann. Eine weitere Besonderheit ist, dass man den Text dann als »Normseite« ausgeben kann.

    AntwortenLöschen
  2. Vielen Dank für den Hinweis. Aber nicht jeder Autor benutzt Papyrus (ich auch nicht). Außerdem sind die Tools, die ich hier nenne, kostenlos. Zudem kann man dort ältere Texte, egal wie lang sie sind, analysieren lassen. Auch für Lektoren sind diese Tools sehr hilfreich (und letztlich für die Auftraggeber, denn der Lektor muss nicht nach Füllwörtern, Angliszismen usw. suchen, was Zeit und damit Geld kostet).

    AntwortenLöschen
  3. auch sehr empfehlenswert: TextLab...da werden verschiedenste Formeln sowie weitere 40 Parameter berechnet (Substantiv-Häufigkeiten, Verbhäufigkeiten, Schachtelsätze, Fachbegriffe, Fremdworte, Anglizismen, TTRs etc.)

    AntwortenLöschen
  4. Lesbarkeitsindize haben den Nachteil, dass sie allein aus statistischen Analysen und Kennzahlen ermittelt werden und somit lediglich mathematische Modelle (ggf. komplexe Formeln) sind, welche die Verständlichkeit/Lesbarkeit eines Textes widerspiegeln sollen. Einen m.E. besseren Ansatz verfolgt die Vier-Farben-Theorie von Förster, welche im Tool: CW-Editor zum Einsatz kommt. Hier geht es darum die erhoffte Wirkung eines Textest auf den Leser zu analysieren. Immer mehr gewinnt in Unternehmen und Institutionen das Corporate Wording an Bedeutung. Es geht also nicht mehr so sehr darum, ob der Leser die Text (unter Annahme seines Bildungsgrades) lesen und verstehen kann, sondern es geht darum, habe ich mit meinem Text, den richtigen Ton und die richtige Wortwahl getroffen, damit meine Botschaft ankommt, bzw. die erhoffte Wirkung entfaltet. Typische: Unternehmensbroschüren, Online-Texte, Werbematerial und Werbebranche. M.E. ein genialer Ansatz, weg von der althergebrachten Statistischen Analyse von Texten. Besten Gruss, Ralf

    AntwortenLöschen
  5. Wording Tools:
    Demo Link, zum CW Editor.
    h__p://cwdemo.pintexx.com/application/cwframe.aspx

    Interessant der Vier-Farben-Knopf

    Gruss
    Ralf

    AntwortenLöschen
  6. Hallo Ralf,
    ich gebe hier mal den korrekten Link ein: http://cwdemo.pintexx.com/application/cwframe.aspx.
    Das ist tatsächlich ein interessanter Ansatz (allerdings habe ich als Urheber eine Ewald Hering gefunden), aber mir geht es bei den Textanalysetools in erster Linie um Tools für Autoren von Fiktion. Und es geht mir um kostenlose Tools. Ich habe auch nirgends gefunden, was das Angebot kosten wird (und keinen Hinweis auf den Betreiber der Seite. Offensichtlich kommt er aus der Schweiz wegen der Helvetismen-Checks). Und zumindest als Hinweis finde ich den Verständlichkeitsindex bei ähnlichen Tools hilfreich.
    Die praktische Ausführung ist etwas unübersichtlich, weil nicht genau angegeben wird, welche Farbe was bedeutet. So sagte mir die Auswertung in Prozenten erst einmal nichts. Beim Googeln habe ich erfahren, dass blau für den nüchternen Sprachstil, grün für den konservativen, gelb für den erlebnisreichen und rot für den emotionalen stehen soll. Aber das scheint laut Auswertung eines Textes von Sartre nicht zu stimmen. Und was fehlt, ist der Füllwörterscheck, aber vielleicht gibt es den ja in der Vollversion.
    Herzliche Grüße Jutta

    AntwortenLöschen
  7. Hallo Jutta
    Der Anbieter dieser Analysesoftware ist www.pintexx.com; Er bietet in der CW Studio Vollversion bzw. in der WORD-Add-In Version jede Menge Floskel-Checks, darunter auch Füllwörter-Checks. Unter http://www.pintexx.com/Produkte2/Demos kann man sich mal auf die Studio Version (http://cwstudio.pintexx.com/application/main.aspx) einloggen (mit User1/User1). Dort gibt es ein kleines Manual. Ist schon recht faszinierend, was die Leute sich dort ausgedacht haben um das "Sprachklima" zu erfassen. Die Mehrzahl der Sprachanlyse Tools, die ich kenne, beschäftigen sich eher mit der Syntax und wenden eine Menge statistischer Untersuchungen (Häufigkeitsanalyse usw.) an, um Aussagen über die Komplexität eines Textes treffen zu können. Um jedoch mehr in die Semantik zu gehen und den „Sprachton“ oder das „Sprachklima“ erfassen zu können muss man sich anderer Methoden bedienen. Semantische Analysen sind weitaus komplexer. Die Vier-Farben-Methode (es hätten auch 5 oder mehr Farben bzw. Abstufungen) sein können, ist ein sehr interessanter und auch gut zu programmierender Ansatz. Sicherlich ist die Abgrenzung der einzelnen Farb-Stufen (nüchtern, konservativ, progressiv, emotional) nicht einfach, und vermutlich gibt es Mehrdeutigkeiten und auch fließende Übergänge. Daher sind mehr als 4 semantische Stufen vermutlich nicht praktikable bzw. bringen letztendlich nicht mehr an Ergebnissen.
    Der Hersteller vermarktet sein Produkt durch Online Analysen (monatliche Entgelte) oder durch eine Windows Software (MS-Word Add-In für etwa 500 EUR).
    Besten Gruss
    Ralf

    AntwortenLöschen
  8. Hallo Jutta,

    Das Blablameter, so sieht es aus, muss in der Tat noch etwas verbessert werden. Denn auch bei unsinnigen Texteingaben oder gar fremden Sprachen ermittelt das Sprachmeter sogar recht gute Werte.

    Trotzdem ist der Ansatz interessant.


    Die Anbieterin der Webseite erläutert, dass die dahinter stehende Applikation eine Prüfung des „Nominalstils“ durchführt.

    Wir wissen dass man durch Verwendung komplexer Fachausdrücke, Wortungetüme, Fremdwörter und Substantivierte Verben, ganz großartig zeigen kann, wie man die Sprache beherrscht. Nur verstehen tut einen keiner mehr, wenn der Text mit Substantiven überfrachtet wird.

    Einfache Regel: Nach Möglichkeit immer Verben den Substantiven vorziehen. Macht den Text lebendiger, ansprechender, emotionaler und leichter verständlich. Zum Nominalstil siehe: http://de.wikipedia.org/wiki/Nominalstil

    Gruss
    Ralf

    AntwortenLöschen
  9. Hallo, ich nahm Ihren Artikel als Anstoß ein eigenes Textanalyse-Tool zu entwickeln.

    Herausgekommen ist eine Checkliste für verständliche Texte:
    http://homepageentwickler.de/texte-verbessern.php

    Das Textanalysetool ist ein Bestandteil der Checkliste:
    http://homepageentwickler.de/textanalyse-tool.php

    Über ein fundiertes Feedback würde ich mich sehr freuen.

    AntwortenLöschen
  10. Hallo zusammen,

    wir haben unter www.textanalyse-tool.de ein kostenloses Werkzeug gebastelt, welches sich aktuell noch in der Beta-Phase befindet und gleichzeitig stetig weiterentwickelt werden soll.

    Wer möchte, kann uns gerne Feature-Wünsche und Tipps zukommen lassen, da wir das Tool weiterentwickeln möchten um so den Nutzen ein noch besseres Werkzeug zur Verfügung stellen zu können.

    AntwortenLöschen