[Wikide-l] Automatische Typo-Korrektur mit dem Bot

Alwin Meschede ameschede at gmx.de
Do Apr 1 15:11:31 UTC 2004


Hallo zusammen,

dass die Rechtschreibung in der Wikipedia unter aller Sau ist, dürfte 
bekannt sein. Am 27.3.04 hatten wir 8864 von der Seite [[Wikipedia:Liste 
von Tippfehlern]] erkannte Typos - da man nur zählen kann, wonach man 
auch sucht, wird die Dunkelziffer weit höher sein. Diese Zahl per Hand 
nennenswert zu reduzieren, dürfte unmöglich sein (wenn wir nicht einen 
substanziellen Teil unserer Mitschreiber zum Korrekturlesen verdonnern, 
was aus verständlichen Gründen nicht geht). Wir haben allerdings die 
Möglichkeit, den Vorgang etwas zu automatisieren...

Ich habe in den letzten Tagen nochmal Trocken-Experimente mit einem 
Typokorrektur-Bot angestellt und denke, dass ich die Sache inzwischen 
ganz gut im Griff habe. Wenn ich dieses Ding jetzt auf die echte 
Wikipedia loslasse, müssen wir uns aber darüber im Klaren sein, dass der 
Bot alles korrigieren wird, was ihm vor die Flinte läuft - auf Zitate, 
Buchtitel, Namen und sonstige Befindlichkeiten kann keine Rücksicht 
genommen werden. Deshalb werfe ich einfach mal die Frage in den Raum, ob 
eine automatische Typo-Korrektur (mit allen Nebenwirkungen, die sich 
daraus ergeben könnten) überhaupt gewünscht ist, oder ob wir lieber bis 
zum Wärmetod des Universums mit einer Wikipedia voller 
Rechtschreibfehler leben wollen, uns dafür aber an der authentischen 
Schreibung von ein paar Zitaten und einigen Buchtiteln erfreuen wollen - 
so in etwa wären die Alternativen.

Außerdem könnte man auf diesem Wege relativ schmerzfrei die kürzlich 
diskutierte Umstellung von "z.B." und den inzwischen bereits zahlreich 
im Wiki auftauchenden  -Konstrukten nach "zum Beispiel" vornehmen 
- das wäre eine Sache von ein paar Stunden, dann ist das Thema fürs 
erste erledigt.

Mein Vorschlag wäre, dass ich mit dem Bot nach einer gewissen 
Vorbereitungszeit durchstarte, sagen wir mal zwei Wochen. Wenn in dieser 
Zeit jemand einer problematischen Passage über den Weg läuft, soll er 
sie maskieren, so dass der Bot den "Fehler" nicht mehr findet. Dies 
geschieht am einfachsten, indem mitten in das fragliche Wort ein 
HTML-Kommentar eingebaut wird - der Bot geht dann darüber hinweg 
(Besipiel: "Alexander Gros<!-- der Mann heißt so! -->ser war der 
Erfinder der Zahnprothese").

Da schon absehbar ist, dass obige Maßnahme nur begrenzt wirksam sein 
wird und der Bot trotz aller Vorsicht mit ziemlicher Sicherheit den 
einen oder anderen Bock bauen wird, bräuchte es Leute, die dem Bot ein 
wenig hinterherräumen. Ich denke, dass alle fraglichen Artikel in 
irgendeiner Beobachtungsliste stehen werden, so dass hoffentlich alle 
Böcke entdeckt werden und auf die Schnelle wieder korrigiert werden. Um 
die Sichtbarkeit der Aktion zu erhöhen, könnte man den Bot statt unter 
dem Zwobot-Account auch unter einem normalen User-Account laufen lassen, 
der dann auch in den RecentChanges auftaucht, ich bin da flexibel ;-)

So, und jetzt will ich Meinungen dazu hören!

Alwin Meschede