[Wikide-l] Re: Bot - Belangstellung?

Daniel Herding DHerding at gmx.de
Mo Nov 17 12:09:49 UTC 2003


Hallo Mailingliste, 

On Montag, 17. November 2003, you wrote:

UF> Am Sonntag, 16. November 2003 21:48 schrieb Karl Eichwalder:
>> Andreas Voß <AndrsVoss at yahoo.de> writes:
>> > Der Bot wurde auch auf die deutsche Wikipedia angesetzt. Das Ergebnis der
>> > ersten Anwendung und die Möglichkeit zur Mitarbeit an der Einarbeitung
>> > der gefundenen, fehlenden interwikis findet man unter
>> >
>> > http://de.wikipedia.org/wiki/Benutzer_Diskussion:Rob_Hooft/Hilfe_bitte
>>
>> Klasse - jetzt geht für den Normaluser mal wieder gar nichts :-(

UF> Korrekt, der Bot gehört abgeschaltet.

Zur Klärung: Der Bot wurde auf der deutschen Wikipedia noch gar nicht
eingesetzt!

Die Liste ist das Resultat eines Durchlaufs auf der niederländischen
Wikipedia (oder ihrem SQL-Dump). Sie zeigt Artikel, bei denen die
deutsche Wikipedia andere/weniger Interwiki-Links hat als die
niederländische.

UF> Sprachlinks nach Holländisch sind ein Nice-To-Have, Performance
UF> ein Muss. Und alles, was über die Datenbank ackert, um
UF> nice-to-haves zu erzeugen, ist im Moment zu viel. 

Interwiki-Links finde ich schon wichtig (es geht nicht nur um
holländische!). Sie helfen beim Erweitern von Artikeln, da man
die anderssprachigen Seiten als Quelle verwenden kann (d.h.
Absätze übersetzen, Bilder übernehmen, Zahlenwerte vergleichen,
Ideen für Umsetzung/Layout etc.). Und ganz nebenbei verbessern
sie auch das Google-Ranking.

Natürlich kann man weiterhin den Bot mit den SQL-Dumps füttern und die
Liste manuell abarbeiten. Allerdings ist das sehr aufwendig, ich will
gar nicht wissen, wie viele Mann-(/Frau-)stunden nötig waren, um die
jetzige Liste so weit abzuarbeiten.

Das mit der Performance ist natürlich ein Argument. Wenn man den Bot
vollautomatisch laufen ließe, würde er die Wikipedia wahrscheinlich
stark verlangsamen. Allerdings kann man ihn in einem manuellen Modus
betreiben, in dem jede Änderung einzeln bestätigt werden muss. Wenn
man nach jeder Bestätigung einige Zeit wartet, dann haben die
Bot-Aktivitäten praktisch keine Auswirkung auf die Performance.
Außerdem kann man jederzeit abbrechen, wenn man merkt, dass die
Performance doch leidet.

Ich habe Brion im Chat gefragt: "does anyone know how much rob's
interwiki bot would affect database performance when run on
de.wikipedia?"
Seine Antwort:

brion> just don't run it too terribly fast.
brion> give at least a minute or two between hits
brion> and preferably run it at low traffic times, but that's less an issue now
brion> early morning in europe is good

Mein Kompromissvorschlag wäre, die jetzige Liste noch manuell
abzuarbeiten; bis das fertig ist, dürfte der neue Datenbankserver
eingetrudelt sein, dann würde ich mich bereiterklären, den Bot zu
steuern (bräuchte natürlich Einarbeitungszeit).


Daniel