[Wikide-l] Personendaten-Update

Jakob Voss jakob.voss at nichtich.de
So Aug 21 12:13:58 UTC 2005


Hallo,

Ich bin endlich dazu gekommen, den schon ueber einen Monat alten 
XML-dump zu traktieren, um Personendaten und PND-Nummern zu extrahieren. 
Die Daten sind verfügbar unter http://wdw.sieheauch.de/

Die deutschsprachige Wikipedia vom 13./14. Juli enthielt 262809 Artikel, 
von denen 47785 mit Personendaten versehen sind. Die Schätzung von 18% 
biographischer Artikel ist konservativ, da nicht alle Personenartikel 
Personendaten enthalten. 13657 Artikel, also knapp 29% der 
Personenartikel haben eine PND-Nummern (allerdings bisher nicht auf 
Fehler geprüft).

Die nächsten Schritte sind ein Nachprüfen der PND-Nummern. Es gibt 
bereits mehrere Anfragen von anderen Institutionen, die neben der DDB 
gerne über die PND auf ihre Datenbanken verlinkt werden würden. 
Patrick, Christian und ich arbeiten an einer Methode, dies (ähnlich wie 
bei den ISBN-Nummer) zu ermöglichen - allerdings sollte es etwas 
intelligenter als bei den ISBN-Nummern oder Geokoordinaten sein, wo man 
leider zunächst eine viel zu riesige Liste von Links bekommt.

Soweit erstmal von mir,
Jakob

P.S: Falls noch jemand mit guten Englisch-Kenntnissen mein Paper 
korrekturlesen möchte, würde ich mich sehr freuen:
http://en.wikibooks.org/wiki/Wikimania05/JV2