[WikiFR-l] Re: Données de test

dake dake.cdx at gmail.com
Jeu 3 Nov 18:17:23 UTC 2005


Odile Bénassy wrote:
> Bonjour,
> 
> Je sais déjà que ma question n'est pas tout à fait appropriée pour cette liste, mais je cède à la tentation, une fois n'est pas coutume, de m'exprimer dans ma langue maternelle. En plus je ne serais pas étonnée que l'un(e) d'entre vous ait la réponse.
> 
> Je dois faire un exposé au CNAM, dans le cadre d'une UV sur les bases de données, et le sujet de mon exposé est la recherche plein texte dans MySQL.
> 
> Pour un tel sujet, il est naturel de faire un peu de tests de montée en charge, et comme j'ai vu que Wikipedia utilise la recherche plein texte ("full text") de MySQL, je suis tentée de faire mes tests à l'aide de données de Wikipédia. En plus c'est une occasion de faire de la pub pour le projet.
> 
> Il me semble me souvenir qu'il y avait un moyen de récupérer un wikipédia existant sous forme de données en SQL, est-ce en ligne ou bien faut-il le demander à l'administrateur du serveur ?
> 
> Pouvez-vous m'aider à trouver ces données si elles sont disponibles ? Dans le cas contraire, je vous demanderai si une personne ayant accès au serveur peut lancer des requêtes pour moi mais ce serait moins pratique. Il s'agit de mesurer le temps pris pour répondre à la requête, on ne peut pas faire ça en mode distant.
> 
> D'avance merci pour vos réponses,
> 

Les "dumps" sont maintenant sous la forme d'un gros XML. La conversion 
en .sql est possible, je te laisse lire ma prose à cette adresse :

http://fr.wikipedia.org/wiki/Wikip%C3%A9dia%3ARequ%C3%AAtes%20XML

Le plus facile est d'utiliser le script xml2sql. Les autres méthodes 
d'insertion sont affreusement lentes.




Plus d'informations sur la liste de diffusion WikiFR-l