13.12.04
L'amusement du jour (bis)
Le jouet du jour progresse. Que la syntaxe Wikipedia est pénible à parser correctement.
Pour le moment, l'extracteur de dump est séparé, et le convertisseur de syntaxe Wiki est primitif (pas encore de traitement propre de toutes les formes de liens ou de formes en ligne), mais au moins ça affiche quelque chose.
Etapes suivantes: rajouter les syntaxes manquantes, gérer correctement le saut d'articles, donner le texte complet des articles à manger au SearchKit... et voir là où tout explose sous la charge.

Pour le moment, l'extracteur de dump est séparé, et le convertisseur de syntaxe Wiki est primitif (pas encore de traitement propre de toutes les formes de liens ou de formes en ligne), mais au moins ça affiche quelque chose.
Etapes suivantes: rajouter les syntaxes manquantes, gérer correctement le saut d'articles, donner le texte complet des articles à manger au SearchKit... et voir là où tout explose sous la charge.
