Page MenuHomePhabricator

Redévelopper un outil de lecture d'articles de journaux recherchant des mots manquants
Open, Needs TriagePublic

Description

J'avais déjà développé un outil de ce genre, mais il n'est plus à jour : https://fr.wiktionary.org/wiki/Utilisateur:Daahbot/Journaux

Il faudrait le réécrire proprement, de préférence en python.

Event Timeline

Bonjour @Darkdadaah, si je puis me permettre, ce serait bien, pour être certain que tout le monde ait bien la même idée, de décrire en quelques lignes ce que faisait ton outil, ainsi que les améliorations souhaitées :) De même, as tu encore le code, et est il possible de le rendre accessible?

Si jamais, ça a été proposé dans la liste de souhaits et je t'invite donc à y apporter des précisions pour expliquer un peu mieux comment cela fonctionne. Je pense que nous pourrions recontacter le Logoscope, peut-être via @Pamputt :)

Petit aparte sur le Logoscope comme ça fait longtemps qu'on a pas eu de contact avec le Logoscope. Il me semble que cette discussion de janvier 2018 raconte les dernières nouvelles sur le partenariat Wiktionnaire / Logoscope. En résumé, je crois que Logoscope était en train de réécrire son parser ce qui devait permettre d'augmenter les journaux étudiés. Je crois qu'ils n'ont pas mis leur fichier de données à jour depuis septembre 2018. Du côté Wiktionnaire, on cherchait le meilleur moyen de profiter et d'afficher leur données. J'avais proposé le modèle Logoscope mais il restait encore des dicussions (voir le lien vers la Wikidémie) pour un déploiement à grand echelle. Donc pour les recontacter, pourquoi pas mais je n'ai pas grand chose de nouveau à leur proposer de notre côté et je trouve ça dommage.

Pour le Logoscope, les derniers échos que j'en ai eu, c'est qu'ils voulaient intégrer Néoveille, un projet concurrent qui leur était confié. J'imagine que c'est un chantier énorme et que ce n'est pas terminé, on peut attendre de voir les avancées de leur côté avant de les relancer.