PIAF¶
Cette partie contient toutes les informations concernant le projet Piaf.
Qu’est que PIAF ?¶
PIAF signifie “Pour une IA francophone” et désigne la solution de Questions/Réponses proposée par la DINUM, et les porduits qui l’entoure. Elle s’appuie sur différentes briques technologiques :
PiafAnno : la plateforme d’annotation collaborative permettant de recueillir des questions-réponses pour constituer un dataset d’entrainement.
Le dataset de Piaf : un dataset contenant de multiples exemples de Questions/Réponses (QR) provenant de wikipédia. Cette annotation est issue d’une annotation citoyenne. Ce dataset suit la méthodologie et le format du dataset QR anglophone SQuAD. Vous trouverez plus de renseignements ici.
camembert-base-squadFR-fquad-piaf : un modèle français de Questions/Réponses basé sur CamemBERT et fine-tuné sur une combinaison de trois datasets français de Questions/Réponses :
PIAFv1.1
FQuADv1.0
SQuAD-FR (SQuAD automatically translated to French)
Haystack : une brique open source à laquelle nous contribuons activement permettant de faire du Questions/Réponses sur une base documentaire. Elle intègre une partie “retriever” qui retrouve les meilleurs documents candidat et une brique “reader” dans laquelle le modèle piaf est intégré et qui permet de trouver la bonne réponse.
Piaf Agent : C’est une barre de recherche, une interface graphique permettant d’interroger l’API de haystack afin de laisser un utilisateur poser une question et obtenir une réponse.
Piaf Bot : C’est un chatbot facile à mettre en place car il se base sur un excel. Il peut se brancher sur l’API de haystack afin d’aller plus loin que les bot classiques.
Historique¶
Piaf est né en 2019 et a évolué au fil des mois. En voici donc un petit résumé :
Début 2019
Début du projet : l’objectif est de créer un jeu de données en open-source pour entrainer des modèles de question-answering en françaisÉté 2019
Développement d’une plateforme collaborative afin de recueillir les contributions : PiafAnno. Et création du site de présentation du projet : PiafNovembre 2019
Début de la campagne d’annotation collaborativeFévrier 2020
Publication du Dataset 1.0Mai 2020
Publication de cet article à la conférence LREC2020Juin 2020
Publication du premier Piaf QA modèle francophone sur hugginfaceAvril 2021
Début de l’application Piaf, en tant que moteur de recherche d’information
Contact¶
Pour toute requête, veuillez nous écrire :
=> piaf@data.gouv.fr