– Des prestataires spécialisés
Sélectionnés par le biais de marchés publics passés avec l’Etat, les prestataires sont des spécialistes du traitement et de l’analyse de données (le cabinet Roland Berger, le sondeur Opinionway) et des méthodes de démocratie participative ou "civic tech" (Cognito, Bluenove, CapCollectif).
La Bibliothèque nationale de France (BnF) a été associée en tant qu’institution publique de référence dans la gestion des données écrites.
– Le défi de l’analyse
Celle-ci s’est faite en mars, avec une intervention humaine à chaque étape malgré le recours massif à l’intelligence artificielle. 150 personnes ont été mobilisées au total.
L’ensemble des contributions libres (comptes rendus des réunions locales, cahiers citoyens, contributions individuelles en ligne) a été acheminé jusqu’à la BnF par les préfectures ou la mission organisatrice du grand débat. Les contributions ont été traitées via des logiciels ou, en cas d’écriture manuscrite, scannées puis retranscrites. Les fichiers obtenus sont conservés sur des serveurs sécurisés de la BnF.
Pour leur analyse, les propositions ont été identifiées par cartographie lexicale (association de mots) et classées par thème. Seuls les deux tiers des pages ont été traitées. Un rapport final est promis avant l’été.
Opinionway a été chargé de l’ensemble des données issues de la plateforme granddebat.fr. Les réponses aux questions fermées ont été traitées comme des statistiques classiques. Pour les verbatim issus des questions ouvertes, un outil d’analyse automatique des données textuelles de masse (QWAM Text Analytics) a été utilisé. Grâce à des algorithmes puissants, les notions citées par les répondants ont été relevées, analysées, triées et classées en différentes catégories et sous-catégories.
– Pour un accès public aux données
Les cahiers citoyens ont été déposés aux archives départementales et sont librement accessibles. Les contributions à la plateforme restent consultables sur granddebat.fr.
Des prestataires travaillent sur la possibilité de mettre en ligne, en libre accès et dans le respect du droit des données personnelles, des verbatim issus des contributions libres, sous la forme d’un arbre interactif.
Des scientifiques et divers acteurs de la recherche publique (CNRS, INRIA…) ainsi que des médias ont déjà planché sur les données disponibles pour livrer leurs propres analyses.