9 teams, 56 participants, 5 challenges brilliantly met, 7 attentive business sponsors, adrenaline, a lot of concentration and 48 hours of challenge around the use of artificial intelligence to analyze raw texts: this first HackaText edition has kept all its promises! Organized on the Arcueil site on 2 and 3 February, this was Caisse des Dépôts' first hackathon, on the theme of data and textmining. An exciting edition that mobilized many internal stakeholders.
Depuis le dimanche 3 février 2019 à 16h00, « Trouver une aiguille dans une botte de foin » n’est plus synonyme de mission impossible ! En l’espace de 48 heures, l’équipe Thémis composée de 5 participants (deux élèves de Polytechnique, un d’Epitech et deux jeunes diplômés de Neoma Business School), a relevé le défi imaginé par la direction des Gestions d’Actifs, à l’occasion de ce HackaText. En accédant à la plus haute marche du podium, les gagnants s’envoleront prochainement pour un voyage d’étude, direction New York.
Jeanne Fisseau, consultante Digital & Emerging Technologies au sein du cabinet Wavestone et membre de l’équipe Thémis nous a confié ses premières impressions : « En apprenant cette victoire, j’ai ressenti une grande fierté. Avec le reste de mon équipe, Daniel Huynh et Léo Heidelberger (Polytechnique), Aurélien Lebray (Epitech) et Raphaël Millet (Neoma BS), nous sommes très reconnaissants à la Caisse des Dépôts de s'engager, de proposer des événements qui nous permettent d'innover et de grandir dans ce sens grâce à ce prix. En dehors de cela, c’était un beau week-end plein d’innovation et d’émulation intellectuelle».
C’est lors de la présentation du déroulé du HackaText, qui a eu lieu dans la soirée du vendredi 1er février, que les participants ont pu choisir la thématique à laquelle ils souhaitaient se confronter. Équipés de lunettes « google card board », les participants ont pu visionner en réalité virtuelle, chacune des 5 thématiques, incarnées par 7 sponsors métiers.
Petit rappel des 5 défis ici.
Si vous souhaitez en savoir plus et consulter ces vidéos, équipez-vous de lunettes google card board puis rendez-vous avec votre smartphone.
La visite fonctionne aussi sur ordinateur, en format panoramique.
Des participants très organisés et motivés
Les participants avaient mis toutes les chances de leurs côtés, en arrivant bien préparés et concentrés. « À leur arrivée, certains avaient déjà en tête une idée de solution à mettre en place pour traiter la problématique qui leur était posée, confirme Ludovic Mansuy, responsable de service à la DSI et en charge du pilotage et de l’organisation de ce HackaText. Ils ont même travaillé chez eux dans la nuit du vendredi au samedi afin d’amener à leurs équipes, des premiers éléments d’une solution envisageable à la résolution du défi choisi. Quant au premier prix, un voyage d’étude à New York, il s’agissait d’une belle source de motivation supplémentaire. »
Imaginer une approche, coder, préparer la restitution du travail… la journée du samedi a été dense pour les équipes. Elles ont pu compter sur les conseils des sponsors métiers, présents à nouveau sur place, et du renfort des équipes de la direction de la communication, venues les aider à structurer leurs présentations.
Signe de la motivation des participants, une quinzaine de personnes a même dormi sur place, dans la nuit du samedi au dimanche. « Ils étaient venus équipés de leur matelas de camping et de sacs de couchage, ils ont pour le coup vécu une aventure en immersion totale pendant 2 jours, précise Ludovic Mansuy. Le sujet étant centré sur les données métiers de la Caisse des Dépôts et le text mining beaucoup d’entre eux ont eu l’impression de participer à quelque chose de nouveau, dans l’environnement Caisse des Dépôts. Ils étaient à fond dans leur sujet, et les idées fusaient dans les équipes. »
À l’heure du grand oral
Dimanche après-midi, place aux jurys de demi-finales puis la présentation en format grand oral, devant le jury, présidé par Olivier Sichel, directeur de la Banque des Territoires. « Pour évaluer les travaux, je me suis intéressé à une composante de performance technologique avec la qualité du code proposé, tout en prenant également en compte l’utilité qu’apporteront les solutions », indique Olivier Sichel.
Chaque équipe a alors eu 8 minutes pour présenter son travail, suivi par un temps de questions/réponses avec les membres du jury afin que les participants puissent clarifier si besoin leur solution.
« Nous n’étions pas surpris par la capacité des participants à analyser ou restituer des données car il y avait un très haut niveau de maîtrise concernant la technicité et tout ce qui tourne autour de la data, des réseaux de neurones, du traitement de données…, indique Ludovic Mansuy. Nous étions plutôt très intéressés par leur manière de mettre tout cela en perspective vis-à-vis de l’utilisateur final. Comment allaient-ils rendre un résultat utilisable, compréhensible et couvrant les fonctionnalités souhaitées, tout en masquant la complexité des traitements ? De manière globale ce défi a bien été relevé. Il était possible, au travers des restitutions de projets, de deviner le degré d’innovation et d’hypertechnicité mise en œuvre mais également de la mutualisation possible du traitement du cas d’usage. »
Une compétition serrée
La victoire est finalement revenue à l’équipe Thémis qui a travaillé sur le cas « Trouver une aiguille dans une botte de foin », thématique de la direction des Gestions d’Actifs, à l’issue d’une phase finale accrochée.
Le second prix a été remporté par l’équipe Scorpion pour « Les bons comptes font les bons amis », cas porté par la direction des Prêts de la Banque des Territoires.
Le troisième prix a été remis à l’équipe Caméléon qui avait choisi le cas « L’œil de Lynx » - porté par la direction de l’Audit du Groupe Caisse des Dépôts.
« De manière globale, toutes les équipes, nous ont surprises. Lorsque l’on se retrouve avec des solutions quasiment exploitables pour tous les cas d’usages présentés, c’est impressionnant et encore plus si l’on tient compte du peu de temps dans lequel tout cela a été produit », conclut Ludovic Mansuy.
Rappel de la problématique posée : Détection et qualification de controverses sur les entreprises cotées et non cotées : ou comment affiner l’évaluation des risques d’investissement en ayant recours à l’analyse des sentiments ou des controverses.
Cette équipe a apporté une solution quasi opérationnelle et très fonctionnelle dans la mise en œuvre. Dans la proposition faite, en tapant le nom d’une entreprise cotée ou non cotée, une analyse est lancée sur plusieurs réseaux sociaux avec une recherche automatique de données sur l’actualité de cette dernière. Beaucoup d’indicateurs apparaissent sur sa notoriété afin d’identifier des thématiques sur lesquelles des controverses pourraient naître et avoir des répercussions sur celle-ci. Tout cela juste en saisissant le nom de l’entreprise dans un champ de recherche.
Rappel de la problématique posée : Collecter automatiquement la date d’agrément de prêt aux organismes de logement social (OLS) ainsi que les données financières y étant attachées.
L’équipe a démontré la faisabilité d’une numérisation avec une lecture automatique de données très performante. Elle fonctionne par apprentissage, cela signifie donc qu’elle deviendra dans le temps, encore plus performante. Et tout cela se faisant dans un temps de calcul très court : à peine une seconde pour un document. Ce système permet une plus grande fiabilité sur la lecture automatique de données, la capacité à les analyser, les traiter et permettra de proposer aux OLS, dans le cadre d’un processus totalement automatisé, une offre de prêt pré-renseignée.
Rappel de la problématique posée : Génération automatique d’un rapport d’analyse et de synthèse automatisé et contextualisé.
L’équipe a mis en place un outil qui simplifie la lecture et permet sur l’analyse des rapports de la direction de l'Audit du groupe, une recherche automatique des sujets traités, des thématiques, une synthèse des recommandations. Cet outil permet donc un gain de productivité à l’auditeur en allant très vite et à l’essentiel dans sa recherche.