5 novembre 2020

Interview : Intelligence Artificielle & Traitement du Langage dans les études


Data & techno Voir toutes nos actualités

Comment intégrer Intelligence Artificielle, Machine Learning et Traitement Automatique du Langage (NLP) dans les métiers des études ? Chez Gide, c’est un sujet qui nous tient à cœur. C’est pourquoi nous avons recruté Nour Medjedel, ingénieure en Intelligence Artificielle. Dans cette interview, Nour revient sur son parcours et ses missions chez Gide.

Machine Learning et NLP, deux spécialités qui rendent l’IA applicable

Bonjour Nour, pour commencer, quel est ton parcours ?

J’ai commencé mes études par une Licence d’Informatique à l’Université Lyon 1.  En Master, j’ai choisi de me spécialiser dans l’Intelligence Artificielle car dès le début de ma Licence, c’est un sujet qui me passionnait.

L’IA, c’est très large, parfois obscur. C’est le lien entre IA et Data Science qui m’intéressait le plus, car cela évolue sans cesse, et c’est un domaine d’application concrète de l’Intelligence Artificielle. C’est pourquoi j’ai ensuite choisi de faire un stage de fin d’études dans le domaine du Machine Learning et du NLP (Natural Language Processing, ou Traitement Automatique du Langage Naturel). Le NLP recouvre toutes les technologies qui permettent aux machines de traiter et comprendre le langage humain.

Analyser les réponses aux questions ouvertes sur des études de grande ampleur

Lors de ton stage de fin d’études chez Gide, sur quels sujets as-tu travaillé ?

J’ai travaillé sur 2 projets différents, avec un objectif commun : analyser les réponses aux questions ouvertes sur des études de grande ampleur, avec une problématique d’analyse de sentiment, c’est à dire : comment identifier la tonalité (positive ou négative) de chaque réponse.

Le premier projet était une étude avec 280 000 réponses. Les réponses étaient anonymes et très ouvertes, il y avait donc principalement du texte à traiter.

Après nettoyage et traitement des données, j’ai pu attribuer à chaque réponse, automatiquement, une tonalité positive ou négative, en utilisant un modèle pré-entraîné sur un corpus de données très large. J’ai aussi pu extraire les mots les plus utilisés.

Le deuxième projet était une enquête de satisfaction sur le niveau de service offert en magasin, en deux langues (français et néerlandais). La première étape a été de concevoir un programme de détection automatique de la langue. Ensuite, j’ai mis en place un modèle d’apprentissage supervisé, c’est à dire que je me suis basée sur la note de satisfaction pour créer un modèle de détection de la tonalité. J’ai pris le temps de tester plusieurs modèles, pour comprendre la méthode la plus adaptée pour ce genre de projet.

Quelles technologies, quels outils utilises-tu ?

Je travaille avec le langage Python, le plus poussé en Data Science, notamment en ce qui concerne le Machine Learning. J’utilise des bibliothèques, des outils Open Source dédiés à l’analyse et au traitement de données. Je m’appuie beaucoup sur les travaux de recherche existants.

Ce que le Machine Learning et le NLP peuvent apporter aux métiers des études

Aujourd’hui, tu as été recrutée en CDI chez Gide comme Ingénieure en Intelligence Artificielle. Qu’est-ce que tes travaux peuvent apporter aux clients de Gide ?

Tout d’abord, à mon arrivée chez Gide, j’ai fait une formation intensive pour comprendre les métiers des études, savoir comment les équipes travaillent.

J’ai découvert que les réponses aux questions ouvertes sont souvent négligées dans l’analyse de données des questionnaires, alors que ce sont des mines d’information.

Jusqu’alors, les clients de Gide récupéraient les données issues de ces questions ouvertes, mais, pour les traiter, ils avaient trois options :

  • Lire toutes les réponses et mettre en place une classification (codification) manuelle, ce qui est impossible pour des volumes de données importants ;
  • Faire appel à un autre prestataire que Gide pour l’analyse de ces données ;
  • Ne pas du tout analyser ces données.

L’intérêt de mon travail chez Gide, c’est de proposer à nos clients d’avoir un seul interlocuteur, une interface unique pour le traitement et l’analyse des questions ouvertes et des questions fermées.

On peut extraire beaucoup d’informations des réponses aux questions ouvertes (verbatims) et ce serait vraiment dommage de ne pas les exploiter. On travaille donc sur la création d’une interface visuelle permettant aux clients de Gide de manipuler eux-mêmes les données textuelles.

Par ailleurs, mon travail va permettre d’améliorer CAWIbot, notre chatbot dédié aux métiers de études, pour qu’il devienne encore plus “intelligent”. Le challenge est intéressant puisqu’il faudra analyser un verbatim en “direct” cette fois : pour le rapprocher d’une liste de réponses attendues, ou pour extraire les thèmes abordés et leur tonalité afin de pouvoir orienter la conversation.

Une approche sur mesure et adaptée aux métiers des études

Quel est l’avantage de ta façon de travailler par rapport aux logiciels d’analyse sémantique qui existent sur le marché ?

Chez Gide, tout ce qu’on fait est sur mesure, même si on s’appuie sur l’état de l’art et les travaux de recherche existants. Du coup, nous sommes en mesure de donner des résultats plus précis, plus personnalisés que ce que les logiciels de NLP sont en mesure de fournir. Et puis, notre expérience dans le secteur nous permet de fournir des résultats vraiment adaptés aux besoins des métiers des études et au contexte particulier de notre client ou de son projet.

Qu’est-ce qui te plait chez Gide ?

Ce qui m’a intéressée en allant travailler chez Gide, c’est la possibilité de traiter des données textuelles et de travailler avec d’importants volumes de données.

Mais c’est aussi la possibilité d’interagir avec les autres membres de l’équipe et de travailler avec d’autres outils : la datavisualisation, les outils Web, les nouvelles technologies. C’est ce qui me passionne le plus : pouvoir être au cœur de projets innovants, en collaboration avec d’autres personnes, pour que l’on apprenne les uns des autres.

Depuis mon arrivée chez Gide j’ai été prise en charge par une équipe extraordinaire. La communication demeure efficace et conviviale malgré les conditions un peu particulières en ce moment. C’est un plaisir de travailler avec des personnes compétentes, dévouées et passionnées, chacune dans son domaine d’expertise.