8 juillet 2022

Bien mettre en forme son questionnaire pour une programmation fiable et efficace


Actualités Voir toutes nos actualités

Bien rédiger un questionnaire est une étape indispensable à la réussite d’une enquête, qu’elle soit menée en ligne, par téléphone ou en face à face. Souvent, le questionnaire qui sert de point de départ à la programmation est fourni sous la forme d’un document Word. Mais si ce document ne respecte pas un certain formalisme, on prend des risques : perte de temps, incompréhensions, erreurs de logique, mauvais format de données en sortie, … Pour éviter cela, on conseille de mettre en place des conventions (et de les respecter !). On vous explique tout dans cet article.

Pour aller plus loin et découvrir toutes nos bonnes pratiques pour rédiger vos questionnaires, téléchargez notre livre blanc !

Pourquoi utiliser des conventions ?

Lorsque vous rédigez un questionnaire en vue de sa programmation, la première règle est d’établir des conventions de mise en forme afin que les différents éléments le composant soient facilement différenciés.

Si vous travaillez pour un organisme de recherche ou un institut d’études, vous suivez peut-être déjà certaines conventions, bien utiles pour écrire et comprendre les spécifications.

Les conventions permettent de représenter visuellement chaque élément du questionnaire d’une certaine manière. Si vous utilisez toujours le même modèle de document pour spécifier vos questionnaires, alors il intègre certainement des conventions, par exemple :

  • Styles, codes couleurs, polices de caractères pour différencier les éléments du questionnaire (intitulé de question, consignes pour l’enquêteur, …) ;
  • Codifications permettant de différencier chaque type de question (réponse unique, réponse multiple, …) ;
  • Indications pour la personne chargée de programmer le questionnaire (aussi appelée « scripteur ») ;

Pour cela, nous vous invitons à utiliser les styles dès que c’est possible : par exemple, le style “consignes enquêteur” permettra d’afficher rapidement et systématiquement en bleu, italiques, police 10pt, … les instructions à destination de l’enquêteur (cf. plus loin).

Les avantages de ces conventions ?

Elles permettent d’être plus rapide et plus précis dans la programmation du questionnaire.

En effet, nous disposons d’outils qui permettent de convertir automatiquement le document Word en une version initiale du script du questionnaire, en interprétant les conventions utilisées – pour peu que le document soit parfaitement structuré.
À noter que ce qui s’applique à un document Word peut également être adapté pour fonctionner avec d’autres formats de questionnaire : LibreOffice, PDF, Excel, …

Ajoutons que la plupart des langages de script comportent des fonctionnalités simples mais puissantes, dont vous n’êtes peut-être pas conscients.
Ces fonctionnalités, telles que la réutilisation des listes de réponses, les boucles (ou « loops ») et les structures du type « SI … ALORS … SINON », seront utilisées par le scripteur. Vous pouvez simplifier la spécification (et la rendre plus proche du script d’enquête) si vous les incluez dans votre document.

Malheureusement, il arrive souvent que les conventions ne soient pas systématiquement respectées, ou qu’elles ne couvrent pas toutes les parties de la spécification de l’enquête.

Les exemples présentés dans cet article peuvent être utilisés pour vous aider à améliorer les conventions que vous utilisez déjà.
Et si vous n’avez pas encore mis en place ce type de modèle, vous comprendrez en quoi c’est utile.

Voici un exemple de question telle qu’elle pourrait être spécifiée, en utilisant des conventions.

Nous allons voir, point par point, à quoi correspondent les conventions dans cet exemple.

1. Les questions avec filtre

Le premier élément est le filtre de la question, qui, dans ce cas, est « Seulement si âge > 10 ».

Cela permet de préciser, le cas échéant, pour quels répondants afficher cette question, en fonction de leur réponse à une précédente question ou d’informations dont nous disposons en amont de l’enquête (les « infos-fichier »).

Il n’est pas nécessaire de préciser un filtre pour chaque question. Toutefois, vous pouvez, pour les questions sans filtre, préciser par défaut dans cette zone « Poser à tous », ce qui supprime toute ambiguïté.

Comme il s’agit d’une instruction pour le scripteur, elle doit être formatée différemment de tous les autres textes, car elle ne sera pas affichée au répondant au sein du questionnaire.

Dans tous les exemples de cet article, les indications pour le scripteur sont affichées en vert.

2. Les différents types de réponse

Le point suivant concerne le type de réponse attendu.

Nous ne parlons pas de la façon dont la question est affichée, mais du type de données sous-jacentes que la question collecte.

Il existe très peu de types de données : 99 % des questions seront soit à réponse unique, soit à réponses multiples, soit textuelles, soit numériques, même s’il existe 1001 façons de présenter ces questions.

S’il a le choix, le scripteur programmera généralement une question de la manière la plus simple pour obtenir l’affichage souhaité. Mais il se peut que ce ne soit pas la façon dont vous voulez que la question soit affichée. Par exemple, si vous voulez recueillir une valeur numérique dans les données, mais que la question soit affichée sous forme de liste déroulante, soyez explicite.

3. L’identifiant d’une question

Vient ensuite l’identifiant de la question. C’est le code, le plus souvent alphanumérique, qui permettra d’identifier chaque question dans la suite du questionnaire (filtres, …) ou les données finales.

Les langages de script ont tous leurs propres règles concernant le format des identifiants de question, mais ils doivent généralement commencer par une lettre et ne contenir que des lettres, des chiffres et le symbole « underscore ».

Ainsi, par exemple, dans le langage de script de GIDE, le chiffre cinq ne peut pas être utilisé seul comme identifiant de question, mais « Q5 » peut l’être. De même, les points ne sont pas autorisés, donc « Q5.5 » serait programmé par nous comme « Q5_5 ».

Et il faut également faire attention à ce qu’un identifiant de question ne soit utilisé qu’une seule fois dans le questionnaire : deux questions différentes ne peuvent évidemment pas avoir le même identifiant.

4. Les libellés associés à une question

Viennent ensuite les différents types de texte (ou libellés) associés à la question.

Une question classique comporte les éléments de texte suivants :

  1. L’intitulé de la question principale (affiché à l’écran et/ou lu par l’enquêteur) : ici en noir
  2. Les consignes supplémentaires pour le répondant (également affichées à l’écran et/ou lues par l’enquêteur) : ici en rouge
  3. Les consignes pour l’enquêteur – non affichées pour le répondant, mais parfois lues à haute voix par l’enquêteur : ici en bleu clair
  4. Les consignes pour le scripteur – instructions aidant à la programmation, non affichées à l’écran : ici en vert

Seul le premier type de libellé (l’intitulé de la question) est systématiquement présent : les trois autres types de libellés (consignes) ne figurent pas forcément dans toutes les questions.

Visuellement, dans le questionnaire Word ou autre, la différence entre ces types de texte n’est pas toujours évidente ; or, il est fondamental que la personne programmant l’enquête puisse différencier ces informations sans ambiguïté.
Dans notre exemple, un code couleur permet de différencier chacun des types de textes.

Vous noterez que, dans l’exemple ci-dessus, la consigne (en vert) pour le programmeur est en réalité un filtre. Un autre type d’instruction pour le programmeur pourrait par exemple être « Afficher en tant que liste déroulante » pour une question de type « intervalle d’entiers », comme dans le second exemple du paragraphe suivant.

5. Les listes de réponses

Enfin, il y a la liste des réponses possibles, pour les questions fermées avec une liste de choix possibles. Pour chaque réponse, on va généralement préciser un code ou identifiant, et un texte (l’intitulé de la réponse).

Tout d’abord, il est utile d’avoir des codes standards pour les non-réponses courantes telles que « ne sait pas » ou « refus » : ici, le code pour « je ne sais pas » est 99.

Ensuite, si une même liste est utilisée dans plusieurs questions, indiquez-le à la personne qui programme le questionnaire.
Vous pouvez même oublier la liste et indiquer simplement « même liste que la question X ». Cela élimine la possibilité d’incohérences accidentelles et vous permet de modifier plus facilement la liste, car vous n’aurez qu’une seule liste à mettre à jour.

Les langages de script de questionnaire ont tous la possibilité de définir des listes une fois et de les réutiliser dans différentes questions – vous pouvez donc aider le scripteur à tirer le meilleur parti de cette fonctionnalité.

L’exemple ci-dessus est une question numérique, et montre quelques exemples d’instructions plus détaillées que vous pouvez donner au scripteur de l’enquête.
Notez qu’elles sont toutes de la même couleur.

Pour les valeurs numériques, les principales contraintes qu’il est utile d’inclure sont les valeurs minimale et maximale.
En général, la valeur maximale est un nombre arbitrairement élevé, comme 9999, qui aide le scripteur à définir la question (et certains formats d’exportation de données l’exigent également).
Mais le minimum peut presque toujours être défini avec une valeur réelle, et le choix est souvent entre 0 et 1.

Vous constatez également que pour cette question, nous précisons deux règles différentes pour les valeurs minimum et maximum.
La première, à côté du mot « NUMERIQUE », est le type global de la question – c’est le type de donnée en sortie, lorsqu’il est exporté de l’outil d’enquête, et il est le même pour chaque enregistrement. Ici, la valeur pour chaque répondant sera comprise entre 1900 et 2022.

La deuxième règle est à appliquer aux réponses individuelles : la valeur ne doit pas être antérieure à l’année de naissance du répondant et ne doit pas être une année future.

On voit aussi dans cet exemple comment on peut différencier le type de données collectées et la manière dont elles sont affichées. Dans ce cas, la question est une liste déroulante dans laquelle l’année la plus récente figure en premier, et les données contiennent une valeur numérique comprise entre 1900 et 2022.

6. Les variables

En plus des questions, vous pouvez inclure des variables (que nous appelons des « recodages » ou « recodes ») qui sont calculées (recodées) dans le script de l’enquête pendant que l’interview se déroule.
Par exemple, si vous demandez à la personne interrogée son âge (en nombre d’années) ou sa date de naissance, vous pouvez ensuite créer une variable recodée qui classe la personne interrogée par tranches d’âge.

Cette variable peut ensuite être utilisée plus tard dans le script de l’enquête (par exemple dans un filtre de questions), ou simplement lorsque vous analysez les données.

Lorsque de telles variables sont programmées, le scripteur peut inclure toutes les informations normalement associées aux questions – un libellé de question, des contraintes sur les valeurs acceptées, etc.
Il est donc utile de considérer les recodes de la même manière que les questions normales, et de les décrire en utilisant le même style.

Dans les questionnaires que nous recevons, nous voyons parfois des recodes définies sans aucun texte : c’est une mauvaise pratique car, lorsque vous recevrez les données à la fin du terrain, vous n’aurez aucune indication sur le contenu de la variable.

La distinction entre les recodes à réponse unique et les recodes à réponses multiples est souvent oubliée – par exemple, si cette question résumait l’âge de tous les membres d’un ménage, elle devrait être à réponses multiples et non à réponse unique.

Le cas particulier des “info-fichier”

Dans certaines enquêtes, vous pouvez également établir des liens avec des sources de données externes (les « infos-fichier »). Il s’agit alors de questions pré-renseignées qui doivent être définies par le scripteur de la même manière que les questions et les recodages normaux.

Il est donc utile d’inclure ces variables externes au début de la spécification, en utilisant le même style que le reste de vos définitions de questions.

L’intérêt de bien spécifier les recodes et les infos-fichiers est double : d’une part, cela aide le scripteur de l’enquête à programmer le questionnaire correctement ; d’autre part, ces variables disposent du même type de métadonnées que les autres questions au moment de l’analyse et de la production de rapports sur les données.

Pour conclure…

Vous l’aurez compris, les conventions présentées dans cet article permettent, si elles sont utilisées correctement, de gagner du temps dans le paramétrage du questionnaire, mais aussi, d’automatiser un certain nombre de process, d’éviter les incompréhensions, et donc d’améliorer la fiabilité. Nous recommandons donc fortement de les utiliser !

Pour aller plus loin, nous vous invitons à télécharger notre livre blanc, dans lequel vous retrouverez toutes ces conventions mais également des conseils plus avancés (ainsi que la réponse à l’énigme posée dans nos illustrations !) :

  • Utilisation de boucles
  • Gestion des questions de type « grille »
  • Questions conditionnelles (« si … alors … sinon »)
  • Instructions “Aller à question X”