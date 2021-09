Les sondages Tamedia expliqués – Voici comment sont calculés les résultats de nos sondages Comment les réponses sont-elles évaluées? Les résultats sont-ils fiables? Nous répondons aux questions les plus importantes. Yannick Wiget

Les sondages «20 minutes»/Tamedia sont réalisés en collaboration avec LeeWas. L’institut des politologues Lucas Leemann et Fabio Wasserfallen est spécialisé dans la recherche sur l’opinion politique et sociale. Il ne fonctionne pas selon les méthodes traditionnelles, mais s’appuie sur une modélisation statistique. Nous expliquons ici en détail ce que cela implique.

Sur quelle base les calculs sont-ils fondés?

Avant et après les votations ou les élections, les plateformes d’information de Tamedia et du groupe «20 minutes" réalisent des sondages en ligne auxquels des milliers de personnes participent à chaque fois. Les participantes et participants indiquent non seulement leurs intentions de vote et les raisons de celles-ci. Ces personnes fournissent également des informations sur les caractéristiques suivantes, entre autres:

Âge

Sexe

Langue maternelle

Éducation

Revenu du ménage

Lieu de résidence et région (ville, agglomération, campagne)

Préférence partisane

Fréquence de la participation aux élections et aux votes

Ces données permettent d’établir un profil des personnes qui participent au sondage et de pondérer les résultats pour coller à la réalité démographique.

Comment fonctionne la modélisation statistique?

LeeWas analyse les informations fournies par celles et ceux qui ont répondu au sondage dans un processus en plusieurs étapes. Ce dernier est basé sur des modèles statistiques et est complexe, comme l’écrit l’institut dans son rapport méthodologique. Pour schématiser, les données de l’enquête sont analysées en trois étapes afin que l’échantillon corresponde à la structure de la population votante.

Dans un premier temps, LeeWas définit différents profils types (par exemple, des Vaudoises de 18 à 35 ans qui vivent en ville, ont un diplôme de fin d’apprentissage et qui se sentent proches du PLR). Dans la deuxième étape, le soutien attendu est modélisé pour chaque profil type possible. Enfin, le soutien est calculé pour l’ensemble de la population votante.

«Une hypothèse importante de la méthode est que les personnes de même profil type votent de la même façon.»

LeeWas divise la population électorale en plus de 20’000 profils types, puis modélise le soutien à un objet soumis au vote pour chaque profil type et extrapole les valeurs à l’ensemble de la population électorale. Une hypothèse importante de la méthode est que les personnes de même profil type votent de la même façon. Elle part donc du principe que les Vaudoises de 18 à 35 ans ayant terminé un apprentissage, habitant en ville, et proches du PLR – et ayant participé à l’enquête –, ne se distinguent pas systématiquement des Vaudoises du même âge ayant les mêmes caractéristiques démographiques et politiques, mais qui n’ont pas participé à notre sondage.

Quels sont les avantages de cette approche?

Elle s’appuie sur des sondages ouverts, auxquels, théoriquement, toutes les personnes ayant le droit de vote peuvent participer. La très forte diffusion de «20 minutes» et des plateformes de Tamedia garantit une large participation. Par conséquent, les analyses sont basées sur un échantillon plus important que les enquêtes téléphoniques traditionnelles avec un échantillon aléatoire d’environ 1000 personnes.

En outre, la modélisation statistique selon LeeWas conduit à des résultats plus précis et détaillés qu’une pondération classique. Dans ce dernier cas, les échantillons sont simplement ajustés à la population. Par exemple, si trop peu de jeunes hommes participent, leurs réponses sont pondérées plus fortement que celles des groupes d’âge surreprésentés dans l’enquête. Avec la modélisation statistique, davantage de facteurs sont pris en compte, ce qui permet également des analyses spatialement plus approfondies.

Quelles sont les difficultés de cette méthode?

Dans une enquête ouverte en ligne, les personnes appartenant à différents groupes de populations participent à des taux différents. Il ne s’agit pas d’un échantillon choisi au hasard. Par conséquent, une modélisation statistique complexe est nécessaire pour compenser les biais éventuels.

La base théorique vient, entre autres, de récentes recherches sur les modèles multiniveaux et la poststratification, ce qui est difficile à comprendre pour les profanes. L’évaluation des données requiert du coup de solides connaissances en matière de statistiques ainsi qu’une grande expérience.

Quelle est la fiabilité des sondages?

Le signe de qualité le plus fiable est la validation par rapport à la réalité. Les derniers sondages publiés avant le dimanche du vote peuvent être comparés au résultat dans les urnes. Nous avons analysé les 68 objets de votations fédérales entre le 9 février 2014 et le 13 juin 2021 où LeeWas a appliqué sa méthodologie de modélisation:

Pour 32 des 68 référendums, les prédictions de LeeWas étaient plus proches du résultat que le sondage de la SSR, qui repose essentiellement sur des enquêtes téléphoniques. La SSR a été plus précise 31 fois, les deux approches ont prédit le même résultat quatre fois, et la SSR n’a pas mené d’enquête une fois, c’est pourquoi il n’y a pas de comparaison.

«En moyenne, les calculs de LeeWas s’écartent du résultat de 6,5 points de pourcentage.»

Cette évaluation montre que la méthode LeeWas est au moins aussi performante que l’approche traditionnelle. Les sondages de «20 minutes»/Tamedia ont pratiquement toujours prédit le bon résultat final (oui/non).

Les quelques exceptions concernent l’initiative sur l’immigration de masse en 2014, qui a été acceptée de manière surprenante et sur le fil avec 50,3% de oui. Parfois, les sondages ont prédit le résultat exact, parfois ils étaient à côté. En moyenne, les calculs de LeeWas s’écartent du résultat de 6,5 points de pourcentage, ceux de la SSR de 6,6 points de pourcentage.

Les deux méthodes utilisées sont donc fiables, mais il y a toujours une certaine part d’incertitude dans ces sondages avant un vote.

Yannick Wiget est datajournaliste. Il travaille au sein de la rédaction de Tamedia à Zurich depuis 2015, à l'interface entre l'équipe interactive et la rédaction online. Il donne également des cours internes de storytelling numérique et dirige l'équipe de fact-checking. @yannickw3

