Politologue - Un cas concret d'utilisation de l'Open Data qui nous dit peut-être déjà qui sera notre futur Président de la République

Originally published at: http://korben.info/politologue-cas-concret-dutilisation-de-lopen-data-dit-etre-deja-sera-futur-president-de-republique.html

L’open data, c’est génial et tout le monde est d’accord pour le dire. Mais concrètement, qu’est ce qu’on peut faire avec de l’open data ? Et bien aujourd’hui, je vais vous présenter un cas concret de site web qui utilise ces fameuses données en accès libre. Ce site c’est Politologue.com. Il s’agit d’une initiative citoyenne…

Mais, mais… c’est impossible… tous les medias nous expliquent à longueur de journée que le favori c’est Macron. Comment pourrait-on avoir un duel Le Pen - Fillon ?!
lol

Bonjour,

Je pense que les sondages présentés à travers les chaînes TV, journaux et médias sont tronqués pour la simple raison que personne ne peut prédire l’intention d’un vote final. Personnellement, je prédis que Fillon ne sera pas au second tour et ni Marine Le Pen :grin:

Pourquoi cette prédiction ? Je pense que les sondages tronqués vont convaincre les électeurs indécis de voter au 1er tour Macron et Mélanchon. Toute cette campagne présidentielle se jouera donc au 1er tour et sur la manière dont va se répartir la tranche des votes des électeurs indécis (20 millions environ).

Autre facteur clé, si les sondages tendent à convaincre cette tranche d’électeurs indécis (20 millions environ) à voter au 1er tour Macron et Mélanchon, alors Hamon n’aurait pas d’autre alternative que de faire front commun avec Mélanchon au 1er tour ou vis versa.

Si cette hypothèse se vérifiait, alors il se pourrait que nous ayons au second tour Macron et Mélanchon OU Macron et Hamon ! :wink:

“Et oui, aussi bizarre que cela puisse paraitre à des gens normalement constitués, Fillon a encore ses chances.”

Je vois vraiment pas pourquoi tu dis ça, c’était encore une excellente journée pour M. Fillon.

1 « J'aime »

Dommage que le site n’affiche pas les même calculs sur les élections précédentes, cela aurait donné quelques indications sur la fiabilité de ces tendances.

Salut,

C’est la première fois que je commente :wink: Merci Korben pour cet article que j’ai trouvé très intéressant !
Comme toi, j’ai voulu consulter ce que faisait mon député (on a le même) car j’ai été interpellé sur le fait qu’il ne donne pas beaucoup au handicap comme tu l’écris dans ton article. Je précise que je travail dans le domaine et ce député m’a justement l’air sensibilisé, puisque j’ai eu la chance de le rencontrer sur cette question précise (je pose le contexte pour montrer que je peux manquer d’impartialité sur cette question lol). En fait, en y regardant de plus près (comme tu le soulignes aussi à juste titre en nuançant tes propos “(je n’ai pas le détail, pour ça faudrait se pencher sur les articles de presse” -> au passage, c’est pour ça que j’aime ton écriture :smiley: ), on constate que l’ensemble des aides à l’aménagement des lieux pour l’accueil des personnes en situation de handicap (rampe ect…) ne rentre pas dans la ligne “Handicap” mais dans “Fonctionnement des établissements” ou “Aides exceptionnelles aux collectivités territoriales” (catégorie où il semble donner le plus d’argent). En fait, le détail est disponible sur la page que tu as mis en lien (pas besoin de ressortir les articles de presse ^_^).
Bref, tout ça pour dire (commenter en fait) qu’il faut toujours se méfier de la manière dont sont catégorisés les dépenses dans les tableaux excel et en tirer des conclusions hâtives :wink: moi ce qui m’intéresse personnellement, c’est plutôt de voir à qui sont destinés ces aides :smiley:

1 « J'aime »

Perso, je voie déjà Fillon hors course, au vu de tout ce qu’il a sur le cul.

Pour Politologue, je préfère encore rêver que de penser qu’un quelconque candidat l’utilise (à part Mélenchon et p’tet Hamon si ses électeurs leur demande, le programme de Méluche ayant été fait en partie par ses soutiens).

Pour Marine au premier tour, je veux bien croire cette analyse. Par contre, pour le deuxième tour, il ne faut pas perdre de vue que les données d’entrée seront modifiées en fonction du résultat du premier tour.

Donc là, la prédiction est plus hasardeuse.:smirk:

Les amis vos bases ne sont pas bonnes pour vos calculs.

Les “instituts” de sondage sont devenus depuis dix ans des sociétés commerciales qui ont pour slogan: Donnez moi votre proposition et je vais la mettre en avant avec mes chiffres.


Les seuls sondages non commerciaux sont ceux du web live et des radios en direct. Ou encore "il n’y a que l’Open Data qui ne soit pas interprété"

C’est pour cela que lors du Tf1/Facebook en live du grand débat les trois différents sondages donnaient Mr Mélenchon premier avec au moins 40% d’avance sur ses adversaires.Quelques jours auparavant RMC avait fait pareil suite à l’émission BourdinDirect (2,2M d’auditeurs) et avait obtenu 59% pour Mr Mélenchon.
Ça ce sont des données réelles en live, prises sur un échantillonnage des milliers de fois plus important que l’échantillonnage minimal requis pour un sondage.

Par exemple pour une population de 70M avec une marge d’erreur de 2% et un niveau de confiance de 95% il faut sonder 2 400 individus. Les sociétés utilisent un échantillonage de 1 100 personnes. Un sondage weblive c’est sur 1 ou 2 M d’individus. L’échelle n’est simplement pas comparable, on entre dans une autre magnitude.

Alors en plus, “géopolitiquement” si j’ose dire; dans ce cas précis les chaînes de télévision et les médias sont soit sous influence soit la propriété des 8 personnes les plus riches du pays et qui ont donc le plus à perdre.
C’est pour cela que un 56% en faveur de Mr Mélenchon sur le Tf1/Facebook live suivi par 2,5M de personnes ne sera jamais mentionné sur Tf1 TV…
C’est aussi pour toutes ces raisons que l’on attribue de l’importance aux nombre de “followers” et de pouces bleus qui augmentent sur le net. On sait instinctivement que c’est réel, du moins bien plus que ce que l’on lis dans les journaux ou à la télé. C’est pour cela que notre hôte à écrit cet article sur l’Open Data.

C’est comme cela que cet ingénieur Indien dont j’ai oublié le nom à pu prédire les dernières grandes élections de leader mondiaux en compilant l’activité du net.
Quand par exemple je vous dis que le discours d’un homme politique à été lu en replay plus d’un million de fois. Que cela vous dis t il ?
D’abord que c’est réel, c’est un fait établi, le compteur est devant vos yeux.
Ensuite votre mental va comparer avec ce qui est possible de comparer, d’ou la question : il y a t il beaucoup d’hommes politique en France dont les discours sont suivis par plus de 1M de personne ???
Comme vous savez que les sondages en live (RMC, Tf1/Facebook) donnent plus de 50% pour Mr Mélenchon et qu’il n’y a pas de raison de croire que le panel représentatif soit différent de celui du peuple…

Alors si vous mettez tout ça bout à bout vous vous rendez compte que si vous entendez Mr Macron en tête c’est que le sondage à été manipulé, rectifié et vendu.
C’est que les chiffres ont été choisis pour mettre en valeur la proposition commerciale du client.

La mesure de l’écart entre ces sondages et les données de l’Open Data montrent la main mise, l’influence, de pouvoirs individuels face à l’intérêt général. Ces pouvoirs individuels étant majoritairement conduits par l’argent.
Et plus cet écart est grand, plus le choc du résultat final de l’élection est grand; exemple Brexit, Trump, Modi, etc. A chaque fois les sondages reflétaient le point de vue des pouvoirs dominants (caste d’argent, lobbies) et les résultats de l’élection celui du peuple qui génère les données de l’Open Data.

Les photos c’est pour illustrer tout ça :

https://scontent-cdg2-1.xx.fbcdn.net/v/t1.0-9/17309603_1104172413061673_1942626007689560114_n.jpg?oh=4fcea86384706ff431a4c7dfcac8392e&oe=5956D853
https://scontent-cdg2-1.xx.fbcdn.net/v/t1.0-9/17457753_1103617816450466_5075850788716935461_n.jpg?oh=e3a65e01cac9007f65c74084f48730ef&oe=596128F1
https://scontent-cdg2-1.xx.fbcdn.net/v/t1.0-9/17362497_1103619366450311_4047167124761005511_n.jpg?oh=52590223775212613b2e89e5c57239d8&oe=595C470F

Je suis d’accord que les médias tentent de nous influencer et je compte voter Mélenchon. Cependant je ne pense pas que les sondages internet live et les donnés big data soit vraiment fiable pour ces élections. Selon moi Mélenchon fait beaucoup de bruit sur internet (il semble mieux maîtrise l’outil) mais ça ne reflète pas forcément la réalité et l’électorat français (beaucoup de gens qui ne vont pas sur les réseaux sociaux ou ne s’y expriment pas).

Mais j’aimerais y croire, et vous qu’en pensez vous ?

Bonjour,

Quand nous évoquons le “Big Data” c’est quoi exactement ? Pour simplifier c’est un outil de modélisation permettant de “prédire” certaines tendances, valeurs et actions dans le temps… Par analogie, si nous devions examiner les limites de cet outil il suffit de prendre l’exemple d’un partie d’échecs entre deux joueurs. Un tel outil est-il capable de prédire les coups des joueurs ? De la même manière les sondages sont-ils capables de prédire les intentions de vote de tous les électeurs je jour ’ J ’ ? Bien sûr que non :grin:

Plus haut dans un commentaire il a été fait référence aux “aides/subventions”. Je me permets modestement de faire un parallèle relativement amusant sur ce point majeur de notre modèle économique et social en France.

J’ai eu beau cherché sur le Net et d’autre sources d’information officielle quel était le rapport (lien) économique et social entre les “aides/subventions” et l’emploi. Cette question phare n’a jamais été abordé dans le détail à ma connaissance et pour cause… Quel est le rapport entre la politique européenne qui nous est imposée et le développement économique et social de nos régions ?

Les “aides/subventions” sont-elles réparties équitablement à travers nos régions ? (personnellement je ne le crois pas)

L’Europe est-il l’élément perturbateur de notre modèle économique et social en France ? (A mon avis, je pense que le modèle européen n’a pas été conçu et adapté au modèle économique et social de la France d’où la nécessité de le réadapter à condition d’équilibrer la répartition des “aides/subventions” sur la base d’un indice référent, celui de l’emploi et du logement social:

             1 emploi = 1 logement social = 1 droit à une "aide/subvention"

ou inversement:

             1 droit à une "aide/subvention" = 1 logement social = 1 emploi

La formule peut sembler simpliste je vous l’accorde…, mais est-elle viable et perenne économiquement si elle était appliquée sur l’ensemble du territoire national ?

Un lien de santé publique sur les sondages : Il était une fois… les instituts de sondage

Quant au big data, les données reflètent l’implication. Les abstentionnistes ou les gens peu politisés ne produiront pas beaucoup de données significatives. Ils ne voteront pas plus non plus. C’est donc un indicateur relativement intéressant.

De toute manière camarade il s’agit d’aller voter par adhésion. On ne lâche rien :wink:

Les données dont vous parlez ne sont que des “prédictions” générées par cet “outil” en l’occurrence le “Big Data”. Les abstentionnistes seront minoritaires face aux 20 millions d’électeurs indécis. L’hypothèse que j’ai évoqué plus haut n’est pas intégrée dans ces “sondages foireux”, à savoir une éventuelle alliance Hamon/Mélachon avant le 1er tour. Perso, si j’étais à la place de Hamon, je me rallierais à Mélanchon vue la tournure chaotique qu’à pris cette élection présidentielle où nous voyons bien que beaucoup tentent de manipuler les sondages en prônant le “vote utile”…, vous voyez de qui je parle ?.. :grin:

Attendons de voir les prochaines révélations du Canard Enchaîné au sujet de Macron peut-être et découvrir d’autres “sondages volatiles” ? :joy:

J’étais en Inde quand Mr Modi à été élu Premier ministre. Un coup de tonnerre gigantesque. C’était la première fois depuis Gandhi que l’opposition prenait le pouvoir. Personne n’avais vu ça venir sauf un ingénieur Indien qui à été le premier à compiler les données du BigData. Il avait prédit Modi, puis plus tard le Brexit et Trump. Et croyez moi en Inde ils sont loin d’aller tous sur les réseau sociaux, très très loin même. Et pourtant ça à marché.
Tu dis que beaucoup de gens ne vont pas sur les réseaux sociaux, OK. Mais regardes un autre point Mme Le Pen à beaucoup plus de followers que JLM mais ils ne sont pas impliqués. C’est une base de donnée qui s’est remplie au fil des ans. Les données sur les followers de Mr Mélenchon montre que c’est récent et en constante augmentation. C’est cela qui est significatif (loi de Pareto) et si vous ajoutez l’importance du nombre de replay des discours, les doutes s’envolent.

Ha non DIKI négatif !
Quand tu écris" Quand nous évoquons le “Big Data” c’est quoi exactement ? Pour simplifier c’est un outil de modélisation permettant de “prédire” certaines tendances"
Parles uniquement pour toi s’il te plait !!!
Par ce que si tu commences à parler d’outils de modélisation on n’est pas du tout du tout d’accord.
Le Big Data dont je parle ce sont les données brutes et surtout pas interprétée à travers un outil de modélisation. C’est à cause de ces outils pervertis que les sondages commerciaux sont commerciaux. Le Big Data ce sont des données brutes pas un outil et cela se manie avec la Sociologie et non pas avec les Mathématiques.

Je te fais une démonstration:

Si on veux obtenir des résultats d’une élection il faut étudier un événement sociologique particulier.
Je suggère le meeting politique; parce que c’ est la brique de base avec laquelle se construit une campagne. Il parait que c’est depuis les Grecs que l’on peu parler aux gens pour les convaincre (avant on utilisait des bâtons::slight_smile: ).
Si on regarde les meetings de Mr Mélenchon, ils sont suivis en live/replay par entre 300 et 600 000 personnes.
Dans cet événement on comprend bien que la motivation d’utiliser Internet vient de l’impossibilité physique d’être sur place. On ne peu pas prendre le train alors on utilise l’Internet.
Par exemple une famille entière, qui regroupe 4 générations avec chacune une approche totalement différente de l’internet (de répulsion complète à addiction complète), sera seulement motivé par le fait de voir le meeting et utilisera l’ordinateur comme une télé.
Vous comprenez que dans un tel événement la motivation primaire est beaucoup plus importante que la peur, la non connaissance ou la non habitude de l’Internet et que nous ne sommes plus dans le cas ou “beaucoup de gens ne vont pas sur les réseaux sociaux ou ne s’y expriment pas”.
Donc ici nous avons comme événement un meeting politique suivi par 500 000 personnes.
Il suffit ensuite de comparer avec les concurrents; combien de personnes assistent à un Meeting de Mr Macron ?
24 000 comparé à 500 000 !
Il n’est pas sorcier de comprendre que plus le candidats à de personnes qui viennent l’écouter plus il à de chances de l’emporter.
Après tout c’est quand même pour ça qu’ils font des meetings (depuis les Grecs), non ?
Bien sur ce n’est pas par ce que Titin à 20 fois plus de monde que Escartefigue qu’il va faire le score d’Escartefigue multiplié par 20; mais ça veux quand même dire que Titin gagnera et de beaucoup.

Voilà le big Data c’est ça. Savoir choisir une suite d’événement sociologiquement remarquable (meetings en live/replays, sondages radio en live, accélération des adhésions) dans la masse pour voir s’ils vont dans le même sens; et non pas analyser des chiffres et faire des modélisations.
Cela donne une tendance très forte sans jamais se tromper.
Il ne faut pas oublier que l’analyse du Big Data doit toujours être vue du coté sociologique et non pas du coté mathématique.
C’est pour cela aussi qu’une analyse du Big Data ne donnera jamais un résultat précis au %, voire au 10%. Mais dans une élection ou il n’y à que deux candidats il suffit de savoir celui qui fera plus de 50%, c’est à dire de quel coté poussent les événements sociologiques étudiés non ?
Un sondage commercial va donner un chiffre précis (Escartefigue 52,4%, Titin 47,6%) qui ne se réalisera jamais alors que l’analyse sociologique du Big Data va donner une tendance (faible, forte) mais qui se réalisera toujours (Titin vainqueur).
Tendance faible : Titin vainqueur avec 60% des voix.
Tendance forte : Titin vainqueur avec 80% des voix.

Voilà, voilà; en espérant vous avoir aidé.

Bonjour yogesh,

Sans vouloir surenchérir sur ton commentaire subjectif, je me permets de rectifier ce que tu as repris à partir de mon précédent message car il manque le plus important :wink::

Le “Big Data” dont tu parles ne fait référence à aucune notion technologique. Aujourd’hui, le Big Data fait référence à l’accroissement exponentiel du volume des données dans le monde de l’entreprise ainsi que des nouveaux moyens technologiques proposés par les éditeurs, notamment la “Business Intelligence”…

La notion de “Sociologie” à laquelle tu fais référence, dans ton commentaire ci-dessous semble être mal exprimée… Le Big Data transforme l’approche sociologique et non l’inverse. :grin:

Discuter de “Sociologie”, c’est un autre débat, une autre approche… je crois qu’il ne faut pas faire l’amalgame entre le “Big Data” et les “Sciences Sociales” dont tu parles…

Mais c’est exactement le point prouvé par cet ingénieur Indien (dont je vais te retrouver les références). Il n’y à que l’approche sociologique qui fonctionne pour l’interprétation des chiffres du Big Data.
Tout ce que j’ai écrit depuis le début est basé sur cela.
Si tu as une autre opinion c’est bien; mais ca ne changera pas le fait que c’est cette découverte de cet Indien qui à révolutionné l’approche dogmatique classique que l’on t’a appris et qui est encore la tienne.:slight_smile:

Et c’est pour cela que ce que j’apporte se place exactement dans le débat. Tu connais et défend l’approche classique reflétée par l’article de l’ami Korben et moi j’apporte une autre autre vision, développée par une autre civilisation et un autre mode de pensée. Je suis resté en Inde pendant dix ans dans le milieu universitaire technologique de haut niveau et ce que je te dis c’est qu’ils ont trouvé et prouvé que Il n’y à que l’approche sociologique qui fonctionne pour l’interprétation des données Big Data.

Tu vois c’est un autre point de vue que le tient et il est partagé par plus d’un milliard de personnes, alors pourquoi l’exclure du débat ?
On est bien là pour éveiller les consciences et pousser les gens à upgrader leur mind non ? :slight_smile:

Nous y voilà ! :wink: Tu aurais du commencer par cette approche sociologique dans ton précédent commentaire afin d’éviter toute confusion notamment sur les notions et les moyens technologiques déployés autour du “Big Data”… Je te laisse le temps de retrouver ton ingénieur indien :yum:

NB: Je suis convaincu que lorsque tu auras retrouvé les références de cet ingénieur indien nous pourrons faire le parallèle avec les “liaisons numériques” qui nous conduisent vers une “nouvelle sociabilité”… en d’autres termes, l’approche sociologique est un consensus transformé par le “Big Data” qui ne peut être réduit à de simples principes de fonctionnement… :grin:

Au regard de la récente actualité, mon hypothèse (“prédiction”) semble se vérifier… :grin:

Mais y’a un truc qui me chiffonne quand même.
La dernière étude sur les candidats à la présidentielle n’a strictement rien à voir avec les autres, on est bien d’accord ?
Elle ne s’appuie pas vraiment sur de l’Open Data dans le sens où elle ne se base pas du tout sur des données concrètes mais se contente de mesurer le bruit social de tel ou tel candidat.
En gros plus tu fais le buzz plus tu montes dans les résultats ce qui n’a strictement aucun rapport avec les intentions de vote.
Cela m’avait déjà interloqué à la lecture de cet article mais un nouvel article des décodeurs à propos de Filteris qui propose le même type d’étude est venu confirmer mes réticences et explique bien mieux que moi tous les biais de cette méthode et pourquoi il faut la prendre avec de grosses pincettes surtout avec les arguments avancés sur les victoires de Trump et Fillon qui ne prennent en compte qu’une toute petite partie de ces études (en gros celle qui arrange) et laisse de côté tout le reste qui est totalement erroné.

Bref, maintenant plus que jamais il faut absolument garder un esprit critique et penser à faire tourner ses méninges avant de partager n’importe quelle “vérité”.

source:http://www.lemonde.fr/les-decodeurs/article/2017/04/03/election-presidentielle-filteris-la-pseudo-enquete-electorale-a-prendre-avec-des-pincettes_5105106_4355770.html