Les voitures sans chauffeurs ne sont qu’un début. Quel impact le Big Data aura-t-il sur les innovations technologiques à venir ? Dans cet exposé passionnant, Kenneth CUKIER dresse le portrait de l’apprentissage automatique de demain et… de l’intelligence humaine.

0:11
Quelle est la tarte préférée des Américains ? Public : La tarte à la pomme ! K. Cukier : En effet !

0:19
Comment le sait-on ? Grâce aux données.

0:23
Les ventes de supermarchés. Parmi les ventes en supermarché de tartes surgelées de 30 cm, la tarte à la pomme était n°1, haut la main. La majorité des ventes se fait sur les tartes à la pomme. Puis les supermarchés se sont mis à vendre des tartes plus petites, de 11 cm. Et d’un coup, la pomme a chuté à la 4ème ou 5ème place Pourquoi ? Que s’est-il passé ? Réfléchissez ! Quand vous achetez une grande tarte, il faut que toute la famille soit d’accord, Or la pomme est le deuxième choix de tous. (Rires) Mais si vous achetez une petite tartelette, vous pouvez acheter celle que vous préférez. Vous pouvez avoir votre premier choix. Vous avez plus de données. On découvre quelque chose qui nous aurait échappé avec moins de données. Mais plus de données ne nous donnent pas seulement plus d’informations,

1:28
plus d’informations sur la même chose. Plus de données nous permettent de voir de nouvelles choses, d’y voir plus clair, de voir sous un nouvel angle. Dans ce cas, ça nous a permis de savoir quelle tarte les Américains préfèrent : ce n’est pas la pomme. Vous avez déjà probablement entendu le terme « Big Data ».

1:53
En fait, vous en avez probablement plein les oreilles des Big Data. C’est vrai qu’il y a beaucoup de bruit autour de ça et c’est bien regrettable, parce c’est un outil extrêmement important qui va faire progresser notre société. Jusqu’ici, on n’utilisait que de petites quantités de données, on cherchait à les interpréter afin de comprendre le monde. On a à présent infiniment plus de données, plus de données que jamais auparavant. Et quand on a une telle quantité de données, on peut accomplir des choses inimaginables avec de petites quantités. Les Big Data sont à la fois nouvelles et importantes. Si on y réfléchit, le seul moyen qu’on aura pour faire face aux enjeux mondiaux : nourrir l’humanité, l’approvisionner en médicaments, en énergie, en électricité, et éviter d’être rôti par le réchauffement climatique, ce sera grâce à une utilisation efficace des données. Qu’y a-t-il de nouveau dans les Big Data ? Pourquoi tout le monde en parle ?

2:55
Pour y répondre, il faut se rappeler à quoi ressemblait physiquement une information dans le passé. En 1908, sur l’île de Crète, des archéologues ont découvert un disque en argile. Ils l’ont daté de 2 000 ans av. J-C., soit vieux de 4 000 ans. Il y a des inscriptions mais personne n’arrive à les déchiffrer. Le mystère reste entier. Mais c’est à cela que ressemblait l’information il y a 4 000 ans. C’est ainsi que la société stockait et transmettait l’information. La société n’a pas tant évolué que ça.

3:34
On stocke toujours l’information sur des disques, mais en quantité plus grande, infiniment plus grande. Les informations sont plus faciles à chercher, plus faciles à copier, à partager, plus faciles à traiter. On peut aussi réutiliser ces informations à des fins auxquelles on n’avait pas du tout pensé au moment où on les a collectées. On peut dire que les données sont passées d’un stock à un flux, de statique et immobile, à fluide et dynamique. On peut dire que l’information est devenue liquide. Ce disque découvert en Crète et vieux de 4 000 ans, il est lourd, il ne contient pas beaucoup d’information, et cette information n’est pas modifiable. En revanche, tous les fichiers qu’Edward Snowden a pris à la NSA aux États-Unis tiennent sur une clé USB pas plus grande qu’une pièce de 50 centimes, et ils peuvent être partagés à la vitesse de la lumière. Plus de données. Plus. Une raison pour laquelle nous avons tant de données aujourd’hui, c’est qu’on étudie des choses

4:54
sur lesquelles on a toujours collecté de l’information. Une autre raison, c’est qu’on utilise des choses qui ont toujours été informationnelles et qui n’ont jamais été transformées en données et nous les mettons maintenant en données. Prenez l’exemple des données de localisation. Pensez par exemple à Martin Luther. Si on avait voulu savoir au 16ème siècle où Martin Luther se trouvait, on aurait dû le suivre tout le temps, sans doute avec une plume et un encrier pour noter ses différentes positions. Regardez à quoi ça ressemble aujourd’hui ! Vous savez que quelque part, probablement dans la base de données de votre opérateur, il y a un tableau ou une entrée dans une base de données qui enregistre les informations sur votre localisation, à chaque instant. Si vous avez un téléphone portable, que ce dernier soit muni d’un GPS ou non, il stocke vos informations. C’est ainsi que la localisation a été mise en données. Prenons maintenant l’exemple de votre posture, la manière dont vous êtes tous assis en ce moment

5:54
votre manière de vous asseoir à vous, votre posture à vous, la vôtre. Elles sont toutes différentes en fonction de la longueur de vos jambes et des contours de votre dos Et si je posais, disons, 100 capteurs sur chacun de vos sièges, je pourrais créer un index unique qui vous serait propre, comme une empreinte unique, autre qu’une empreinte digitale. Mais à quoi ça pourrait bien servir ? Des chercheurs à Tokyo utilisent ça

6:20
comme un possible système antivol dans les voitures. Si un voleur s’assied derrière le volant et tente de démarrer, la voiture reconnaît qu’un conducteur non-approuvé est derrière le volant et stoppe simplement le moteur, sauf si vous entrez un mot de passe qui dit que vous avez l’autorisation de conduire la voiture. Imaginons que chaque voiture en Europe soit munie de cette technologie.

6:46
Quelles perspectives cela nous ouvre-t-il ? En rassemblant ces données, on pourrait peut-être identifier des signes révélateurs qui prédisent au mieux qu’un accident va se produire dans les 5 prochaines secondes. C’est ainsi qu’on sera parvenu à mettre en données la fatigue du conducteur. Un nouveau service serait que, quand la voiture sent qu’une personne s’affale dans cette position, elle comprend automatiquement et réagit en faisant vibrer le volant, en klaxonnant à l’intérieur comme pour dire : « Debout, concentre-toi sur la route ! » C’est le genre de choses qui deviennent possibles quand on met en données certains aspects du quotidien. Que valent alors donc les Big Data ? Pensez-y !

7:34
On a plus d’information. On peut faire des nouvelles choses qui étaient impossibles auparavant. Une des applications les plus impressionnantes des Big Data concerne le domaine de l’apprentissage automatique. Il s’agit d’une branche de l’intelligence artificielle, elle-même branche de l’informatique. L’idée générale c’est que, plutôt que de dire à l’ordinateur ce qu’il a à faire, on va juste donner plein d’informations à l’ordinateur et lui dire de se débrouiller avec. Pour vous aider à comprendre, retournons aux origines de l’apprentissage automatique. En 1950, un informaticien de chez IBM, Arthur Samuel, était amateur du jeu de Dames. Il a donc créé un programme informatique afin de jouer contre l’ordinateur. Il a joué. Il a gagné. Il a joué. Il a gagné. Il a joué. Il a gagné, parce que l’ordinateur ne connaissait rien d’autre que les coups légaux. Arthur Samuel en savait plus. Arthur Samuel avait des notions de stratégie. Il a alors écrit un sous-programme à côté. Il opérait en arrière-plan et tout ce qu’il faisait, c’est qu’après chacun des coups, il comptait les probabilités de chacune des configurations du damier de mener à la victoire ou à la défaite. Il joue contre l’ordinateur. Il gagne. Il joue contre l’ordinateur. Il gagne. Il joue contre l’ordinateur. Il gagne. Puis Arthur Samuel a laissé l’ordinateur jouer contre lui-même. Plus il joue contre lui-même, plus il collecte de données. Plus il collecte de données, plus il augmente la précision de ses prédictions. Et quand Samuel a rejoué contre l’ordinateur, il joue et il perd. Il joue et il perd. Il joue et il perd. C’est ainsi qu’Arthur Samuel a créé une machine capable de le surpasser dans une discipline qu’il lui a enseignée. Et cette idée d’apprentissage automatique est partout autour de nous.

9:36
Comment croyez-vous que des voitures roulent toutes seules ? Notre société est-elle meilleure depuis que le code de la route a été traduit dans un logiciel ? Non. Le stockage est-il moins cher ? Non. Les algorithmes plus rapides ? Non. Les processeurs plus puissants ? Non. Toutes ces choses sont importantes, mais pas décisives. C’est parce que nous avons changé la nature du problème. Avant, on essayait d’expliquer clairement et ouvertement à l’ordinateur comment il devait conduire. Aujourd’hui, on lui dit : « Voici tout plein de données sur le véhicule, débrouille-toi ! Débrouille-toi à comprendre que ceci est un feu de signalisation que le feu est rouge et non vert, que cela veut dire que tu dois t’arrêter, et non pas continuer. » L’apprentissage automatique est à la base de nombreux outils en ligne : les moteurs de recherche,

10:22
l’algorithme de personnalisation d’Amazon, la traduction par ordinateur, ou encore la reconnaissance vocale. Les chercheurs se sont récemment penchés sur la question des biopsies, des biopsies de cellules cancéreuses. Ils ont demandé à des ordinateurs d’analyser les données et le taux de survie pour déterminer quelles cellules sont réellement cancéreuses. Sans surprise, en fournissant assez de données à l’algorithme d’apprentissage automatique, l’ordinateur était capable d’identifier les 12 signes caractéristiques qui prédisent au mieux que cette biopsie de cellules tumorales mammaires sont en effet cancéreuses. Le truc, c’est que les médecins n’en connaissaient que 9. Trois des signes ont été identifiés par l’ordinateur sans que quelqu’un n’ait besoin de faire de recherche dessus. Mais il y a aussi une face sombre des Big Data. Cela va améliorer nos vies,

11:31
mais il y a aussi des problèmes dont il faut être conscient. Le premier, c’est l’idée que l’on puisse être puni à cause de prédictions, que la police utilise les Big Data un peu comme dans « Minority Report ». On appelle ça la prévision policière ou la criminologie algorithmique. L’idée est que, si on prend beaucoup de données par exemple où des crimes ont été commis, on sait où envoyer les patrouilles. C’est logique. Mais le problème, c’est qu’on ne s’arrêtera pas aux données de localisation, on va aller jusqu’au niveau de l’individu. Pourquoi ne pas utiliser les données fournies par vos bulletins scolaires ? Peut-être devrions-nous utiliser le fait que les gens ont un emploi ou non, leur solvabilité, leur comportement sur Internet, s’ils sont debout tard dans la nuit. Leur FitBit, quand c’est possible, pour identifier les réactions biochimiques qui produisent des pensées agressives. On peut avoir des algorithmes qui pourraient prédire ce que nous sommes sur le point de faire, nous pourrions être tenus responsables de ce que l’on n’a pas encore fait. La vie privée était le défi principal lorsqu’on avait peu de données. Avec les Big Data, le défi sera de préserver le libre-arbitre, les choix moraux, le consentement et la capacité d’agir de l’homme. Et il y a un autre problème : les Big Data vont nous voler notre travail.

12:59
A l’aide des algorithmes, elles vont entrer en concurrence avec les cols blancs, avec les travailleurs intellectuels du 21ème siècle, de la même manière que l’automatisation des lignes de montage a concurrencé le travail des cols bleus, au 20ème siècle. Imaginez un technicien de laboratoire qui examine à l’aide d’un microscope la biopsie d’une tumeur pour déterminer si elle est cancéreuse. Cette personne a fait des études. Cette personne est propriétaire. Il ou elle vote. Il ou elle est acteur à part entière de notre société. Et pourtant cette personne, ainsi qu’un pan entier de professionnels similaires, va voir son travail radicalement transformé, voire carrément éliminé. On aime pourtant se dire que sur le long terme, la technologie crée des emplois, après une courte période temporaire de destruction d’emplois. C’est vrai pour la période de référence dans laquelle nous vivons, la Révolution Industrielle, car c’est précisément ce qui s’est passé. Mais on oublie un élément dans cette analyse. Il y a des catégories d’emplois qui sont simplement éliminées et ne sont pas remplacées. La Révolution Industrielle n’a pas été bonne pour les chevaux. Il va donc falloir être prudent, prendre les Big Data et les ajuster à nos besoins, nos besoins humains fondamentaux. Nous devons maîtriser cette technologie et non devenir ses esclaves. L’ère des Big Data vient tout juste de commencer et honnêtement, nous ne sommes pas très bons pour manipuler toutes ces données que nous collectons. Ce n’est pas juste un problème pour la NSA. Les entreprises collectent aussi beaucoup de données, et elles en abusent aussi. Il va falloir faire mieux, et cela va prendre du temps. C’est un peu comme le défi de l’homme préhistorique quand il a inventé le feu. C’est un outil, mais c’est un outil qui, si nous ne sommes pas prudents, va nous brûler. Les Big Data vont transformer nos modes de vie, de travail et de pensée.

15:00
Elles nous aideront à gérer nos carrières, à mener une vie faite de satisfaction, d’espoir, de bonheur et de santé. Mais, par le passé, on a souvent regardé les technologies de l’information et nos yeux n’ont vu que le T, la Technologie, l’ordinateur, parce que c’est matériel et palpable. Il faut à présent tourner notre regard vers le I, l’Information, qui est moins visible, mais d’une certaine manière bien plus importante. L’humanité peut enfin apprendre des informations qu’elle collecte dans le cadre de sa quête pour comprendre le monde et la place de l’homme en son sein. Voilà pourquoi les Big Data sont si importantes. (Applaudissements)

SOURCE

Morgan REMOLEUR

Passionné par le digital, Morgan est un Pharmacien entrepreneur innovant au plus près des patients. Industriel de formation, Internet par passion, Business developer pour partager l'innovation. "Je suis intimement convaincu que le digital et le big data vont révolutionner tous les métiers à la fois sur un plan technique dans la collecte des données, pratique pour la relation client et éthique avec le besoin de régulation."

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *