Les organismes municipaux ont accès à de nombreuses données et statistiques sur tous les aspects de la vie urbaine. Mais comme le suggère l’analyste de données Ben Wellington dans sa conférence, ces organismes ne savent pas toujours quoi faire avec leurs données. Il fait la preuve qu’il est possible de répondre à des questions incongrues grâce à des mesures de traitement de données, et ainsi d’obtenir des renseignements étrangement utiles, et il partage avec nous ses conseils afin que les grands ensembles de données rendus publics puissent être utilisés par tous.

0:11
10 000 km de routes, 1000 km de rails de métro, 640 km d’aménagements cyclables et un tramway aérien de 945 m reliant Manhattan à Roosevelt Island.

0:22
Ces quelques nombres décrivent l’infrastructure routière de la ville de New York. Les rapports des organismes municipaux contiennent ces données. Le département des transports, vous dira le nombre de km de routes entretenus Le MTA se vantera du nombre de km de voies de métro. La plupart des organismes établissent des statistiques. Voici des données d’un rapport de cette année de la commission des taxis, qui nous apprennent qu’il y a environ 13 500 taxis ici à New York. Intéressant, n’est-ce pas? Mais vous êtes-vous déjà demandé d’où viennent ces nombres? Pour qu’ils existent, des fonctionnaires ont dû s’arrêter et se dire, hum, voici une donnée qui intéresse peut-être quelqu’un. Voilà un nombre dont nos citoyens ont besoin. Ils sortent alors leurs données brutes, comptent, ajoutent, calculent, et rédigent des rapports contenant de nouveaux chiffres.

1:08
Mais le problème : comment devinent-ils nos questions? Nous en avons beaucoup. En fait, le nombre de questions que nous nous posons sur notre ville est infini et les organismes peinent à nous suivre. Cette façon de faire n’est pas au point et je crois que nos décideurs le réalisent, car en 2012, le maire Bloomberg a signé ce qu’il a appelé la mesure législative sur les données ouvertes la plus ambitieuse et exhaustive au pays. Il a raison à bien des égards. En deux ans, la ville a publié 1000 jeux de données sur notre portail des données ouvertes, ce qui n’est pas mal. Vous regardez des données comme celles-là et vous commencez à vous poser des questions qui vont au-delà du simple nombre de taxis.

1:44
Moi, je me suis demandé, quelle est l’heure de pointe à NY? La réponse ne nous vient pas naturellement. Et je me suis dit, ces taxis sont plus que des nombres, ils transportent des GPS qui enregistrent chaque course qu’ils font. J’ai donc jeté un œil à ces données, et j’ai tracé une courbe de la vitesse moyenne des taxis durant la journée. Vous pouvez voir qu’à partir de minuit jusqu’à environ 5 h 18, la vitesse augmente, puis les choses se gâtent et la vitesse décroît et décroît et décroît jusqu’à 8 h 35, où elle se stabilise à environ 18,5 km par heure. Les taxis roulent en moyenne à 18,5 km/h dans les rues de notre ville, et leur vitesse demeure telle quelle toute la journée. (Rires) J’en conclus donc qu’il n’y a pas d’heure de pointe à New York, mais des journées de pointe. Logique. Et c’est important pour diverses raisons. Si vous travaillez dans le domaine du transport, c’est intéressant pour vous. Et si vous êtes quelqu’un de pressé, vous savez maintenant que vous devez vous réveiller à 4 h 45. New York, non?

2:45
Mais ces données ont elles aussi une histoire : elles n’étaient publiées nulle part et ont été obtenues par suite d’une demande faite en vertu de la loi del’accès à l’information. Le formulaire pour faire une telle demande est sur le site de la TLC. Pour obtenir les données, vous devez le remplir, l’envoyer, puis attendre qu’on communique avec nous. C’est ce qu’a fait Chris Whong. Voici ce que le TLC lui a demandé : « Apportez-nous un disque dur neuf. Nous y copierons les données et vous pourrez venir le chercher cinq heures plus tard. » Voilà d’où les données proviennent. Chris est de ceux qui veulent que de telles données soient publiques, et il les a mis en ligne, ce qui m’a permis de faire la carte. Le fait que ces enregistrements GPS existent — vraiment cool. Mais le fait que des citoyens se promènent avec des disques durs pour aller chercher des données, qui en soi sont « publiques », mais qui ne sont pas rendues publiques, nous pouvons faire mieux comme ville. Nul besoin que nos citoyens trimbalent des disques durs.

3:39
Mais certaines données sont déjà à disposition. Voici une carte que j’ai créée des intersections de NY enregistrant le plus d’accidents impliquant des cyclistes. Les zones rouges sont les plus dangereuses. Ce que l’on observe, c’est que la portion est de l’île, particulièrement dans le sud de la ville, enregistre le plus d’accidents. Ce n’est pas illogique, car beaucoup de cyclistes sortent du pont à cet endroit. Mais d’autres zones, comme Williamsburg, Roosevelt Avenue dans Queens, méritent notre attention. C’est le genre de données dont Vision Zero a besoin. C’est ce qui fait notre bonheur.

4:08
Mais encore une fois, il y a une histoire à raconter au sujet de ces données. Combien d’entre vous connaissent ce logo? Je vois des hochements de tête. Avez-vous déjà copié et collé des données d’un PDF, puis essayé d’y voir clair? Vous l’êtes apparemment. Plus à avoir fait du copier-coller qu’à reconnaître le logo. Intéressant.

4:25
Les données que vous avez vues se trouvaient à l’origine dans un PDF. En fait, dans un PDF de plusieurs centaines de pages créé par notre service de police, et pour pouvoir les utiliser, vous deviez faire du copier-coller, pendant des heures, ou vous appelez John Krauss. John Krauss s’est dit, je ne vais pas copier ces données, mais plutôt créer un programme, le NYPD Crash Data Band-Aid, qui se promène sur le site Web du NYPD pour y dénicher des PDF. Chaque jour, il cherche, trouve et télécharge des PDF, puis en extrait le contenu qu’il transforme en texte et qu’il publie sur le Web, pour que l’on puisse faire des cartes. Et le fait que nous ayons ces données — en passant, chaque ligne du tableau est un accident. Vous pouvez imaginer le nombre de PDF. Le fait que nous y ayons accès est formidable, mais ne les publions pas dans des PDF, car nos citoyens chercheront le moyen de les en extraire. Nos citoyens n’ont pas de temps à perdre, et comme ville nous pouvons offrir mieux.

5:19
La bonne nouvelle, c’est que l’administration Blasio a publié ces données il y a quelques mois, Mais beaucoup de données restent enfermées dans des PDF, ce qui est notamment le cas des données sur les crimes. Tout comme du budget de notre propre ville. Le budget de NY n’est actuellement disponible qu’en format PDF. Nous ne sommes pas les seuls que cela embête. Nos propres législateurs, ceux qui votent le budget, le reçoivent en PDF. Nos législateurs ne peuvent pas analyser le budget qu’ils votent. Et je crois que comme ville nous pouvons faire un peu mieux que cela.

5:54
Toutes les données ne sont pas cachées dans des PDF. Voici une carte que j’ai faite des voies de navigation les plus sales de New York. Que veux-je dire par sale? C’est quelque peu étrange, mais j’ai pris le nombre de coliformes fécaux, soit la quantité de matière fécale, dans chacune de nos voies d’eau. Plus le cercle est grand, plus l’eau est sale, et vice versa. Ce que vous voyez ce sont les voies navigables intérieures. Il s’agit de données que la ville recueille depuis cinq ans. Les voies intérieures sont généralement plus sales, C’est assez évident, non? Voici ce que j’ai découvert grâce à cette carte. Premièrement, il ne faut jamais nager dans un « creek » ou un « canal ». Deuxièmement, la voie la plus sale de New York est Coney Island Creek, d’après cette mesure. Ce n’est heureusement pas le Coney Island où vous vous baignez. C’est de l’autre côté. Mais à Coney Island Creek, 94 % des échantillons prélevés depuis cinq ans contenaient tellement de coliformes fécaux que les lois de l’État le rendent impropre à la baignade.

6:52
Et ce n’est pas le genre de faits que les rapports de la ville contiennent ou qui figure sur la page d’accueil du nyc.gov, non? Vous ne les y verrez pas, mais le fait qu’on puisse trouver ces données est génial. Ici encore, ce ne fut pas facile, car elles ne figuraient pas dans le portail des données ouvertes, où vous trouverez seulement des chiffres pour un an ou quelques mois. Elles étaient plutôt sur le site du DEP de la ville de NY. Chacun de ces liens ouvre un tableur Excel différent, avec des titres différents. Vous copiez, collez, réorganisez le tout, puis faites des cartes et c’est bien, mais encore une fois, nous pouvons faire mieux comme ville et établir des normes.

7:26
Et nous y arrivons par des sites Web comme celui de Socrata appelé l’Open Data Portal NYC, où 1100 jeux de données, qui ne souffrent pas des maux que j’ai décrits se trouvent, et leur nombre ne cesse de croître. Vous pouvez y télécharger les données que vous voulez dans une foule de formats : CSV, PDF, XLS ou autres. Vous découvrirez alors que le format des adresses n’est pas le même d’un organisme à l’autre. L’un classe ses données par rue ou par intersection, l’autre par quartier ou adresse postale. Même avec ce portail, vous perdez du temps, car vous devez uniformiser les champs des adresses. Et nos citoyens ont d’autres chats à fouetter. Nous pouvons faire mieux comme ville. Nous pourrions normaliser nos adresses, ce qui nous aiderait à créer plus de cartes.

8:08
En voici une des bornes d’incendie de NY, mais pas de n’importe quelle borne. Il s’agit des 250 bornes ayant remis le plus grand nombre de contraventions. (Rires) J’ai fait des découvertes grâce à cette carte. Primo, ne vous garez pas dans l’Upper East Side. Peu importe où vous vous garerez, vous aurez un ticket. J’ai également trouvé les deux bornes les plus lucratives pour la ville, deux bornes dans le Lower East Side, qui rapportent plus de 55 000 $ par année en contraventions. Cela m’a surpris. J’ai donc fait des recherches et j’ai découvert qu’une avancée de trottoir de sept pieds sépare la place de parking de la borne d’incendie. Un conducteur arrive et se dit : « La borne est là-bas, je suis ok. » Il regarde les lignes de parking dessinées au sol et se gare. Les policiers, qui ne voient pas les choses du même œil, lui collent une amende. Je ne suis pas le seul à avoir remarqué cela. La voiture de Google qui passait par là a photographié la scène.

9:08
J’en ai parlé dans mon blogue I Quant NY, à la suite de quoi le DOT m’a répondu, et a déclaré : « Bien que le DOT n’ait reçu aucune plainte au sujet de cet emplacement, nous allons revoir le marquage au sol. » Je me suis dit, voilà une réponse typique, merci, passons à autre chose.

9:26
Mais, quelques semaines plus tard, une chose extraordinaire s’est produite. Ils ont refait les lignes, et pendant une seconde, j’ai vu l’avenir de l’ouverture des données, car pensez à ce qui est arrivé ici. Durant cinq ans, ceux qui se garaient-là recevaient un ticket sans comprendre, puis un citoyen a fait une observation, en a fait part à la ville et en quelques semaines tout était réglé. C’est formidable. Plusieurs personnes voient là un rôle de cerbère. Les données sont plutôt un outil, qui nous permettent d’être de vrais partenaires du gouvernement, et ce n’est pas si complexe. Peu de changements sont requis. Si vous vous faites régulièrement demander vos données, rendez-les publiques, c’est un signe qu’elles devraient l’être. Votons aussi une loi qui oblige les organismes gouvernementaux qui mettent en ligne des PDF à joindre à ceux-ci les données brutes, car celles-ci proviennent nécessairement de quelque part, et devraient être accessibles. Fixons des normes sur les données ouvertes et uniformisons le format des adresses de New York. Malgré tout ce que j’ai dit, NY reste un leader dans le domaine des données ouvertes et si nous choisissons d’établir des normes en la matière d’autres feront de même. L’État, le gouvernement fédéral, voire d’autres

10:38
pays pourraient nous suivre. Nous approchons d’une ère où nous aurons un programme qui pourra créeons des cartes avec les données de 100 pays. Ce n’est pas de la science fiction, nous y sommes presque.

10:47
Mais au fait, à qui donnons-nous le pouvoir? Car il ne s’agit pas seulement de John Krauss et de Chris Whong, Il y a actuellement des centaines de Meetup actifs à New York. Ils sont des milliers à participer à ces réunions. Ils y assistent après le travail et les weekends, pour passer en revue des données et améliorer la qualité de vie dans notre ville. Des groupes comme BetaNYC, qui la semaine dernière a lancé citygram.nyc, où vous pouvez vous abonner à un bulletin des plaintes que la ville reçoit au 311 dans un rayon autour de chez vous ou de votre travail. Et ce n’est pas que la communauté techno que cela intéresse. Les urbanistes, mes étudiants, les défenseurs du domaine public, des citoyens de tous les milieux. Tout le monde s’y intéresse. Et tous ces petits changements progressifs attisent la passion de nos citoyens et leur permettent d’utiliser des données pour améliorer notre ville, que ce soit une donnée ou une place de stationnement à la fois.

11:40
Merci.

11:42
(Applaudissements)

SOURCE

Morgan REMOLEUR

Passionné par le digital, Morgan est un Pharmacien entrepreneur innovant au plus près des patients. Industriel de formation, Internet par passion, Business developer pour partager l'innovation. "Je suis intimement convaincu que le digital et le big data vont révolutionner tous les métiers à la fois sur un plan technique dans la collecte des données, pratique pour la relation client et éthique avec le besoin de régulation."

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *