OWNI http://owni.fr News, Augmented Tue, 17 Sep 2013 12:04:49 +0000 http://wordpress.org/?v=2.9.2 fr hourly 1 Cinemetrics: les films se font démonter http://owni.fr/2011/08/02/cinemetrics-films-cinema-data-datavisualiton-demonter/ http://owni.fr/2011/08/02/cinemetrics-films-cinema-data-datavisualiton-demonter/#comments Tue, 02 Aug 2011 16:15:09 +0000 Andy Kirk http://owni.fr/?p=75258 Tous les liens de l’article sont en anglais.

Cinemetrics est une création visuelle unique d’un designer et programmeur créatif, Frederic Brodbeck. Ce travail constitue son projet de fin d’études à l’Académie royale des arts de La Haye, dont il est diplômé depuis peu.

Comme Frederic l’explique, l’idée derrière Cinemetrics est de mesurer et de visualiser des données concernant un film pour révéler une « empreinte » visuelle de ses caractéristiques, permettant ainsi de l’explorer et de le comparer avec d’autres productions du même genre, des remakes ou des films du même réalisateur.

Cliquer ici pour voir la vidéo.

Des informations telles que la structure du film, l’équilibre et la proéminence des couleurs, les mouvements et les éléments de discours sont extraites, analysées et transformées en représentations graphiques rythmées et utilisant une présentation radiale. Les graphiques sont divisés en segments, chacun représentant 10 plans du film. Les utilisateurs peuvent interagir avec l’œuvre et révéler les photos des scènes associées à la visualisation à tout moment du film. La vidéo explique le projet plus en détails.

Il est intéressant de voir des bribes d’exemples où Frederic a étendu les caractéristiques de Cinemetrics pour les appliquer à d’autres archétypes, en utilisant des données de programmes télé ou sportifs, comme les Simpsons.

La complexité du projet ne réside pas seulement dans l’objet visuel fini, mais il a aussi requis le développement d’un logiciel complexe pour faciliter l’exploitation et l’extraction des données de la vidéo depuis les films.

Une deuxième vidéo détaille les procédés de design, expliquant d’où viennent les données, quelles techniques ont été utilisées pour les analyser et les traiter, et montrant à quoi un film ressemble lorsqu’il est généré par cinemetrics.

Cliquer ici pour voir la vidéo.


Outre sa nature de projet de fin d’études, le produit de ce travail prend aussi la forme d’un livre qui détaille le projet dans sa globalité et d’une série de posters qui peuvent être achetés, commandés et personnalisés. Vous pouvez voir le portfolio de Frederic Brodbeck sur son site personnel.

Billet initialement publié en anglais sur le site Information Aesthetics sous le titre “Cinemetrics: Visualizing Movies”`

Traduction par Marie Telling


]]>
http://owni.fr/2011/08/02/cinemetrics-films-cinema-data-datavisualiton-demonter/feed/ 4
Livre : comment inventer un datamining plus humain ? http://owni.fr/2010/12/12/livre-comment-inventer-un-datamining-plus-humain/ http://owni.fr/2010/12/12/livre-comment-inventer-un-datamining-plus-humain/#comments Sun, 12 Dec 2010 09:30:41 +0000 Thierry Crouzet http://owni.fr/?p=35156 Com­ment les auteurs réussiront-ils à trans­mettre leurs textes longs à des lec­teurs rares et épar­pillés ? Soit ces textes longs n’ont plus de per­ti­nence, et il n’y a aucun pro­blème, le blog deve­nant la seule forme lit­té­raire contem­po­raine. Soit les textes longs conti­nuent de jouer un rôle cultu­rel clé, ce que je pense, et nous devons les connec­ter avec les lec­teurs qui pour­raient les goû­ter… et qui, par ailleurs, ne goûtent pas néces­sai­re­ment les textes courts propres aux blogs.

Aujourd’hui, les éditeurs nous bom­bardent de best­sel­lers. De leur côté, les libraires éclai­rés et les blo­gueurs liseurs nous conseillent quelques lec­tures hors des sen­tiers bat­tus. Dans un monde de plus en plus numé­rique, à côté de cette pres­crip­tion humaine, les outils de data­mi­ning (ana­lyse de ce que vous lisez, des articles que vous consul­tez, com­pa­rai­son avec ceux qui effec­tuent les mêmes actions que vous… ) pro­posent déjà des filtres de pres­crip­tion (lisez ce que vos amis lisent). Par affi­ni­tés élec­tives, des ouvrages en rela­tion avec ceux que nous lisons nous sont pro­po­sés, pour nous faire des­cendre vers les bas-fonds de la longue traîne. Excepté quelques auteurs stars, tous les autres dépendent de plus en plus d’algorithmes que seuls des géants peuvent mettre en œuvre (car eux seuls dis­posent de suf­fi­sam­ment de don­nées). Il y a de la place pour Apple, Ama­zon, Google… Je ne vois même pas la Fnac s’en tirer.

Sur Internet, la même dépendance aux grosses machines ?

Se pose la ques­tion pour les petits éditeurs et les auteurs indé­pen­dants de faire connaître leur pro­duc­tion. On parle tou­jours de la néces­sité d’avoir un blog et une plate-forme pro­prié­taire mais elle ne per­met­tra pas de faire du data­mi­ning, faute d’un nombre de tran­sac­tions suf­fi­sam­ment élevé. Il sera impos­sible dans un petit écosys­tème d’amener les textes vers les rares lec­teurs qui, quelque part, existent et qui pour­raient les appré­cier. Cette tâche semble dès lors dévo­lue aux seules grosses machines.

Un site est un bon endroit de fidé­li­sa­tion mais pas un lieu à par­tir duquel gagner de nou­veaux lec­teurs, sinon par un lent grap­pillage (qui n’est pas néces­sai­re­ment com­pa­tible avec la forme blog). Je ne fais que mettre en évidence un piège qui est en train de se refer­mer : nous avons cru à l’indépendance en ligne, nous ris­quons d’y être plus que jamais dépen­dants de la distribution.

Il n’existe guère qu’une solu­tion pour conser­ver notre liberté : l’interconnexion des auteurs et des éditeurs selon une logique win-win. Mettre en œuvre un data­mi­ning humain. C’est ce que je théo­rise dans L’alternative nomade. Mais je me demande si les auteurs réus­si­ront à pra­ti­quer cette stra­té­gie du lien, tant pour la plu­part nous ne pen­sons qu’à pous­ser nos propres textes au détri­ment de ceux des autres. Si cette men­ta­lité se main­te­nait, ce serait notre perte, nous serions défi­ni­ti­ve­ment dépen­dants de la distribution.

Le prix unique du livre électronique, une catastrophe

Pour avoir une chance de ne pas nous empri­son­ner, il fau­drait au mini­mum que nous puis­sions vendre en direct nos œuvres au prix que nous sou­hai­tons, donc moins cher que la grande dis­tri­bu­tion. C’est ce que je tente avec La tune dans le cani­veau.

C’est pour­quoi le prix unique du livre élec­tro­nique serait pour les auteurs et les éditeurs une catas­trophe. En nous inter­di­sant de vendre en direct à un prix avan­ta­geux, il don­ne­rait une rai­son de moins pour les lec­teurs de venir sur nos sites per­son­nels ou ceux de nos éditeurs. Ces lec­teurs auraient une chance de moins d’être en contact d’un data­mi­ning humain, un data­mi­ning de la pas­sion et non uni­que­ment celui d’élections algo­rith­miques ou promotionnelles.

Si nous réus­sis­sons à pro­po­ser chez nous nos œuvres à un prix avan­ta­geux, chaque fois qu’un lec­teur trou­vera un livre sur une grosse pla­te­forme, il saura qu’avec un petit effort il trou­vera le texte moins cher à la source. Le plus sou­vent, il ne s’y ren­dra pas, par com­mo­dité, mais il saura que cette porte est tou­jours ouverte et qu’elle offre d’autres iti­né­raires de lecture.

Résumé

-Un blog d’auteur avec des articles rela­ti­ve­ment courts n’est pas néces­sai­re­ment un vec­teur adapté pour pro­pul­ser des textes longs.
-Un auteur sur son blog peut se pro­pul­ser mais pas se prescrire.
-Tous les auteurs et tous les éditeurs peuvent s’interconnecter pour créer un data­mi­ning humain.
-On peut ima­gi­ner un pro­to­cole open data pour inter­con­nec­ter tous les ven­deurs directs de livres et pro­po­ser des algo­rithmes de pres­crip­tion décen­tra­li­sés qui vien­draient riva­li­ser avec ceux des pla­te­formes géantes.
-Nous devons nous oppo­ser au prix unique du livre pour pous­ser nos lec­teurs à venir ache­ter chez nous. Le prix unique ferait le jeu des grandes plateformes.
-Le prix unique du livre papier devait pro­té­ger les petites librai­ries. Le prix non unique du livre élec­tro­nique s’impose pour pro­té­ger les auteurs et les éditeurs. Un choix inverse s’impose parce que nous avons les moyens de vendre moins cher chez nous, en direct, puisque nous sommes les producteurs.
- N’oublions pas que sur un réseau the win­ner takes all. Nous devons empê­cher cette perte de diver­sité et sur­tout pas la favo­ri­ser par une loi sur le prix unique. Notre seule chance sera de pro­po­ser nos textes moins chers chez nous.
-Au temps du papier, les éditeurs ne pou­vaient pas vendre en direct puisque tout le monde ache­tait en librai­rie. La loi sur le prix unique ten­tait de mettre tous les dis­tri­bu­teurs, petits ou grands, à égalité.
-Il s’agit aujourd’hui de ne pas obli­ger les éditeurs-vendeurs en direct via leur site à se sou­mettre aux gros distributeurs.

Billet initialement publié sur le blog de Thierry Crouzet

Image CC Flickr piermario et thefost

]]>
http://owni.fr/2010/12/12/livre-comment-inventer-un-datamining-plus-humain/feed/ 3
Facebook Messages, le piège qui va asseoir la suprématie de Facebook http://owni.fr/2010/11/16/facebook-messages-le-piege-qui-va-asseoir-la-suprematie-de-facebook/ http://owni.fr/2010/11/16/facebook-messages-le-piege-qui-va-asseoir-la-suprematie-de-facebook/#comments Tue, 16 Nov 2010 14:55:09 +0000 Damien Douani http://owni.fr/?p=35916

Fac­ebook a annoncé hier soir sa nou­velle mes­sagerie « sociale » qui a pour but d’agréger l’intégralité des échanges entre deux per­son­nes, qu’ils soient issus d’un chat, de SMS ou de courriels.

À ce titre, même si Face­book se défend de vouloir tuer l’e-mail (dont les poids lourds sont Hot­mail et Yahoo aux États-Unis avec à eux deux presque autant de comptes que Face­book !), il est clair que la société du petit Mark essaye de réin­ven­ter un outil vieil­lis­sant mais tou­jours très utilisé.

Ren­dre ser­vice plutôt que de ré-inventer le cour­rier électronique

Il essaye surtout d’éviter l’écueil ren­con­tré par Google et Wave : en clair, on vous rend d’abord ser­vice en agrégeant les con­ver­sa­tions, et en vous don­nant un outil intel­li­gent vous per­me­t­tant de trier entre mes­sages impor­tants (ses amis proches) et moins impor­tants (les mes­sages d’invitation à des groupes, des soirées, des con­tacts moins récurrents).

Et seule­ment si vous le voulez, s’ouvrir sur sa mes­sagerie actuelle en échangeant avec les per­son­nes qui n’ont pas Facebook.

Cliquer ici pour voir la vidéo.

Face­book en veut tou­jours plus

C’est là que la mécanique virale de type « stratégie du dealer » entre en jeu : en se con­nec­tant à des per­son­nes qui n’ont pas Face­book mais qui ont un cour­riel, Face­book les intè­gre dans sa base.

Outre grossir arti­fi­cielle­ment le nom­bre d’utilisateurs poten­tiels, le réseau de Mark Zucker­berg va peu à peu devenir l’outil indis­pens­able pour les deux par­ties (l’utilisateur de Face­book et celui de cour­riel), pous­sant l’utilisateur de cour­riel à aller vers Face­book car finale­ment « s’il était mem­bre de cette com­mu­nauté il pour­rait avoir accès à bien plus sur ses amis » : pho­tos, invi­ta­tions, statuts, etc. Ce que ne man­quera pas de lui faire remar­quer son amis face­book­ien (je suis en train de faire cela avec ma petite sœur, c’est vous dire si je vois très bien la mécanique se met­tre en place).

Face­book ne veut pas tuer le mail

Con­clu­sion : Face­book Mail ne veut pas tuer le mail, et c’est vrai. C’est au con­traire un for­mi­da­ble outil de recrute­ment et d’évangélisation basé sur des usages de chaque côté de la bar­rière : « le mail c’est lim­ité regarde tout ce que tu peux faire avec Face­book. » / « Finale­ment ma boite mail elle est lim­itée et j’y reçois des tonnes de spam, sur Face­book il n’y a que mes amis qui me par­lent et tout est agrégé simplement. »

Sans oublier que c’est un nou­veau levier pour aug­menter la cap­ta­tion de temps passé sur le réseau et afficher plus de pub. D’ailleurs, rien ne dit que Face­book ne va pas screener les mes­sages à la mode Gmail pour associer des annonces de mar­ques ou bien pro­poser des rap­ports d’usages à des mar­ques présentes sur la plateforme.

La timide riposte Gmail

Côté Gmail, Google a d’abord pro­posé Buzz, pour agréger les flux soci­aux de type « statut » (Twit­ter, Friend­feed…), puis a sorti assez dis­crète­ment en sep­tem­bre 2010 une boite aux let­tres « intel­li­gente », basée sur la fréquence d’utilisation et de réponse à cer­tains mes­sages, et tri­ant automa­tique­ment les mes­sages impor­tants ou pas pour l’utilisateur.

Cliquer ici pour voir la vidéo.

Mais le tri reste basé sur le con­tenu, pas sur les inter­ac­tions sociales. C’est là qu’intervient Face­book et la force de son “social graph”, qui devient l’outil d’analyse pour classer l’information non pas en fonc­tion de sa teneur mais de son émet­teur et de sa prox­im­ité sociale.

Asseoir sa supré­matie commerciale

Face­book ne veut donc pas tuer le mail mais le ré-inventer en douceur, tou­jours en s’appuyant sur sa force pre­mière : les usages soci­aux de sa com­mu­nauté de plusieurs cen­taines de mil­lions de membres.

Tout en posant les incon­tourn­ables ques­tions de con­fi­den­tial­ité des échanges, et de marchan­di­s­a­tion de ceux-ci, Face­book ainsi en sa pos­ses­sion une for­mi­da­ble base de don­nées qui com­porte à la fois les pro­fils des mem­bres, les actions de ceux-ci en temps réel (statuts) ou dif­féré (pho­tos…), leurs goûts (I Like), leurs envies (invi­ta­tions, pages de fans), et main­tenant une vision pré­cise de qui échange forte­ment avec qui y com­pris en dehors de la plate-forme (avec, à la clé, l’affinage du graphe social, la base de l’algorithme du site).

Une mine d’or pour les mar­ques, une dat­a­min­ing hal­lu­ci­nant, et, il faut le recon­naitre, une addic­tion tou­jours plus forte des util­isa­teurs qui voient leurs usages placés au cen­tre du mécan­isme. Superbe piège.

Billet initialement publié sur Stan et Dam

Image CC Flickr smlions12

]]>
http://owni.fr/2010/11/16/facebook-messages-le-piege-qui-va-asseoir-la-suprematie-de-facebook/feed/ 9
Jonathan Harris, poète des data http://owni.fr/2010/11/08/jonathan-harris-poete-des-data/ http://owni.fr/2010/11/08/jonathan-harris-poete-des-data/#comments Mon, 08 Nov 2010 14:15:53 +0000 Nicolas Kayser-Bril http://owni.fr/?p=34875 Si vous pensiez que des mots aussi barbares que datamining, base de données ou ontologies ne pouvaient pas créer de la beauté et de la poésie, c’est que vous ne connaissez pas encore Jonathan Harris.

Harris est un artiste des données. Du haut de ses 31 ans, il a déjà à son actif une vingtaine de projets visibles sur son site, number27. Alors qu’il travaillait sur un projet de visualisation de l’actualité, 10×10, il croisé Upendra Shardanand, CEO de Daylife, une plateforme de publication pour sites d’actu. Shardanand dit de lui très justement:

Harris comprend le web intuitivement. Il l’utilise comme un sculpteur utilise l’argile.

Sa technique tient dans le code (il maîtrise PHP, ActionScript, Java et C++), son inspiration reste la même : comment raconter des histoires sur le web, et comment raconter les histoires du web. Il est fasciné par l’art de raconter des histoires et de transmettre un message à travers elles.

Il a donné une présentation à la conférence de l’ONA, le 30 octobre dernier, largement saluée comme la meilleure du week-end. La vidéo est un enregistrement du livestream. Harris a participé à une conférence TED il y a deux ans, produisant une vidéo de meilleure facture placée au pied de la page.

We Feel Fine

We Feel Fine est un ‘aspirateur’ cherchant, sur les blogs, toutes les phrases contenant les mots I feel ou I am feeling. Il mouline les phrases avec de puissants algorithmes qui mettent en forme des millions de sentiments publiés sur le web. Cette somme de pensées est agrégée dans un applet Java, où Harris a tenté de reproduire les mouvements humains. Si vous laissez l’applet ouvert, les sentiments s’agglomèrent. A l’inverse, si vous cliquez au hasard, ils s’enfuient loin du danger que représente le curseur. Les statistiques produites par l’outil sont également impressionnantes. Harris arrive par exemple à montrer que le sentiment de joie augmente régulièrement jusqu’à 60 ans, période où le sentiment de solitude reprend le dessus.
Harris a donné une présentation TED sur le sujet il y a 3 ans.

La chasse à la baleine

Interface de visualisation du diaporama de "The Whale Hunt"

En mai 2007, Harris part observer les pêcheurs de baleine en Alaska. Plutôt que d’en ramener un reportage ou même un webdoc, il réinvente complètement le mode de récit sur le web.

Pour produire Whale Hunt, Harris a pris une photo toutes les 5 minutes pendant une semaine. La fréquence des photos était fonction de son rythme cardiaque: plus il augmente, plus il prend de photos. Le résultat est une mosaïque de photos où l’on peut suivre, minute par minute, le voyage de Harris. Il nous plonge au plus près de son expérience, sans aucun recul.

I want you to want me

Avec I want you to want me, Harris répondait à une demande du musée d’art moderne de New-York. Il a agrégé les profils trouvés sur les sites de rencontre pour montrer comment les internautes se présentent, cherchent à plaire et trouver compagne ou compagnon.

Présentation TED, 2008

Illustration CC FlickR  Andy Polaine

]]>
http://owni.fr/2010/11/08/jonathan-harris-poete-des-data/feed/ 2
Libérons les bureaux de votes ! http://owni.fr/2010/03/04/liberons-les-bureaux-de-votes/ http://owni.fr/2010/03/04/liberons-les-bureaux-de-votes/#comments Thu, 04 Mar 2010 11:31:48 +0000 Regards Citoyens http://owni.fr/?p=9397 468379788_d62d4b31f9_o

Le sésame pour aller voter

Il est très difficile de connaître l’emplacement de tous les bureaux de vote. Nous nous en sommes aperçus lors de notre travail sur l’étude du redécoupage électoral. Le ministère de l’intérieur ne centralise pas ces données. Il s’agit pourtant d’informations nécessaires à notre travail citoyen. Le seul moyen de les obtenir : contacter les 36 000 mairies ou les 100 préfectures départementales. Nous avions donc décroché nos téléphones, et contacté une quarantaine de villes et préfectures pour obtenir les adresses des 1 400 bureaux de vote impliqués dans le redécoupage.

Une fois le bon interlocuteur identifié, le défi consiste à obtenir le document recensant les adresses des différents bureaux de vote. De la liste manuscrite dictée par téléphone au document scanné de travers, les cas de figure sont nombreux ! Et il faut ensuite tirer des documents ainsi obtenus les données utiles dans un format structuré : extraire les adresses et les identifiants, positionner les adresses sur une carte, et associer les bureaux de vote aux résultats électoraux.

En parlant de ce travail, nous avons découvert que des acteurs comme 22mars, La Netscouade ou BureauDeVote.fr rencontraient les mêmes problèmes. Parmi eux, Nicolas Kayser-Bril de 22mars avait déjà contacté toutes les préfectures. Plutôt que de travailler chacun seul dans son coin, nous avons décidé d’unir nos forces pour reconstituer ces informations qui devraient être accessible à tous.

Grâce au travail de NKB de 22mars, 88% des documents ont été réunis. Seules quelques préfectures ne nous ont toujours pas fait parvenir les documents définissant leurs bureaux de vote, et la poursuite des efforts de chacun finira certainement par payer.

Mais le travail n’est pas fini ! Il reste désormais à convertir l’ensemble de ces documents en données exploitables. Là encore nous tentons d’innover : reconnaissance de texte OCR, conversion automatique de PDF, conversion de tableurs, … Parfois avec succès, souvent beaucoup plus difficilement. La dernière expérience en date est une application de crowdsourcing permettant de faciliter et décentraliser la partie manuelle du travail. Grâce à cette plateforme participative, quiconque ayant ne serait-ce que 5 minutes pour nous aider peut participer à libérer ces informations.

Parce que nous estimons que l’accès à ces données est essentiel au bon fonctionnement de la démocratie et qu’elles devraient appartenir à tous les citoyens, nous avons décidé d’ouvrir également une plateforme de partage afin que chacun puisse s’approprier au fur et à mesure de notre avancement les documents et les données produits jusqu’à présent. N’hésitez donc pas à participer vous aussi à cette aventure ! Appelez les préfectures récalcitrantes ; téléchargez nos données et les documents préfectoraux, corrigez et complétez les ; participez à la transcription communautaire grace à l’interface de crowdsourcing ! Toutes les contributions sont les bienvenues pour illustrer les usages innovants qui peuvent émerger de données aussi centrales à notre démocratie.

Rendez-vous donc très vite sur http://elections.regardscitoyens.org/ !

» Article initialement publié sur Regards Citoyens

]]>
http://owni.fr/2010/03/04/liberons-les-bureaux-de-votes/feed/ 0
« On l’a pas en format ordinateur » http://owni.fr/2009/12/17/%c2%ab-on-l%e2%80%99a-pas-en-format-ordinateur-%c2%bb/ http://owni.fr/2009/12/17/%c2%ab-on-l%e2%80%99a-pas-en-format-ordinateur-%c2%bb/#comments Thu, 17 Dec 2009 17:58:20 +0000 Nicolas Kayser-Bril http://owni.fr/?p=6301 Nicolas Kayser-Bril, data journaliste et blogueur invité, propose un retour d’expérience sur un projet qu’il publiera au printemps prochain

Un projet de database journalisme commence toujours par la récolte des données. Très opportunément, plein d’organismes étatiques adorent collecter des données, que ce soit le nombre de plantations de kiwi dans le Tarn-et-Garonne (187 d’après Agreste) ou le nombre de menaces ou chantage dans le Nord (384 en octobre d’après Cartocrime).

L’administration adore les bases de données. Et souvent, elle ne rechigne pas à les mettre en ligne.

Là où le bas blesse, c’est qu’elle fait tout pour que ces données restent cloisonnées, en dehors du web. La preuve ? Impossible de faire un lien vers les ressources que j’ai citées plus haut.

Je travaille en ce moment sur un projet agrégeant des données départementales. Ce qui implique d’appeler chaque préfecture. A quelques exceptions près, les fonctionnaires transmettent les fichiers demandés (faut dire que ce sont des données déjà publiées hors-ligne).

La qualité des documents, en revanche, laisse à désirer. 20% des fichiers sont au format Excel. 10% au format Word. Le reste, du PDF. En enlevant les tableurs faits avec les pieds et en rajoutant les pdfs convertis depuis Excel, environ 25% des données sont structurées, c’est-à-dire lisibles par un ordinateur.

Exemple imaginaire :

Donnée non-structurée : « Les classes de CM2 de l’école du quartier Saint-Jean sont fermées pour cause de grippe A. Les élèves concernées sont priés de rester chez eux, sauf ceux inscrits à la chorale, qui pourront répéter à l’école Jean Moulin. »

Donnée structurée :

Au-delà du problème de la structuration des données, force est de constater que les administrations ont du mal à passer à l’informatique. Un nombre non-négligeable de préfectures, environ 10%, n’y comprennent tellement rien que j’ai eu du mal à ne pas mourir de rire au téléphone.

La palme de l’inefficacité revient à celles qui ont pris le temps de scanner des documents Word imprimés. Mais le meilleur reste cette réplique d’un charmant fonctionnaire d’Evreux : « Désolé, on l’a pas en format ordinateur ».

Ouvrir les données, c’est bien. Les rendre exploitables, c’est mieux. Dans la plupart des pays moins corrompus que la France, l’accès aux données est une question réglée depuis plusieurs années. Le nouveau débat concerne leur format et leur facilité d’accès.

Le Sénat américain propose le résultat des votes au format XML depuis mai dernier. Beaucoup plus simplement, le gouvernement suédois tente de rassembler en un même portail l’ensemble des bases de données de ses ministères en indiquant leur degré de structuration (opengov.se).

Le problème a apparemment été discuté à l’Opendata Barcamp à Paris vendredi dernier (mais pas moyen de savoir quelles en ont été les conclusions).

» Article initialement publié sur Databasejournalism

Des réponses intéressantes aux questions soulevées par l’auteur ont été ajoutées en commentaires /-)

]]>
http://owni.fr/2009/12/17/%c2%ab-on-l%e2%80%99a-pas-en-format-ordinateur-%c2%bb/feed/ 5
Nicolas Kayser-Bril, data-journaliste http://owni.fr/2009/11/10/nicolas-kayser-bril-data-journaliste/ http://owni.fr/2009/11/10/nicolas-kayser-bril-data-journaliste/#comments Tue, 10 Nov 2009 12:42:44 +0000 Tatiana Kalouguine http://owni.fr/?p=5337 Nicolas Kayser-Bril est jeune et il cherche à vivre du journalisme. Comme des centaines d’autres. Mais celui-là a de l’or dans les doigts : des idées excellentes, un talent pour se faire ouvrir les portes et dénicher les données qui l’intéressent, des compétences en programmation et surtout l’art de mettre tout cela à profit pour créer des outils interactifs et malins. NKB nous parle de son métier : data-journaliste …

Cliquer ici pour voir la vidéo.

Le  genre journalistique a fait ses preuves aux Etats-Unis et aussi outre-Manche. Quelques exemples :

- Data & Taxes 2010, par WallStats.com (site de Jess Bachman, 28 ans). Répartition du buget fédéral américain, révélant les véritables « priorités » de l’administration US.

- EveryBlock, du journaliste Adrian Holovaty, qui vous permet de connaître les crimes et comportements antisociaux  qui ont eu lieu près de chez vous (on peut apprécier l’outil et réprouver les fins, of course)

- Crime Mapper, une moulinette de la britannique National Policing Improvement Agency (!!) , pâle copie de la précédente.

- Stock Ticker Orbital Comparizon, qui utilise la métaphore d’un système planétaire pour représenter les valeurs de l’indice S&P500.

(Bon, il y en a des centaines d’autres…)

Ce que ces outils très différents ont en commun c’est qu’ils nous permettent à vous et moi d’apprécier des bases de données plutôt mastoc grâce à une interface ludique, pratique ou simplement agréable à regarder. Avec en plus un côté interactif qui en fait tout l’intérêt par rapport à un simple graphique en deux dimensions.

En France pourtant (quelle surprise), ce type de documents interactifs a bien du mal à convaincre les sites des grands journaux et même les site d’infos « pure players » sur le web. Je n’en connais qu’un : la Carte de la crise sociale de Mediapart, en fait un simple « mashup » de GoogleMaps, renseigné par la rédaction et régulièrement mis à jour.

Et qui c’est d’après-vous qui se trouve derrière ce classement des députés cumulards sur Le Monde/Le Post  ? Un certain NicolasKB…

Si vous connaissez d’autres exemples de dataJ français, je suis preneuse!

Pour faire connaître son boulot, Nicolas a donc créé son propre blog, Windows on The Media. Il publie aussi sur le site d’Owni et a quelques projets en cours, notamment pour le Monde.fr.

Ce petit gars aurait-il 10 ans d’avance ? Manifestement les promoteurs ne se bousculent pas au portillon. Quelques contacts sont en vue, mais rien de très consistant pour le moment. Le data-journalisme ne nourrit pas encore son homme.

Pour le contacter sur Twitter : @nicolasKB


» Interview réalisée par Tatiana Kalouguine pour son blog La Voix du Dodo

]]>
http://owni.fr/2009/11/10/nicolas-kayser-bril-data-journaliste/feed/ 12