Œuvre de vulgarisation scientifique, le livre de Viktor Mayer-Schönberger et Kenneth Cukier est destiné à un public large et permet d'appréhender les enjeux du Big Data sur notre façon d'aborder notre façon de travailler, et cette quête sans fin de vouloir répondre aux besoins du client avant même que celui-ci ne l'exprimer; quête qui semble possible avec ce nouveau phénomène.
Ce livre est donc un état des lieux de ce nouvelle révolution de l'information, plus que sur la manière de traiter ces données: les informaticiens et autres architectes de l’information resteront donc sur leurs fins avec ce livre, s'ils attendent quelques pistes sur la façon d’amasser et de faire parler ces Big Data. Mais ce qui veulent comprendre l'intérêt, les débouchés possibles et les limites seront ravis par ce livre.
Le livre fait donc l'état des lieux, tant d'un point de vue technique, historique, qu'économique ou éthique.
Les bouleversements engendrés par l'émergence du big Data interviennent dances ces différents domaine:
  • La perte de dominance du code source "lisible": les programmes standards, programmés pour agir de façon logique, ne répondent pluss aux enjeux du Big Data, tant la donnée, ses sources et corrélations sont de plus en plus versatiles. Les algorithmes jouent sur le volume et sur la multitude, et non sur la logique pure et l'exactitude. Le code source ne fera plus loi, car il sera de plus en plus difficile de comprendre pourquoi un algorithme de Big Data ressort une véritable tendance sans que l'on comprenne vraiment sa causalité.
  • La corrélation en lieu et place de la causalité: Au lieu d'essayer de comprendre, le Big Data constate et en conclue des corrélations entre différents facteurs par forcément commun. L'objectif n'est pas de comprendre le pourquoi, mais uniquement le comment. Et la quantité de données et de sources nous mènent droit dans la corrélation. La causalité est mort, vive la corrélation!
  • L'algorithmiste, le nouveau métier de demain: A la fois statisticien, informaticien et marketeur, ce nouveau métier est au centre de ces nouveaux enjeux.
  • La fin de sa liberté "privée": Bien que les algorithmes des Big Data mettent de côté la notion même de l'individu, il en ressort 2 éléments importants
    - l'éceuil de la perte de l'anonymat; les tendances et comportements que mettent en lumière ces algorithmes se référrent forcément à des personnes, et avec les moteurs de recherches, il est facile de trouver de réelles personnes correspondant parfaitement à ces tendances, dont les données ont été captées et utilisées. En sachant que théoriquement, en 6 connaissances indirectes tout humain peut se rapprocher (voir théorie des 6° de séparations), et bien il suffit de quelques recoupements dans une analyse Big Data pour pointer du doigt sur la bonne personne, et ce sans besoin d'identifiant (nom, date de naissance, N° de sécu ou autre).
    - l'absence de contrôle des individus sur leurs données (non identitaires). Jusqu'ici, les CGV et autres lois sur la protection des données portent essentiellement sur les données purements identitaires et/ou leur retransmissions complètes. Rien ne portent sur l'éventuel redistribution d'une donnée anonymisé ou bien sur des usages et clics sur le site que vous effectuez, ou bien là où vous circulez. Rien ne protège le citoyen d'être hors champ du Big Data de toutes ces utilisations secondaires des données; d'autant plus que l'algorithme réutilisant ces données n'est pas encore imaginé.
  • Fracture entre les sociétés commerciales: Même si bon nombre de start-ups ont vu le jour dans ce domaine et rivalisant avec des gros acteurs en place, la possibilité de faire du BigData nécessite beaucoup d'argent, une économie d’échelle importante. Les grandes entreprises peuvent se permettent d'investir en machine de stockage, aspirateur de données et algorithmistes.
  • De la prévention à la discrimination: l'analyse de données Big Data aussi variées puissent-elles donnent des indicateurs, des tendances, qui fonctionnent dans 80% des cas. le logiciel de la police US PredPol, prédit quand et où auront lieu les prochains crimes: cela ne donne par encore l'identité des personnes; comme dans Minority Report, mais d'autres analyses montrent bien que le fait de s'appeler Jimmy ou Kevin est déjà un handicap dans la vie; etc. Bref, ces tendances étiquettent et catégorisent des gens, qui se verront peu à peu fermer les portes des meilleurs écoles, ou d'accès au meilleurs soins et autres besoins de consommations (prêts; voyages; etc.). La discrimination et la catégorisation des individus vont s'accentuer.
  • Absence de réflexion politique (éthique): Et pour cause, nos gouvernements sont les premiers à tirer profit de toutes ces données et à vrai dire, les lobbys industriels et du grand commerce préfèrent que ce genre de réflexion reste dans l’œuf.
  • Vers la fin du libre arbitre?: Les auteurs font une peinture bien noire sur notre libre arbitre, qui en prend un sacré coup. Puisque presque tout peut se corréler pour donner une tendance, alors les choix et décisions de M. Toutlemonde peuvent se deviner à l'avance. Et plus les big-data permettront d'identifier et de proposer nos envies avant mêmes qu'elles ne deviennent; et pourront nous écarter de nos déviances.
Pour conclure, Viktor Mayer-Schönberger et Kenneth Cukier terminent par une note humaniste et optimiste, que les Big-data se réguleront d'eux-mêmes. mais je n'en suis pas si sûr: les états sont et resterons au-dessus des lois, et les entreprises sont des êtres impersonnels, sans mémoires ni reconnaissance envers ses individus. George Orwell ne s'était pas trompé, même si ce n'est plus Big Brother, mais bel et bien "BigData that is watching you".

Quelques liens: