Les dessous du Big Data

, par Jean René

Derrière l’informatique virtualisée, distribuée et distante, se trouvent, des infrastructures qui ont une consommation énergétique et un impact carbone forts.

Derrière chaque requête, chaque courriel, chaque opération ou autres stockages sur le cloud effectués à partir de notre clavier se cache un dispositif bien concret fait de béton et d’acier, de « baies » reliés par des réseaux de cables,de systèmes de refroidissement et de sécurité dont nous ignorons, consciemment ou non, la matérialité.

Le Big Data est la ruée vers l’or des temps modernes. Comme sa glorieuse aînée, elle draine beaucoup d’espoirs – fondés ou non – et pose d’importants problèmes !

N’ayons pas peur des mots : le Big Data pollue !

Il nous appartient de veiller à ce que le coût environnemental de ces technologies soit contrebalancé – au moins en partie – par des progrès dans la lutte contre le réchauffement climatique et la pollution.

Source : https://lejournal.cnrs.fr/billets/le-big-data-est-il-polluant

Data et Big data : définition

Un centre de données ou data center est un site physique sur lequel se trouvent regroupés des équipements constituants du système d’information d’une entreprise (ordinateurs centraux, serveurs, baies de stockage, équipements réseaux et de télécommunications, etc.). Il peut être interne et/ou externe à l’entreprise, exploité ou non avec le soutien de prestataires

Le Big Data (ou « mégadonnées » en français) désigne tout à la fois la faculté de produire ou de collecter des données numériques, de les stocker, de les analyser et de les visualiser. Il est très souvent défini par ses caractéristiques liées aux « 3V » (volume, variabilité, vélocité) : les données arrivent en masse, notamment avec l’arrivée conjointe de l’Internet des objets, à une vitesse sans précédent et sont de nature plus variées que par le passé.

Le fonctionnement d’un centre de traitement informatique ou data-center répond a trois grandes missions :

•Stocker des données
•Traiter les données
•Sauvegarder et protéger les données.

C’est un service qui requiert une puissante climatisation, un système de prévention contre l’incendie, une alimentation d’urgence et redondante, ainsi qu’une sécurité physique élevée.

Des enjeux environnementaux sont donc liés à la consommation d’électricité des centres de données, et à leur coproduit qu’est la chaleur, dissipée par les serveurs et les systèmes de stockage en particulier.

En 2015, le patrimoine mondial de données a probablement atteint 7,7 zétaoctets (*) Des infrastructures pharaoniques sont donc déjà nécessaires pour stocker cette avalanche de données, mais il faut y ajouter celles pour les traiter !

(*) 7,7 Zétaoctets soit 7 700 000 000 000 Go – l’équivalent de 19 000 milliards d’heures de conférences professionnelles en ligne. Le cloud représente 76 % des flux des datacenters.
http://www.usine-digitale.fr/article/le-trafic-cloud-atteindra-7-7-zeta-octets-en-2017.N209448

Google, les USA et le reste du monde : 3209 data-center sur la planète !

Google disposerait aujourd’hui de 13 sites de data centers . Chaque site peut comprendre plusieurs centres de données. Six sites aux États-Unis, un au Chili, un à Taïwan et quatre en Europe (Finlande, Belgique, Irlande et Pays-Bas). Un chiffre comparable aux douze sites actuels d’Amazon Web Services.

Google posséderait aujourd’hui près d’une quarantaine de data center dans le monde entier. Environ une vingtaine est située aux USA, le reste étant principalement basé en Asie et en Europe.

La totalité des data-centers Google représente plus de 900 000 serveurs.

Ils assurent en permanence, 7J/7 et 24h/24, le fonctionnement de Google pour répondre aux plus de 3 milliards de requêtes quotidiennes effectuées par les internautes à travers le monde .

Google à lui seul consomme autant d’électricité que la ville de Bordeaux pour faire fonctionner ses data center. Fonctionnant vingt-quatre heures sur vingt-quatre, ces data center doivent en permanence être refroidis. Ainsi, la climatisation représente près de 40 % de leur facture électrique globale

Mais, selon Synergy Research, Google reste moins fournis qu’’Amazon Web Services, Microsoft et IBM, qui détiennent chacun au moins quarante data- center dans le monde.

Sur les 3 209 centres de données répertoriés dans le monde, près de 40% sont installés aux États-Unis. "Les US sont le siège des principaux leaders de l’hébergement et du cloud à l’instar de Rackspace, Verizon, IBM ou Equinix", commente Xerfi.

Les États-Unis en tête des pays les mieux équipés sont suivis par le Royaume-Uni et l’Allemagne qui arrivent loin derrière avec respectivement 207 et 168 centres de données. A la quatrième marche, la France e n compte 137.

La France : quatrième pays le mieux équipé au monde

Avec 137 data-centers la France, se hisse en quatrième position. Réalisé sur la base des chiffres de Data center map, le palmarès est publié par Xerfi dans son étude 2014 sur le secteur titrée "Les hébergeurs de contenus internet et les gestionnaires de data centers".

Sur les 137 datas répertoriés en France presque la moitié se situent en région parisienne. Cela représente plus de 100 000 serveurs.

Sur le territoire français ce sont principalement les hébergeurs comme OVH, Amen, Ikoula, United Internet, ASP Serveur, Aruba Cloud qui se positionnent sur le marché.

Sur le site http://www.centrededonnees-datacenter.fr/ on relève ville par ville, région par région,. leur localisation, leur raison sociale.

On dénombre cinq data centers à Bordeaux ; six à Toulouse.

Pour Xerfi, l’Hexagone profite d’un emplacement central au sein du réseau Internet en Europe. "Le pays a d’ailleurs fortement développé les points de connectivité au réseau, ou points de peering, ces dernières années, ce qui a contribué à attirer de nombreux opérateurs de data centers", analyse le cabinet.
Ce cabinet souligne également les faibles coûts en matière d’énergie comparés aux tarifs dans les pays voisins. Au total, l’Union Européenne enregistre quelque 970 data centers, ce qui reste donc sensiblement moins qu’aux Etats-Unis.

Source :http://www.journaldunet.com/solutions/cloud-computing/data-center-classement-des-pays-selon-xerfi.shtml

L’impact énergétique des gestes quotidiens sur Internet

Le développement exponentiel de l’utilisation des TIC dans la vie quotidienne, font d’Internet un moyen de communication très énergivore. Virtuel seulement en apparence, il s’appuie sur une infrastructure très réelle. Et polluante !

– Un mail parcourt en moyenne 15.000 km entre son origine et sa destination !
– En France, chaque salarié, dans une entreprise de 100 personnes, reçoit en moyenne 58 courriels par jour et en envoie 33 !
– Un mail simple avec une pièce-jointe envoyé représente l’éclairage d’une ampoule basse consommation de forte puissance pendant 1 heure soit 24 Watt/heure.
– En 1 heure, dans le monde, pas moins de 10 milliards de mails sont envoyés. Ceci équivaut à 50 Giga Watt/heure ou encore la production électrique de 15 centrales nucléaires pendant 1 heure ou encore 4000 Aller/Retour Paris New York en avion.

– Google a lui seul exige autant d’électricité que la ville de Bordeaux
– En Île-de-France, il y a 35 data centers ,la France compte plus de 140 data centers
– Un data center consomme en moyenne en 1 journée autant que 30 000 habitants de foyers types européens
– La climatisation nécessaire et continue des serveurs représente 40 % de la demande en électricité d’un data center

– Si Internet était un pays, il serait le 5ème consommateur mondial d’électricité
– Les technologies de l’information et de la communication (TIC) consomment 10 % de l’électricité dans le monde !
– Les TIC contribuent à 2 % aux émissions européennes de gaz à effet de serre !

Rien de virtuel dans tout ça !

De votre boîte mail à celle de votre destinataire ou encore de votre requête Google aux sites Web, le chemin est bien réel.

En effet, votre mail emprunte les dédales de câbles de cuivre pour rejoindre dans un premier temps, les serveurs de votre quartier. De là, il sera traité une première fois dans un data center de votre région pour ensuite traverser l’Atlantique en direction du data center de votre hébergeur de messagerie (Gmail, Yahoo ou encore Hotmail).

Après analyse à plusieurs milliers de kilomètres de son origine, votre très cher mail effectuera tout le chemin inverse pour se retrouver quelques serveurs relais plus tard dans le boîte de réception de votre destinataire, peut-être simplement votre voisine de bureau…</P

On parle donc de face cachée en termes de pollution, parce que votre mail aura ainsi engendré une demande en énergie électrique réelle et importante. C’est au cœur de ces usines à traitement d’information – les data centers – que toute la demande en énergie se concentre.

A l’intérieur, des centaines de serveurs organisés en baies (armoires qui accueillent les serveurs) fonctionnent en continue. Ces serveurs utilisent l’énergie électrique pour traiter les données mais c’est aussi le besoin en refroidissement des serveurs (système de climatiseur en continu) ainsi que la multiplication de tous les serveurs nécessaires en cas de panne.

De plus, ces centres ont des exigences équivalentes à celui des hôpitaux en termes de fiabilité. Une panne ne peut y être envisagée, d’où des systèmes électriques redondants pour se prémunir de toute défaillance.

Au-delà de ces trajets impressionnants, c’est surtout le stockage des données dans les datas centers qui consomme le plus.

Le stockage à distance des données particulières et des entreprises est un facteur de croissance fort de la demande d’électricité. Appelé très joliment “cloud” (nuage en anglais), ceci apporte un espace de stockage en apparence infini, sans frontière réelle, accessible et disponible sur n’importe quel terminal possédant un navigateur Web. Idéalement, cela permet de centraliser le stockage des données, et donc de le gérer plus efficacement d’un point de vue énergétique. Mais cette nouvelle révolution n’est pas une nuage de gouttelettes d’eau !

En effet, l’infini du cloud se matérialise dans les datas centers du monde entier en consommation électrique croissante. Car la consommation de votre consultation ponctuelle – Google l’estime à un très maigre 0.0003 kWh pour une consultation sur son moteur de recherche – n’est pas représentative de l’énergie que nécessite le stockage en permanence des données sur des serveurs distants. Vous ne les consultez que ponctuellement, mais les serveurs tournent 24 heures sur 24. Sans compter l’énergie requise pour la fabrication des composants des serveurs, et la construction des data centers !

10 % de la consommation mondiale d’électricité :
– 40 tranches nucléaires !
2% de l’émission mondiale des gaz à effet de serre !

En phase d’utilisation, les éléments essentiels du Big Data peuvent se répartir en trois catégories : les équipements terminaux, les réseaux et les centres de données qui consomment chacune une puissance électrique comparable, de l’ordre de 40 gigawatts en 2013, soit une quarantaine de tranches de centrales nucléaires Un chiffre qui a forcément des répercussions sur le climat, même si cet impact carbone dépend du mix énergétique du pays d’usage (34 grammes de CO2 par kwh en France en février).

Les centaines de serveurs nécessaires au processus de traitement des données numériques d’un data center ont besoin de sources d’électricité et de refroidissement pour être opérationnels. Combinaison extrêmement énergivore ! Dans le monde aujourd’hui, les TIC consomment quelque 10 % de l’électricité, selon le Digital Power Group, et c’est loin d’être du 100 % renouvelable.

Aux États-Unis concentrent le plus grand nombre de datas centers Or, beaucoup sont alimentés par des centrales à charbon, représentant encore environ la moitié de la production électrique du pays. Et, on le sait, la combustion du charbon est responsable de plus de 50 % des émissions de gaz à effet de serre parmi les énergies fossiles.

Les technologies sans fil, qui accompagnent le développement du “cloud”, sont elles aussi génératrices de consommation massive d’électricité. Que l’on en juge : selon l’Université de Melbourne, ce n’est pas la création du “nuage” qui génère le plus de consommation d’électricité. C’est l’accès à tous les points individuels. Pensez-y : cette borne wifi qui reste souvent – toujours- ? allumée chez vous, ces antennes relais, ces terminaux – smartphones, tablettes, ordinateurs… – qu’il faut sans cesse recharger .. !.

.

Au total, l’Industrie des technologies de l’Information et de la communication serait responsable de plus de 2 % des émissions de CO2 mondiales. Tout comme le big data explose en termes de poids, ce chiffre risque d’augmenter dans les années à venir.

Source ://www.consoglobe.com/internet-pollution-reelle-cg#xRTHj12T8lgjQMKf.99

Le Big data et moi

Nous sommes entrés dans une société de pseudo gratuité, d’une économie dématérialisée que le nouvel esprit du capitalisme – jamais en manque de détournement de mots - a sentencieusement baptisé d’économie collaborative.

L’Ubérisation exponentielle de nos modes de vie est en très bonne voie. Elle est adossée à une communication massive, manipulatrice et mensongère. Bombe à neutrons de « dérégulation massive », elle est potentiellement destructrice de toutes les normes sociale et environnementales.

La privatisation des données personnelles via l’Internet et le cloud, le téléphone portable et ses applications de plus en plus aliénantes, la prolifération des objets dit communicants n’en est que le dernier avatar.

Cette privatisation ne peut s’opérer qu’avec notre consentement, sinon notre adhésion.

Cette collaboration qui ne dit pas son nom est - lucidement ou non - servilement consentie !

Elle repose a tous les citoyens connectés, à tous les usagers des services dit dématérialisés le paradigme d’une problématique dénoncée en son temps par La Boétie : celui de notre servitude volontaire .

Cinq sources principales pour ce dossier non exhaustif : Wikipedia, ; Le journal du net,, Le journal du CNRS, Conso globe et Xerfi
La conclusion (ou introduction) intitulée Le Big data et moi n’engage que son auteur. ( JrD