techredac
 

USA - la Bibliothèque du Congrès peine à absorber des milliards de tweets


Rédigé le Jeudi 10 Janvier 2013 à 00:07
Andrée Navarro


La bibliothèque du Congrès américain traite 400 millions de tweets chaque jour. Quid du stockage et de l’exploitation de ces données ?


Library of Congress
Library of Congress
170 milliards : c’est le nombre de messages diffusés sur Twitter depuis sa création en mars 2006. Tous ces messages sont archivés pour la postérité mais encore inaccessibles. Parmi les messages sauvegardés figure bien sûr le premier jamais publié par Twitter, signé de l'un de ses co-fondateurs, Jack Dorsey. On y trouve aussi le fameux «Nous venons d'écrire l'histoire. Merci» de Barack Obama annonçant sa première élection à la présidence des États-Unis en 2008. Les archives de Twitter arrivent en flux continu, et dans toutes les langues.


La bibliothèque du Congrès a été créée il y a plus de 200 ans. L’institution a signé un accord avec le réseau social Twitter, qui lui a fait "don" de ses tweets via Gnip, une société du Colorado. Le fameux don est spectaculaire puisqu’il représente plus de 133 000 gigaoctets. Côté vie privée, le Congrès n’archive pas les tweets effacés ou protégés, L'accès aux tweets n’est autorisé que 6 mois après leur publication --le temps pour les internautes de les effacer s’ils le désirent. ..


Que compte faire le Congrès de tous ces tweets ? Selon Lee Humphreys, professeur de communication à l'université Cornell à Washington DC «Ils nous informent sur la culture dans laquelle ils ont été écrits». Ils intéressent donc au plus haut point les chercheurs du monde entier depuis le début de cet archivage en 2010, et qui travaillent sur des sujets de société divers.


Mais voilà, effectuer une seule recherche parmi les données de 2006-2010 prendrait jusqu'à 24 heures, un délai inadapté selon la Bibliothèque du Congrès qui, pour être plus réactive, devrait posséder des «centaines, voire de milliers, de serveurs». La Bibliothèque envisage donc de faire appel au secteur privé.


Pour inofo, chaque utilisateur de Twitter pourra bientôt archiver ses propres tweets, selon une nouvelle option lancée par le réseau en décembre.