11 Décembre 2013

Avec Gaia, le CNES entre résolument dans l’ère du « Big Data »

Le CNES traite depuis de nombreuses années des volumes de données considérables. Mais c’est avec le projet Gaia que l'utilisation de technologies spécifiques au « Big Data » s’est imposée.

Gaia est une mission d'astronomie de l'Agence spatiale européenne (ESA), dont le CNES assure le traitement des données scientifiques. Gaia fera la cartographie de notre galaxie en trois dimensions. Son objectif, extrêmement ambitieux, est de localiser et de caractériser plus d’un milliard d'étoiles. Pour ce qui est du nombre d’opérations, Gaia va constituer le plus gros traitement de données de l’histoire de l’astrométrie, avec la prise en compte de nombreux paramètres : positions, distances, mouvements, magnitudes des étoiles,… Au total, plus de 80 milliards d’objets vont être traités pour produire un catalogue de plus de 1,3 milliard d’unités.

Lors des études préparatoires à la mission, il est rapidement apparu que les limites des bases de données classiques étaient atteintes et que le CNES devait trouver d’autres solutions pour assurer le succès de Gaia. Le volume inhabituel de données à traiter et surtout le nombre gigantesque d’objets à gérer l’ont conduit à effectuer en 2011, un véritable saut technologique et à tester différents produits pour finalement retenir le système Hadoop, qui s’appuie sur les technologies qui s’imposent aujourd’hui dans les systèmes de gestion de données liés au monde du « Big Data » et qui sont utilisés par les grands acteurs du Web tels que Facebook, Google, Amazon ou eBay.

Au CNES, la gestion de volumes de plus en plus importants de données ne se limite pas à l'astrométrie et le recours au « Big Data » sera étendu aux futurs projets auxquels il contribue. Par exemple, dans le domaine de l’observation de la Terre, avec les six satellites Sentinel du programme européen de surveillance de la Terre, Copernicus, ou encore avec la mission franco-américaine SWOT pour l'étude des surfaces d'eau océaniques et continentales, qui fourniront de un à deux téraoctets (un teraoctet = 1012 octets) de données par jour et par satellite.

Au sujet du « Big Data » », Geneviève Campan, Directrice du Système d’Information au CNES, déclare : « Afin de faire face à ce véritable déluge de données, le CNES se prépare en faisant évoluer son Système d’Information. La gestion de cette problématique, déterminante pour la réussite de nombreux projets futurs, est conduite en étroite coopération entre les structures chargés des projets spatiaux et la Direction du Système d’Information ».

Contacts presse CNES

Alain Delrieu Tél. 01 44 76 74 04 alain.delrieu@cnes.fr
Pascale Bresson Tél. 01 44 76 75 39 pascale.bresson@cnes.fr
Julien Watelet Tél. 01 44 76 78 37julien.watelet@cnes.fr

www.cnes.fr/presse