Big Data


Exemple de visualization de big data à DataBricks.

Description du domaine

Le “Big Data” correspond à l’analyse et au traitement de grandes masses de données, aujourd’hui de l’ordre de plusieurs Giga ou Terra Octets de données. Il s’agit d’un domaine d’application en expansion de part l’importante croissance des grandes quantités de données obtenues par internet et les objets connectés.
Les problématiques traitant des Big Data sont nombreuses, allant de la simple problématique de stockage et d’accès aux données, jusqu’à l’analyse et le traitement fin de ces données par estimation et apprentissage (Machine Learning) pour en extraire les informations pertinentes. L’analyse finale des Big Data pouvant être liée à une problématique de visualisation de ces données (voir visualisation scientifique).

Les données à traiter peuvent être de nature diverses:

  • Identitées de personnes et habitudes.
  • Connections entre personnes ou entitées sous forme de graphe.
  • Transferts d’information, ou transfert de données financières.
  • Données scientifiques en grande quantitée issues de capteurs ou de simulation (ex. données 3D de capteur laser).
  • etc

Intégration dans la formation IMI

La majeure IMI vous prépare à la partie d’analyse scientifique des grandes masses de données. En particulier les méthodes d’apprentissages et de classifications sont les approches standards permettant d’extraire des informations pertinentes à partir d’un ensemble de données. Vous êtes également en mesure de mettre en place des approches de visualisation permettant d’observer les résultats d’une analyse appliquée sur des Big Data.

Les modules liés à la visualisation scientifique sont les suivants:

  • Estimation et apprentissage de données (5ETI)
  • Compression et techniques avancées en image (5ETI)
  • Optimisation numérique et problèmes inverses (4ETI)

Notons que le parcours IMI ne prépare pas spécifiquement à la gestion informatique de la mise en place du stockage et de l’accès sous forme de base de données distribuées.

Stages d’anciens

– Compressive sensing, Inria.
– Analyse de données et classification, MSC & SGCC.
– Machine learning sur des informations de réseaux, ESI Group.

Comments are closed