Logo HEPL
Systèmes d'informations hétérogènes distribués

Informations générales sur l'unité d'enseignement : "Systèmes d'informations hétérogènes distribués"

Cycle 2
Niveau du cadre francophone de certification 7
Code ARCSYSINF-2-011 2.2.1
Crédits ECTS 5
Volume horaire (h/an) 60
Période Quadrimestre 2
Implantation(s) TECHNIQUE - Liège (Ing.)
Unité Obligatoire
Responsable de la fiche LEONARD, ANNE
Pondération 50
Composition de l'unité d'enseignement
Intitulé Nombre d'heures Pondération
Big Data 30 40
Exploration des données 30 60
Prérequis -
Corequis
Projets avancés et innovation en technologie de l'informatique
Compléments d'informatique
  • Contribution au profil d'enseignement

  • Analyser une situation suivant une méthode de recherche scientifique
    • Identifier, traiter et synthétiser les données pertinentes
    • Rechercher les ressources nécessaires
    • Transposer les résultats des concepts à la problématique ou situation traitée
    Utiliser des procédures et des outils
    • Exploiter les outils appropriés afin de résoudre une tâche spécifique
  • Acquis d'apprentissage spécifiques sanctionnés par l'évaluation

  • Le master en informatique saura explorer des ensembles de données grande taille pour en extraire les informations utiles à l'analyse et à l'aide à la décision.

    Le master en informatique saura, en se basant sur les résultats d'exploration et/ou de classification, utiliser les techniques inférentielles et déterminer la structure sous-jacente d'une sous-ensemble de données.

    Le master en informatique sera capable de déployer une architecture dédiée aux traitements de type Big data, tant en termes de répartition de charges que d'utilisation de systèmes de données choisis en fonction de la natuare de celles-ci.

  • Objectifs

  • Big Data: Maîtrise de l'architecture des systèmes orientés Big Data. Maîtrise opérationnelles de systèmes de données de type Big data. Maîtrise d'une SGBD non relationnel.

    Exploration des données: Maîtrise des techniques d'exploration des données dans un contexte de Big Data. Analyse avancée et interprétation sur base des résultats de ces explorations.

  • Contenus

  • Big Data: Algoritme MapReduce.

    Etude de diverses techniques d'exploitation des données de grandes tailles (parallélisme, optimisations, eco-système Hadoop, ...).

    Techniques d'analyse des données complémnetaires à l'exploration des données classique: analyse discriminante linéaire, PCR et PLSR, ...

    Gestion des données en contexte non relationnelle (NoSQL) avec MongoDB et/ou Cassandra.

    Exploration des données : Exploration des données et analyse avancée des données avec applications pratiques dans l'environnement R : exploration des données : ACP, ACM, CAH. Utilisations des résultats des explorations avec tests statistiques : REG-CORR multiple, régression logistique.

  • Méthodes d'enseignement et d'apprentissage

  • Cours ex-cathedra
  • Evaluation

  • Exploration des données
    • Examen Ecrit
    Big Data
    • Examen Ecrit
  • Langue(s) de l'unité d'enseignement

  • Français
  • Supports de cours au format papier

  • Vilvens Claude, "Big data dans l'environnement R Exploration et analyse des données "
    Vilvens Claude, "Introduction aux techniques de traitement et d'analyse des Big data "
  • Autres supports de cours

  • Aucun autre support défini