Logo HEPL
Systèmes d'informations hétérogènes distribués

Informations générales sur l'unité d'enseignement : "Systèmes d'informations hétérogènes distribués"

Cycle 2
Niveau du cadre francophone de certification 7
Code ARCSYSINF-2-022 2.1.1
Crédits ECTS 5
Volume horaire (h/an) 60
Période Quadrimestre 1
Implantation(s) TECHNIQUE - Liège (Ing.)
Unité Obligatoire
Responsable de la fiche HIARD, SAMUEL
Pondération 50
Composition de l'unité d'enseignement
Intitulé Nombre d'heures Pondération
Exploration des données 30 50
Projets 30 50
Prérequis
Systèmes d'informations hétérogènes distribués
Corequis -
  • Contribution au profil d'enseignement

  • Analyser une situation suivant une méthode de recherche scientifique
    • Argumenter les choix proposés
    Innover, concevoir ou améliorer un système
    • Mettre au point des améliorations
    • Modéliser, dimensionner des systèmes
  • Acquis d'apprentissage spécifiques sanctionnés par l'évaluation

  • Explorer des ensembles de données grande taille pour en extraire les informations utiles à l'analyse et à l'aide à la décision, en tenant compte de contraintes réelles

    Déterminer la technique d'apprentissage la plus adéquate en se basant sur les résultats d'exploration et de classification d'un ensemble de données mixtes quantitatives et qualitatives.

    Justifier ses choix en termes d'algorithmes et de méthodes d'optimisation

    Réaliser un système de réseaux de neurones topologique en le faisant évoluer par un algorithme générique

  • Objectifs

  • Exploration des données: Maîtrise des techniques d'exploration et d'analyse avancées des données dans un contexte de Machine Learning, en choisissant les techniques les plus adaptées et en s'adaptant aux contraintes réelles comme les données manquantes ou un nombre trop élevé de variables

     

    Projets:* Maitriser le concept d’algorithme génétique s’inscrivant dans le concept de Big Data car il permet de trouver une solution proche de l’optimal dans un espace d’état potentiellement infini.* Appliquer les techniques d’algorithmes génétiques afin d’implémenter l’algorithme NEAT sur un problème concret.

  • Contenus

  • Exploration des données:

    - Différence entre apprentissage supervisé, non supervisé (clustering) et semi-supervisé

    - Arbres de décision (classification, régression)

    - Bagging, boosting, extra-trees

    - Notions de Learning set, test set, validation set, cross-validation

    - Sur/sous-apprentissage

    - Pre/pruning, post/pruning

    - Algos de clustering (KNN, K-Means)

    - Problème de l'espace mal divisé ==> Machines à support vectoriel (SVM)

    - Multi-sets, préférence learning (utility function vs pairwise)

    - Situations adversairiales (MinMax, GANs)

    - Algos d'optimisation (méta-paramètres des modèles) : Greedy, RGS, recuit simulé.

    - Importance des variables et sélection

    - Deep Fakes

    - Problème du bouton d'arrêt, éthique

    - Réseaux de neurones à convolutions (CNN)

     

    Projets: 

    • Algorithmes génétiques : principe général et effet des méta-paramètres.
    • Réseaux de neurones partiellement connectés
    • Algorithme NEAT
  • Méthodes d'enseignement et d'apprentissage

  • Cours ex-cathedra
  • Travaux de laboratoires
  • Evaluation

  • Exploration des données
    • Examen Oral
    Projets
    • Examen Oral
    • Evaluation Continue
  • Langue(s) de l'unité d'enseignement

  • Français
  • Supports de cours au format papier

  • Aucun support déposé pour cette unité d'enseignement
  • Autres supports de cours

  • Exploration et analyse approfondies des données Big data avec l'environnement R - Claude Vilvens