Logo HEPL
INFORMATIQUE : Projet Big Data et Machine Learning 2

Informations générales sur l'unité d'enseignement : "INFORMATIQUE : Projet Big Data et Machine Learning 2"

Cycle 2
Niveau du cadre francophone de certification 7
Code ING-2-112 2.1.1
Crédits ECTS 5
Volume horaire (h/an) 52
Période Quadrimestre 1
Implantation(s) TECHNIQUE - Liège (Ing.)
Unité Orientation
Responsable de la fiche HIARD, SAMUEL
Pondération 50
Composition de l'unité d'enseignement
Intitulé Nombre d'heures Pondération
Algorithmes avancés de Machine Learning 26 EI
Projet d'optimisation distribué 26 EI
Prérequis -
Corequis -
  • Contribution au profil d'enseignement

  • CONCEVOIR DES SYSTÈMES COMPLEXES
    • Etablir une architecture/une structure /un schéma fonctionnel
    • Simuler ou prototyper ces systèmes de façon adéquate
    • Optimiser les solutions proposées au regard du cahier des charges
    METTRE EN ŒUVRE DES SYSTÈMES COMPLEXES
    • S’assurer de la fiabilité de la réalisation
    • Respecter le cahier des charges
    GÉRER UN PROJET AU SEIN D’UNE ÉQUIPE
    • Créer une cohésion et une synergie entre les différents intervenants
  • Acquis d'apprentissage spécifiques sanctionnés par l'évaluation

  • Etablir une architecture de modèle de machine learning qui soit cohérente avec le dataset sélectionné

    Prototyper le modèle de machine learning et les algorithmes génétiques (incl. NEAT)

    Optimiser, à l'aide des (méta)-paramètres, les différents modèles et algorithmes

    S'assurer, à l'aide de test rigoureux (ex : cross validation) de la fiabilité et/ou la convergence des modèles

    Respecter le cahier des charges qui est donné sous forme d'énoncé aux apprenants

    Intervenir à part égale ou plus avec les autres apprenants du groupe dans la réalisation des projets

  • Objectifs

  • Algorithmes avancés de Machine Learning: Maîtrise des techniques d'exploration et d'analyse avancées des données dans un contexte de Machine Learning, en choisissant les techniques les plus adaptées et en s'adaptant aux contraintes réelles comme les données manquantes ou un nombre trop élevé de variables

     

    Projets d'optimisation distribuée: *Maitriser le concept d’algorithme génétique s’inscrivant dans le concept de Big Data car il permet de trouver une solution proche de l’optimal dans un espace d’état potentiellement infini.* Appliquer les techniques d’algorithmes génétiques afin d’implémenter l’algorithme NEAT sur un problème concret.

  • Contenus

  • Algorithmes avancés de Machine Learning:

    - Différence entre apprentissage supervisé, non supervisé (clustering) et semi-supervisé

    - Arbres de décision (classification, régression)

    - Bagging, boosting, extra-trees

    - Notions de Learning set, test set, validation set, cross-validation

    - Sur/sous-apprentissage

    - Pre/pruning, post/pruning

    - Algos de clustering (KNN, K-Means)

    - Problème de l'espace mal divisé ==> Machines à support vectoriel (SVM)

    - Multi-sets, préférence learning (utility function vs pairwise)

    - Situations adversairiales (MinMax, GANs)

    - Algos d'optimisation (méta-paramètres des modèles) : Greedy, RGS, recuit simulé.

    - Importance des variables et sélection

    - Deep Fakes

    - Problème du bouton d'arrêt, éthique

    - Réseaux de neurones à convolutions (CNN)

     

    Projets d'optimisation distribuée: 

    • Algorithmes génétiques : principe général et effet des méta-paramètres.
    • Réseaux de neurones partiellement connectés
    • Algorithme NEAT

  • Méthodes d'enseignement et d'apprentissage

  • Cours ex-cathedra
  • Travaux de laboratoires
  • Evaluation

  • INFORMATIQUE : Projet Big Data et Machine Learning 2
    • Examen Oral
  • Langue(s) de l'unité d'enseignement

  • Français
  • Anglais
  • Supports de cours au format papier

  • Aucun support déposé pour cette unité d'enseignement
  • Autres supports de cours

  • Aucun autre support défini