Logo HEPL
Projet Big Data et Machine Learning 2

Informations générales sur l'unité d'enseignement : "Projet Big Data et Machine Learning 2"

Cycle 2
Niveau du cadre francophone de certification 7
Code ARCSYSINF-2-022 2.1.1
Crédits ECTS 5
Volume horaire (h/an) 52
Période Quadrimestre 1
Implantation(s) TECHNIQUE - Liège (Ing.)
Unité Obligatoire
Responsable de la fiche HIARD, SAMUEL
Pondération 50
Composition de l'unité d'enseignement
Intitulé Nombre d'heures Pondération
Algorithmes avancés de Machine Learning 26 50
Projets d'optimisation distribuée 26 50
Prérequis -
Corequis -
  • Contribution au profil d'enseignement

  • Analyser une situation suivant une méthode de recherche scientifique
    • Argumenter les choix proposés
    Innover, concevoir ou améliorer un système
    • Mettre au point des améliorations
    • Modéliser, dimensionner des systèmes
  • Acquis d'apprentissage spécifiques sanctionnés par l'évaluation

  • Explorer des ensembles de données grande taille pour en extraire les informations utiles à l'analyse et à l'aide à la décision, en tenant compte de contraintes réelles

    Déterminer la technique d'apprentissage la plus adéquate en se basant sur les résultats d'exploration et de classification d'un ensemble de données mixtes quantitatives et qualitatives.

    Justifier ses choix en termes d'algorithmes et de méthodes d'optimisation

    Réaliser un système de réseaux de neurones topologique en le faisant évoluer par un algorithme générique

  • Objectifs

  • Algorithmes avancés de Machine Learning: Maîtrise des techniques d'exploration et d'analyse avancées des données dans un contexte de Machine Learning, en choisissant les techniques les plus adaptées et en s'adaptant aux contraintes réelles comme les données manquantes ou un nombre trop élevé de variables

     

    Projets d'optimisation distribuée: *Maitriser le concept d’algorithme génétique s’inscrivant dans le concept de Big Data car il permet de trouver une solution proche de l’optimal dans un espace d’état potentiellement infini.* Appliquer les techniques d’algorithmes génétiques afin d’implémenter l’algorithme NEAT sur un problème concret.

  • Contenus

  • Algorithmes avancés de Machine Learning:

    - Différence entre apprentissage supervisé, non supervisé (clustering) et semi-supervisé

    - Arbres de décision (classification, régression)

    - Bagging, boosting, extra-trees

    - Notions de Learning set, test set, validation set, cross-validation

    - Sur/sous-apprentissage

    - Pre/pruning, post/pruning

    - Algos de clustering (KNN, K-Means)

    - Problème de l'espace mal divisé ==> Machines à support vectoriel (SVM)

    - Multi-sets, préférence learning (utility function vs pairwise)

    - Situations adversairiales (MinMax, GANs)

    - Algos d'optimisation (méta-paramètres des modèles) : Greedy, RGS, recuit simulé.

    - Importance des variables et sélection

    - Deep Fakes

    - Problème du bouton d'arrêt, éthique

    - Réseaux de neurones à convolutions (CNN)

     

    Projets d'optimisation distribuée: 

    • Algorithmes génétiques : principe général et effet des méta-paramètres.
    • Réseaux de neurones partiellement connectés
    • Algorithme NEAT
  • Méthodes d'enseignement et d'apprentissage

  • Cours ex-cathedra
  • Travaux de laboratoires
  • Evaluation

  • Algorithmes avancés de Machine Learning
    • Examen Ecrit
    • Examen Oral
    • Evaluation Continue
    Projets d'optimisation distribuée
    • Examen Oral
    • Evaluation Continue
  • Langue(s) de l'unité d'enseignement

  • Français
  • Anglais
  • Supports de cours au format papier

  • Vilvens Claude, "Exploration et analyse approfondies des données Big data avec l'environnement R "
  • Autres supports de cours

  • Exploration et analyse approfondies des données Big data avec l'environnement R - Claude Vilvens