Systèmes d'informations hétérogènes distribués

Informations générales sur l'unité d'enseignement : "Systèmes d'informations hétérogènes distribués"

Cycle

Niveau du cadre francophone de certification

Code

ARCSYSINF-2-022 2.1.1

Crédits ECTS

Volume horaire (h/an)

Période

Quadrimestre 1

Implantation(s)

TECHNIQUE - Liège (Ing.)

Unité

Obligatoire

Responsable de la fiche

HIARD, SAMUEL

Pondération

Composition de l'unité d'enseignement

Intitulé	Nombre d'heures	Pondération
Exploration des données	30	50
Projets	30	50

Prérequis

Systèmes d'informations hétérogènes distribués

Corequis

Contribution au profil d'enseignement

Analyser une situation suivant une méthode de recherche scientifique

Argumenter les choix proposés

Innover, concevoir ou améliorer un système

Mettre au point des améliorations
Modéliser, dimensionner des systèmes

Acquis d'apprentissage spécifiques sanctionnés par l'évaluation

Explorer des ensembles de données grande taille pour en extraire les informations utiles à l'analyse et à l'aide à la décision, en tenant compte de contraintes réelles

Déterminer la technique d'apprentissage la plus adéquate en se basant sur les résultats d'exploration et de classification d'un ensemble de données mixtes quantitatives et qualitatives.

Justifier ses choix en termes d'algorithmes et de méthodes d'optimisation

Réaliser un système de réseaux de neurones topologique en le faisant évoluer par un algorithme générique

Objectifs
Exploration des données: Maîtrise des techniques d'exploration et d'analyse avancées des données dans un contexte de Machine Learning, en choisissant les techniques les plus adaptées et en s'adaptant aux contraintes réelles comme les données manquantes ou un nombre trop élevé de variables

Projets:* Maitriser le concept d’algorithme génétique s’inscrivant dans le concept de Big Data car il permet de trouver une solution proche de l’optimal dans un espace d’état potentiellement infini.* Appliquer les techniques d’algorithmes génétiques afin d’implémenter l’algorithme NEAT sur un problème concret.

Contenus
Exploration des données:
- Différence entre apprentissage supervisé, non supervisé (clustering) et semi-supervisé
- Arbres de décision (classification, régression)
- Bagging, boosting, extra-trees
- Notions de Learning set, test set, validation set, cross-validation
- Sur/sous-apprentissage
- Pre/pruning, post/pruning
- Algos de clustering (KNN, K-Means)
- Problème de l'espace mal divisé ==> Machines à support vectoriel (SVM)
- Multi-sets, préférence learning (utility function vs pairwise)
- Situations adversairiales (MinMax, GANs)
- Algos d'optimisation (méta-paramètres des modèles) : Greedy, RGS, recuit simulé.
- Importance des variables et sélection
- Deep Fakes
- Problème du bouton d'arrêt, éthique
- Réseaux de neurones à convolutions (CNN)

Projets:
- Algorithmes génétiques : principe général et effet des méta-paramètres.
- Réseaux de neurones partiellement connectés
- Algorithme NEAT

Méthodes d'enseignement et d'apprentissage
Cours ex-cathedra
Travaux de laboratoires

Evaluation
Exploration des données
Examen Oral
Projets
Examen Oral
Evaluation Continue

Langue(s) de l'unité d'enseignement
Français

Supports de cours au format papier
Aucun support déposé pour cette unité d'enseignement

Autres supports de cours
Exploration et analyse approfondies des données Big data avec l'environnement R - Claude Vilvens

HEPL - Province de Liège

Systèmes d'informations hétérogènes distribués

Informations générales sur l'unité d'enseignement : "Systèmes d'informations hétérogènes distribués"

Contribution au profil d'enseignement

Acquis d'apprentissage spécifiques sanctionnés par l'évaluation

Objectifs

Contenus

Méthodes d'enseignement et d'apprentissage

Evaluation

Langue(s) de l'unité d'enseignement

Supports de cours au format papier

Autres supports de cours