Département Informatique MASTER WIC

Datamining

Course ID
UEF 22
Campus
Département Informatique
Level
Master
Semester
Semestre 2
Credit
4
Method
Cours, TP

Objectifs de l’enseignement:

L’exploration de données a pour objet l’extraction d’un savoir ou d’une connaissance à partir de grandes quantités de données, par des méthodes automatiques ou semi-automatiques, et l’utilisation industrielle ou opérationnelle de ce savoir.

Connaissances préalables recommandées:

Apprentissage automatique (S1)

Ingénierie de connaissance (Niveau licence informatique)

Contenu de la matière :

  1. Le Processus data mining dans sa globalité et ses étapes
  2. Engineering des données en entrée Méthodes de sélection d’attribut

Discrétisation des attributs numériques Quelques transformations utiles Nettoyage des données

Utilisation de donnée non étiquetées

  1. Implémentations des algorithmes plus complexes Arbres de décisions

Règles de classification Modèles linéaires Apprentissage à base d’instance Prédiction numérique

Clustering

Réseaux bayesien

  1. Meta Algorithmes Le principe général

La technique du boosting La technique du Bagging La technique du stacking

Les autres techniques tellesqu’hybrides

  1. Evaluation Prédiction de la performance

Séparation Ensemble Apprentissage et Ensemble Test Cross Validation et autres techniques

Autres estimations pour la prédiction numérique

  1. Extensions et Applications

Apprentissages à partir de données massives Text mining

Biomédical Data mining

Ubiquitous data mining Analyse des réseaux sociaux

Multi media mining

Annexe : Travaux pratiques

La plate d’apprentissage machine : WEKA Introduction à WEKA

Exploitation de l’Interface Explorer Exploitation de l’Interface Knowledge Flow I Exploitation de l’InterfaceExperimenter

La maitrise de cette plate forme avec toute les fonctionnalités quelle offre, en terme de traitement des données, implémentation des algorithmes et méta algorithmes, et les divers évaluations des résultats disponibles, est l’objectif des TPs.

Mode d’évaluation :

60% examen et 40% travail personnel

Références:

PhirozBhagat, Pattern Recognition in Industry, Elsevier, ISBN 0-08-044538-1

Richard O. Duda, Peter E. Hart, David G. Stork, Pattern Classification, Wiley Interscience, YikeGuo and Robert Grossman, editors: High Performance Data Mining: Scaling Algorithms, Applications and Systems, Kluwer Academic Publishers, 1999.

Mierswa, Ingo and Wurst, Michael and Klinkenberg, Ralf and Scholz, Martin and Euler, Timm: YALE: Rapid Prototyping for Complex Data Mining Tasks, in Proceedings of the 12th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD-06), 2006.

Daniel T. Larose (adaptation française T. Vallaud): Des données à la connaissance: Une introduction au data-mining (1Cédérom), Vuibert, 2005

René Lefébure et Gilles Venturi, Data Mining : Gestion de la relation client, personnalisations de site web, Eyrolles, mars 2001

Pang-Ning Tan, Michael Steinbach and Vipin Kumar, Introduction to Data Mining (2005),