L’exploration de données a pour objet l’extraction d’un savoir ou d’une connaissance à partir de grandes quantités de données, par des méthodes automatiques ou semi-automatiques, et l’utilisation industrielle ou opérationnelle de ce savoir.
Apprentissage automatique (S1)
Ingénierie de connaissance (Niveau licence informatique)
Discrétisation des attributs numériques Quelques transformations utiles Nettoyage des données
Utilisation de donnée non étiquetées
Règles de classification Modèles linéaires Apprentissage à base d’instance Prédiction numérique
Clustering
Réseaux bayesien
La technique du boosting La technique du Bagging La technique du stacking
Les autres techniques tels que hybrides
Séparation Ensemble Apprentissage et Ensemble Test Cross Validation et autres techniques
Autres estimations pour la prédiction numérique
Apprentissages à partir de données massives Text mining
Biomédical Data mining
Ubiquitous data mining Analyse des réseaux sociaux
Multi media mining
Annexe : Travaux pratiques
La plate d’apprentissage machine : WEKA Introduction à WEKA
Exploitation de l’Interface Explorer Exploitation de l’Interface Knowledge Flow I Exploitation de l’InterfaceExperimenter
La maitrise de cette plate forme avec toute les fonctionnalités quelle offre, en terme de traitement des données, implémentation des algorithmes et méta algorithmes, et les divers évaluations des résultats disponibles, est l’objectif des TPs.
Mode d’évaluation : 60% examen et 40% travail personnel
PhirozBhagat, Pattern Recognition in Industry, Elsevier, ISBN 0-08-044538-1
Richard O. Duda, Peter E. Hart, David G. Stork, Pattern Classification, Wiley Interscience, YikeGuo and Robert Grossman, editors: High Performance Data Mining: Scaling Algorithms, Applications and Systems, Kluwer Academic Publishers, 1999.
Mierswa, Ingo and Wurst, Michael and Klinkenberg, Ralf and Scholz, Martin and Euler, Timm: YALE: Rapid Prototyping for Complex Data Mining Tasks, in Proceedings of the 12th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining (KDD-06), 2006.
Daniel T. Larose (adaptation française T. Vallaud): Des données à la connaissance: Une introduction au data-mining (1Cédérom), Vuibert, 2005
René Lefébure et Gilles Venturi, Data Mining : Gestion de la relation client, personnalisations de site web, Eyrolles, mars 2001
Pang-Ning Tan, Michael Steinbach and Vipin Kumar, Introduction to Data Mining (2005),