Sujet de thèse IFSTTAR

 

English version

Fiche détaillée :

Titre : La détection d’anomalies et le suivi des objets dans le transport par la prévision future en utilisant les méthodes génératives

Laboratoire principal - Référent principal COSYS - LEOST  -  AMBELLOUIS Sébastien      tél. : +33 320438493 
Directeur du laboratoire principal COCHERIL Yann  -  
Spécialité de la thèse Traitement des images et du signal, apprentissage/modélisation
Axe 3 - COP2017 - Aménager et protéger les territoires
Site principal Lille-Villeneuve d'Ascq
Etablissement d'inscription UNIVERSITE DES SCIENCES ET TECHNOLOGIE DE LILLE 1
Ecole doctorale SCIENCES POUR L'INGENIEUR (SPI)
Directeur de thèse prévu LECOEUCHE Stéphane  -  MINES DOUAI  -  URIA
Type de financement prévu Contrat doctoral extérieur   - Ecole des mines de douai

Résumé

Modéliser le comportement et l'interaction entre individus à partir de l'analyse des flux audio/vidéo d'un système de surveillance est un thème de recherche très actif dans la communauté scientifique. Ce thème de recherche est directement relié à la problématique « Big data » commun à de très nombreux domaines d'applications comme la santé (surveillance des personnes agées), la sécurité et la sûreté. Dans le domaine du transport, l'objectif d'améliorer la sûreté, la sécurité, l'exploitation et le confort des réseaux de transport collectif ou individuel.

Qu'il s'agisse de surveiller une station de métro, l'enceinte d'un train de voyageurs, le hall d'urgence d'un hôpital ou un centre commercial, l'objectif opérationnel est de reconnaître une activité particulière, un groupe d'activités ou de détecter des événements anormaux. Pour y parvenir, la littérature propose deux angles d'études : l'angle supervisé ou l'angle non-supervisé. La première catégorie nécessite la mise en place d'une étape dite d'apprentissage lors de laquelle un modèle de chaque comportement à reconnaître est estimé. Cette apprentissage repose sur l'extraction d'un ensemble de caractéristiques (spatiales ou spatio-temporelles) définissant l'espace dans lequel est observé chaque activité puis d'une étape de segmentation de chacune d'entre elles dans ce même espace. Plusieurs moyens de modélisation permettent alors de générer de manière probabiliste chaque modèle (GMM, HMM) ou d'assurer leur discrimination (SVM). Plus récemment des techniques d'apprentissage profond ont été utilisées afin de mettre en place un apprentissage automatique hiérarchique dont chaque couche représente un niveau d'information de complexité croissante. Ces méthodes d'apprentissage profond s'appliquent dans un contexte supervisé ou non.

Dans la seconde catégorie, les méthodes proposent de découvrir automatiquement des patterns d'activités et d'interactions au fur et à mesure de l'apparition des flux, Les méthodes reposent sur la production d'un "dictionnaire de mots" à partir d'un ensemble de caractéristiques et de descripteurs extraits des flux puis sur la structuration de la manière dont ils s'associent en fonction des comportements et des interactions en présence. Certaines techniques (LDA - Latent Dirichlet Allocation, pLSA - Probability Latent Semantic Analysis, pLSM - probabilistic Latent Sequential Motifs) opérent une analyse « sémantique » du contenu des flux et produisent des « topics model » qui permettent de lever les nombreuses ambiguïtés portées par le dictionnaire.

Ce sujet se place dans la continuité des méthodes de la seconde catégorie. Le choix des caractéristiques (SIFT, SURF, région, flot optique etc.) et des descripteurs est important puisqu'ils doivent assurer la construction du dictionnaire le plus pertinent compte tenu des comportements et des interactions découverts et d'autres qui le seront au fil de l'eau. Le premier travail portera donc sur les méthodes d'apprentissage et de ré-apprentissage de dictionnaires parcimonieux en vue de décrire les observations à partir d'un nombre "réduit" d'atomes du dictionnaire. Le second travail consistera à segmenter les flux en tenant compte de la présence simultanée de plusieurs objets en interactions serrées ou interagissant pendant leurs déplacements. Le challenge sera d'intégrer les propriétés multi-temporelle et multi-echelle de ce qui se déroule dans la scène surveillée, chaque objet de la scène ayant sa propre vie plus ou moins corrélée à celle d'un ou plusieurs de ses voisins. La dernière phase du travail sera consacrée à la formalisation d'un événement « anormal » afin d'assurer sa détection et sa localisation.

Le candidats bénéficiera des précédents travaux des deux laboratoires encadrants. Il profitera des résultats obtenus sur l'utilisation des « topic model » dans le contexte de la détection de situations dangereuses aux passages à niveau (PN) [CUI13]. Il s'inspirera des travaux sur les techniques incrémentales de classification des données non stationnaires [AMA06] ou encore des travaux sur l'identification des systèmes dynamiques hybrides appliquée pour la segmentation automatique du contenu sémantique de séquences cinématographiques [BOU11]. Le candidat bénéficiera de bases de données propriétés de l'Ifsttar pour évaluer ses algorithmes. D'un point de vue opérationnel, l'évaluation portera sur l'interprétation de scènes filmées à bord de véhicules ferroviaires (sécurité des personnes), en zones urbaines (sécurité des usagers vulnérables) et au passage à niveau.

[AMA06] H. Amadou Boubacar, Classification dynamique de données non-stationnaires - apprentissage et suivi de classes évolutives, PhD, Ecole des Mines de Douai, 2006
[BOU11] K. Boukharouba, Modélisation et classification de comportements dynamiques des systèmes hybrides, PhD, Ecole des Mines de Douai, 2011
[CUI13] Y. Cui, Decouverte automatique d'activites dans les sequences d'images par topic model, Master 2, Ifsttar, 2013

Mots-clefs: Apprentissage incrémental, Inférence Bayésienne, Data mining, Dictionary learning, Traitement des images, Sécurité des voyageurs, Sécurité des usagers vulnérables de la route, Découverte/modélisation de l'activité et des interactions humaine
Liste des sujets
Candidatures fermées