• Print
  • Decrease text size
  • Reset text size
  • Larger text size
26/03/2018

Application des Data Sciences à la sûreté dans les transports : pourquoi elles changent la donne

Quelles sont les principales applications des data sciences à la sûreté ? Parmi les nombreux cas d’usage imaginables, lequels semblent prometteurs pour assister au quotidien les forces de sûreté des transports publics ? Par ailleurs, comment juger de l'efficacité de tels outils ?

The Minority Report, nouvelle de Philip K. Dick de 1956 ayant inspiré le film éponyme, dépeint une société dystopique où les crimes peuvent être prédits par des mutants doués de précognition. Quand ceux-ci détectent un individu prêt à passer à l’acte, une escouade spécialisée dans les crimes qui n’ont pas encore eu lieu (Précrime) est envoyée pour interpeller préventivement le suspect.

Avec l’essor du big data, qui consiste à traiter d’immenses quantités de données pour en extraire des informations, et les diverses méthodes d’analyses propres aux data sciences, ce scenario ne paraît plus si abstrait. Les autorités policières et judiciaires de plusieurs pays utilisent en effet des outils capables de prédire les zones à risque criminel ou encore d’évaluer le potentiel de récidive d’un individu. Ces solutions se déclinent également à la sûreté, particulièrement des transports. Ainsi le département de la Sécurité intérieure des États-Unis (Homeland Security) se dit capable d’identifier des individus au comportement suspect en analysant en temps réel les flux vidéo de surveillance des aéroports américains.

Où en est-on ? Nous souhaitons ici donner une vue d’ensemble des principales solutions - existantes ou en expérimentation - qui appliquent les data sciences à la sûreté. De nombreux cas d’usage sont imaginables ; nous détaillerons ceux qui nous semblent prometteurs pour assister au quotidien les forces de sûreté des transports publics. Nous donnerons enfin quelques clés d’analyse sur l’efficacité de tels outils.

 

Prédire les crimes et délits pour mieux organiser les équipes de sûreté

Une expertise historique des forces de l’ordre

Les récents progrès dans le traitement de données relatives à des crimes ou délits sont le prolongement de décennies d’efforts entrepris par les forces de l’ordre. L’expertise développée en récolte et analyse méthodique de diverses données et indices a été un levier majeur de l’amélioration des capacités de résolution des enquêtes de police. L’explosion du volume des bases de données disponibles a cependant rendu nécessaire la mise au point de méthodes de croisement, de traitement et d’analyse adaptées à ces larges volumes. C’est ainsi que les data sciences ont trouvé dans la sûreté un terrain d’application et de développement particulièrement propice.

Une des premières applications des data sciences dans un contexte sécuritaire est celle qui consiste à prédire l’apparition de crimes, dans l’espace et le temps, pour mieux organiser les actions de police. Depuis 1994, la police de New York utilise ainsi COMPSTAT, un outil qui croise les données officielles sur les crimes, délits et arrestations pour identifier des zones à risque dans l’agglomération newyorkaise. Ayant progressivement incorporé des données des sources annexes tels que les bulletins météo, COMPSTAT est capable d’identifier les zones qui dans les jours à venir sont les plus à risque pour tel ou tel type de crime. La police newyorkaise peut alors affecter ses patrouilles pour couvrir au mieux les zones où leur présence parait la plus utile. Citons des solutions similaires telles que PredPol, développée pour la police de Los Angeles à partir de modèles mathématiques initialement conçus pour prédire les répliques de séismes, ou encore le Crime Anticipation System utilisé par la police néerlandaise. La pertinence de telles solutions dépend non seulement de l’ampleur et de la qualité des jeux de données disponibles mais surtout des méthodes choisies pour le traitement et l’analyse. La solution CrimeScan de la police de Pittsburg prédit ainsi les zones à risque de violences urbaines en suivant les signaux faibles des petits délits, partant du constat que les criminels ont tendance à progresser de délits mineurs à des crimes.

En France, la Gendarmerie Nationale utilise depuis 2015 l’outil Map Revelation qui lui permet à partir de régularités statistiques de prédire les zones à risque de délits fréquents (cambriolages, vols, trafics, viols) pour mieux orienter ses patrouilles.

 

Figure 1 : Visuels de l’outil Map Revelation utilisé par la Gendarmerie pour identifier les zones à risque et orienter les patrouilles [source : SuretéGlobale]

 

Une utilité contre la fraude et la délinquance dans les transports publics

Parallèlement au développement de moyens de prédiction par les forces de police, certains opérateurs de transport ont fait le choix d’épauler leurs départements sûreté et anti-fraude d’outils basés sur les data sciences. Ceci pour lutter contre la délinquance et pour mieux lutter contre la fraude dans les transports. La RATP et SNCF Transilien ont ainsi chacun leur outil de prédiction des zones les plus sensibles à la fraude. En analysant les faits de sûreté consignés dans leurs SI et en détectant les tendances et corrélations, ils sont capables de prédire les zones, lignes et horaires particulièrement sujets à la fraude, et peuvent planifier leur présence en conséquence. Les contrôleurs optimisent leur effet de dissuasion et de contrôle en ciblant des plages horaires ou des lignes spécifiques.

A terme, on peut imaginer que des sources de données supplémentaires soient ajoutées pour affiner les prédictions - flux beacons, trafics constatés sur les valideurs, etc. – à mesure que l’équipement des stations en capteurs s’étoffe.

 

Profiler les individus pour faciliter la détection de suspects

Les data sciences comme outil de lutte contre la récidive et le terrorisme

Les progrès en data science permettent aujourd’hui de prédire l’objet des crimes et délits – quel type de fait, où et quand. Ils promettent également d’être en mesure de profiler les individus suspects pour mieux évaluer leur potentiel de passer à l’acte. C’est en ce sens que des solutions de profilage ont récemment été testées et déployées. Par exemple, la police de Londres teste depuis 2014 un logiciel censé identifier les membres de gangs ayant les plus fortes chances de récidive. L’outil Oasys utilisé par la Ministère de la Justice du Royaume-Uni prédit quant à lui la probabilité de récidive d’un criminel remis en liberté. Les algorithmes mis au point par la police de Chicago ciblent pour leur part les individus les plus susceptibles de commettre des actes de violence par arme à feu, ou d’en être victime (dans le cas de règlements de compte par exemple). Elle actualise régulièrement via ses algorithmes une ‘’liste chaude’’ de tels individus qu’elle peut surveiller prioritairement.

La Gendarmerie Nationale n’est pas en reste : le SCRC, son Service Central de Renseignement Criminel, en pointe sur l’analyse criminelle et comportementale, mène un projet en partenariat avec Morpho (groupe Safran). Le projet Horizon traite un vaste éventail de données, incluant des données Insee ainsi que des données récoltées sur les blogs et les réseaux sociaux. De tels projets pourraient également fournir des outils supplémentaires aux services de renseignement en prise avec le contexte terroriste actuel.

 

Les data sciences pour sécuriser les gares et lieux d’échange

Dans le contexte de la sûreté des transports en commun, des algorithmes de profilage pourraient être mis à profit pour combattre la fraude et identifier les contrevenants. Un projet mené par Thalès visant à illustrer les capacités d’un Passenger Name Record européen (centralisation des données personnelles contenues dans les dossiers passagers remplis avant chaque vol) a ainsi fait la démonstration que des algorithmes pouvaient détecter des individus suspects en rapprochant des facteurs aussi divers que le fait d’avoir payé son billet en liquide, voyagé plusieurs fois dans la même journée ou n’avoir acheté qu’un aller simple. Thalès a illustré les capacités d’apprentissage avancé de ses ordinateurs – ou deep learning – qui leur permet de trouver des corrélations ou anomalies dans des jeux de données complexes sans avoir été explicitement programmés pour ce faire. Aux Etats-Unis cette fois, la Transport Security Agency (TSA) passe au crible les informations relatives aux passagers avant leur arrivée à l’aéroport. Ceux-ci se voient attribués un niveau de risque en fonction duquel les équipes TSA peuvent décider de fouilles supplémentaires.

A date, aucun opérateur de transport ou gestionnaire d’infrastructure français ne peut utiliser de tels algorithmes pour lutter contre la fraude ou les incivilités, en premier lieu pour des questions de respect de la réglementation qui s’applique aux données nominatives. Mais des dispositifs similaires pourraient voir le jour moyennant la mise en place de traitements adéquats des données personnelles ou d’une évolution de la règlementation. Dans une moindre mesure, Uber a développé ses propres algorithmes de machine learning pour identifier les conducteurs ayant potentiellement fraudé en détournant le système d’incitation mis en place par la société de VTC pour récompenser les chauffeurs prenant en charge des clients sur des plages horaires critiques.

 

Fournir un appui en temps réel aux équipes en intervention

Les algorithmes opérant en temps réel pour appuyer au plus près les interventions

Les solutions présentées jusqu’à présent qui reposent sur les data sciences offrent des capacités de prédiction utiles pour ajuster le dispositif de sûreté et prévenir des actes futurs : soit en prédisant la probabilité d’occurrence d’un fait de sureté en un lieu ou un moment donné, soit en prédisant la probabilité qu’un individu a de (re)passer à l’action.

Disposer de telles capacités d’analyse et de prédiction actionnables et restituables en temps réel constitue un appui supplémentaire. Plusieurs programmes sont en cours pour délivrer ce potentiel aux forces de police et agents de sûreté tout au long de leurs horaires de services.

Ainsi la NYPD a doté en 2014 ses plus de 35 000 officiers de police newyorkaise d’un outil de police prédictive accessible en temps réel directement depuis leur smartphone. Cet outil exploite les données agrégées au sein du system DAS, qui collecte depuis 2008 les données d’une foule de capteurs disposés dans la ville : caméras de surveillance, lecteurs de plaques d’immatriculation, capteurs de radiation et de composés explosifs, micros, registre des appels du 911, casiers judiciaires, etc. Il permet de restituer à chaque agent en fonction les informations clés sur la localisation et la nature des situations de danger à proximité, décuplant ainsi son niveau d’information et donc sa capacité de réaction. Cet outil est utilisé par 10 000 officiers de police chaque jour.

Depuis, la ville californienne de Fresno (un demi-million d’habitants) s’est doté de son propre outil nommé « Beware ». Beware établit à la volée un profil pour chaque suspect identifié par un officier en intervention, suivant son niveau de menace potentiel calculé à partir de données telles que le casier judiciaire et même ses publications sur les réseaux sociaux. De tels outils pourraient de même se montrer utiles aux agents de sûreté dans les transports, par exemple pour fournir aux agents un descriptif clair d’un fait de sureté dans les minutes qui précédent l’arrivée d’une équipe sur place, ou pour leur fournir des indications utiles à l’interpellation d’un individu confirmé comme dangereux.

 

Le temps réel pour détecter les comportements suspects

Les solutions capables d’exécuter dans la minute leurs algorithmes pourraient par ailleurs constituer une aide précieuse pour détecter une situation anormale dès les premiers signes. Tout particulièrement, le parc de caméras de vidéosurveillance installées dans les gares ferroviaires et aéroports génère un flux de vidéos conséquent que les data sciences peuvent aider à analyser et mettre à profit. Le groupe Thalès expérimente des capacités d’analyse en temps réel permettant plusieurs fonctionnalités : reconnaissance d’un individu par signature visuelle unique, suivi automatique de cet individu dans une aérogare, détection d’individus marchant à contre sens ou encore identification d’objets abandonnées. La police australienne entend tester un dispositif similaire lors de jeux du Commonwealth de 2018, en équipant les transports en commun du Queensland. Des cas d’usages similaires sont envisageables pour les gares ferroviaires : si les équipements vidéo actuellement déployés sont compatibles ou remplaçables à peu de frais alors les solutions d’analyse vidéo peuvent représenter une alternative à des dispositifs de filtrage physique (portiques).

Alors que l’exploitation et l’interprétation en temps réel de données vidéos constitue déjà un défi d’ampleur, le Department of Homeland Security américain (DHS) entend mettre au point une approche encore plus complète. Le DHS a en effet lancé le projet FAST pour « Future Attribute Screening Technology ». Celui-ci vise à analyser le comportement des individus en zone de transit par le recoupement d’une variété de données captées à l’instant. Conductivité de la peau, battements des paupières, mouvements, sueur etc. sont autant d’indices potentiels enregistrables qui trahiraient l’état physiologique et émotionnel d’un individu. Le DHS ambitionne par ce moyen de détecter les individus les plus à risque au niveau des postes d’inspection filtrage (là où les passagers sont déjà fouillés pour rechercher d’éventuels armes et explosifs) puis à terme dans les allées d’un terminal d’aéroport, sans qu’il ait conscience qu’il est observé.

 

Figure 2 : Schéma d’un des premiers prototypes de la solution FAST en test par le Department of Homeland Security américain [source : DHS]

 

De telles solutions sont à évaluer prudemment

Une diversité d’applications à la sûreté

Le schéma ci-dessous, inspiré de la matrice de Clarke utilisée en criminologie pour étudier les leviers de réduction des crimes, replace les multiples applications des data sciences à la sûreté que nous venons d’évoquer.

 

Figure 3 : Vue d’ensemble des diverses applications des data sciences à la sûreté, suivant leur effet sur le suspect, le moyen d’action ou l’objectif d’un délit et suivant la mise en pratique de méthodes prédictives ou temps réel [Analyse Sia Partners]

Il montre que l’état de l’art en data sciences appliquées à la police et à la sûreté agit sur trois principaux leviers que sont :

- le suspect, en facilitant sa détection et en prédisant ses intentions,

- ses moyens d’actions, en détectant tout comportement caractéristique et indiquant aux agents les types de crimes à attendre,

- son objectif, en plaçant préventivement des agents dans les zones à risques ou en les y guidant plus rapidement.

Ces dispositifs de sûreté qui utilisent les data sciences peuvent chercher à renforcer au mieux la présence des agents, décupler leur réaction, dissuader les contrevenants ou même agir sur les conditions propices à un crime (suivi d’un récidiviste potentiel, interpellation d’un suspect identifié).

Au-delà des capacités d’enquête a posteriori, qui ont historiquement été favorisées, ces nouvelles applications sont soit du domaine de la prédiction soit de l’analyse en temps réel. Par ailleurs, les débouchés en matière de sûreté sont multiples : police, fraude, crimes, terrorisme, etc. Or ces évènements sont plus ou moins fréquents et faciles à caractériser.

 

Une évaluation problématique pour plusieurs raisons

Ces considérations sont à prendre en compte lorsqu’il s’agit d’évaluer l’efficacité des projets ou programmes liés aux data sciences qui sont actuellement menés. En particulier, le domaine du prédictif est sujet à précaution : comment mesurer l’efficacité d’une solution prédictive si les actions préventives découlant des prédictions sont mises en place avec succès ? Il nous semble approprié de poser des métriques précises et en lien avec la réalité du terrain, pour les suivre sur des durées adaptées et en faire des évaluations statistiques.

Pour mesurer l’efficacité globale de tels dispositifs, nous nous heurtons également à la sensitivité du sujet de la sûreté, qui explique peut-être le peu de données communiquées au grand public. La police de Los Angeles est ainsi une des seules à afficher des chiffres : selon elle, son outil PredPol permettrait de réduire de 21% les crimes violents et de 33% les cambriolages lorsqu’il est utilisé.

Outre l’efficacité en définitive d’un outil, il s’agit aussi d’évaluer sa performance au regard de la complexité de ses algorithmes et de la variété de données traitées. Or la plupart des algorithmes utilisées ce jour ne sont pas publics et donc difficilement comparables. Difficile donc d’évaluer l’utilité d’ajouter les données météo ou l’accès au registre de plaques d’immatriculation à un algorithme. De même se pose la question de l’impact du potentiel effet tunnel en se focalisant sur des données historiques (si la présence d’agents facilite la détection et donc l’enregistrement de certains faits, s’appuyer sur les données de leur registre pour faire des prédictions conduirait à envoyer les agents aux mêmes endroits, qui y constateraient plus de faits qu’ailleurs, etc.)

L’efficacité de solutions reposant sur les data sciences devrait également se mesurer à leur facilité de mise en œuvre : les prédictions sont-elles intelligibles par les agents ? Un algorithme peut-il faire des corrélations tellement subtiles qu’un opérateur ne peut pas détecter les « faux positifs » ? Quand bien même une solution mobilise des algorithmes complexes et des dynamiques de deep learning, il nous semble ainsi essentiel d’inscrire son implémentation dans un dispositif de contrôle qui fait intervenir les agents qui ont la connaissance du terrain.             

 

 

Les data sciences semblent donc avoir une utilité pour aider les agents en charge de la sûreté, que ce soit à l’échelle d’une ville ou d’un bâtiment dédié aux transports publics. Les projets à date mobilisent un vaste ensemble de données pour lutter contre la fraude ou la criminalité, en appuyant les interventions en temps réel ou préventivement. Leur efficacité est complexe à évaluer mais peut l’être d’autant mieux que les agents connaissant le terrain sont impliqués à la conception, lors de l’expérimentation et au déploiement. Les applications des data sciences sont ainsi dignes d’intérêt pour la sûreté, doublées d’une prudence au vu de la sensibilité du grand public à l’évocation de concepts facilement assimilables à de la surveillance de masse.

 

Applications des data sciences à la sûreté dans les transports

 

 

Les données se transforment rapidement en un des atouts les plus importants pour une entreprise, fournissant des informations précieuses sur ses clients, les tendances et bien plus encore. À l'aide des outils adaptés, il est devenu possible de trouver de nouvelles réponses aux enjeux critiques de l'entreprise, ceux précédemment inexploités et sous-utilisés. Notre équipe de data scientists travaille en étroite collaboration avec d'autres équipes localement et à l'étranger pour développer des offres sur mesure pour ses clients.

Pour en savoir plus sur nos services de data science, visitez notre page dédiée.

0 commentaire
Poster un commentaire

Plain text

  • Aucune balise HTML autorisée.
  • Les adresses de pages web et de courriels sont transformées en liens automatiquement.
  • Les lignes et les paragraphes vont à la ligne automatiquement.
Image CAPTCHA
Saisissez les caractères affichés dans l'image.
Back to Top