Définition
L'enrichissement de transactions se pose au-dessus de la catégorisation : il ajoute à chaque opération des métadonnées contextuelles issues de bases externes.
Concrètement, une ligne brute devient exploitable grâce au logo marchand, au nom commercial normalisé, à l'adresse et à la géolocalisation, au MCC, à la fiche entreprise (SIREN, secteur), à la détection d'abonnement récurrent, voire à l'empreinte carbone.
Catégorisation vs enrichissement
Souvent confondus, mais distincts :
| Catégorisation | Enrichissement | |
|---|---|---|
| Sortie | Une catégorie (« Alimentation › Supermarché ») | Des métadonnées (logo, géo, SIREN…) |
| Modèle | ML / règles | Lookup base externe + ML |
| Bases | Historique de libellés taggés | Pappers, OpenStreetMap, MCC, base marchands |
| Usage | Budget, agrégation par catégorie | UI riche, identification précise, analytics |
En pratique, les deux vont ensemble : un AISP, PFM ou BFM moderne offre les deux.
Les types d'enrichissement courants
- Identité marchand :
CB AMZN MKTPL DUBLIN IEdevient « Amazon », avec logo et URL. - Fiche entreprise : pour une contrepartie société (virement, prélèvement), ajout du SIREN, de la forme juridique, du secteur NAF, de l'adresse (sources Pappers, INPI).
- MCC : code à 4 chiffres (ISO 18245) pour les transactions carte (5411 supermarché, 4121 taxi, 7011 hôtel).
- Géolocalisation : latitude/longitude du point de vente, utile pour la carte des dépenses et la détection de fraude géographique.
- Détection d'abonnement : repérer qu'un
NETFLIX 13,49 €mensuel est un abonnement, pour proposer une gestion dédiée. - Détection de revenu : identifier les flux entrants récurrents (salaire, allocations) pour le scoring ou la sécurisation du budget.
- Empreinte carbone : estimer le CO2 de chaque dépense (Carbo, Greenly, Doconomy) à partir d'un facteur d'émission par secteur.
Pourquoi c'est devenu critique
Sans enrichissement, une transaction reste un brouillon : l'utilisateur ne reconnaît pas le libellé (et réclame à sa banque), l'app ne peut afficher ni logo ni fiche, l'analyse comportementale est pauvre, et le scoring perd en finesse. Un libellé enrichi (« Carrefour Express, 23/04, 75011 Paris, Alimentation › Supermarché ») est infiniment plus utile qu'un CB CARREFOUR EXP 23/04 brut.
Détection d'abonnements : le cas d'usage star
Identifier les paiements récurrents est devenu un service à part entière (Truebill aux US, Bankin' Subscriptions, Bridge Subscriptions) :
- repérer la récurrence (mensuelle, annuelle, hebdomadaire) ;
- regrouper les variantes de libellé sous un même abonnement ;
- détecter les hausses de prix (Netflix qui passe de 13,49 € à 17,99 €) ;
- assister la résiliation (loi Chatel, intégration directe avec certains marchands).
Sources de données
- MCC + nom marchand : fournis par les réseaux (Visa, MC, CB).
- Pappers, INPI, RCS : fiches entreprise françaises.
- OpenStreetMap, Google Places, Yelp : points de vente géolocalisés.
- Logos : bases publiques (Logo.dev, Brandfetch) ou propriétaires.
- Listes d'abonnements : maintenues manuellement et complétées par ML.
- Facteurs d'émission carbone : ADEME (Base Empreinte), Doconomy.
Ce que l'enrichissement n'est pas
- Pas une re-catégorisation : il complète la catégorie, ne la remplace pas.
- Pas toujours parfait : un libellé très ambigu reste pauvre. Cible : 80 à 95 % des transactions carte, 30 à 60 % des virements.
- Pas régulé : il s'appuie sur des données publiques ou propriétaires, sans agrément spécifique.
- Pas anodin pour la vie privée : géolocaliser toutes les transactions soulève des questions RGPD, d'où la nécessité d'un consentement et d'une finalité claire.
Dans l'écosystème PSD2
Comme la catégorisation, l'enrichissement est hors DSP2 stricto sensu, mais c'est la valeur ajoutée majeure des solutions AIS modernes. Sans lui, toutes les apps auraient les mêmes données brutes — ce qui justifie les valorisations élevées des spécialistes (Bud, Tink, Heron Data).
Exemples concrets
- Spécialistes : Bud (UK), Heron Data (UK, B2B), Tink (Suède), Powens et Bridge (FR), Yodlee Envestnet et MX (US).
- Bankin' : chaque transaction est affichée avec logo, catégorie et parfois géolocalisation, pour une reconnaissance immédiate.
- Pennylane / Qonto : enrichissement comptable — reconnaissance du fournisseur (SIREN), rapprochement avec les factures OCR, suggestion d'imputation. Gain de temps majeur pour le freelance.
- Greenly / Carbo / Helios : enrichissement carbone, chaque dépense devenant des kg de CO2 estimés.
- Détection d'abonnement : Bankin' identifie ~30 abonnements par utilisateur, dont 3 à 5 oubliés — soit 50 à 150 € d'économie potentielle par an.
- Coût : un enrichissement complet (logo, géo, abonnement, MCC, SIREN) coûte 0,002 à 0,02 € par transaction, souvent inclus dans une offre AIS + catégorisation + enrichissement.
- Évolution : enrichissement en temps réel (au moment de la transaction) pour des alertes immédiates de budget — déjà en place chez Lydia et Revolut sur leurs propres comptes.