Recherche

Un domaine de recherches

Publié par le

Trop souvent banalisé et vendu à moindre coût, le traitement de l'adresse ne se borne pas à la normalisation et déduplication, même si ces opérations nécessitent un savoir-faire allant au-delà du simple traitement de fichiers. Aujourd'hui, l'adresse sert aussi à enrichir la base de données marketing. Tous ses éléments sont analysés, contrôlés, depuis le code postal jusqu'au prénom, afin que la base de prospection soit en adéquation avec la cible.

  • Imprimer


«En matière de traitement de l'adresse, la première chose à dire, c'est que les fichiers sont loin d'être parfaits. » Yves Allard, P-dg de Chronaxies, n'a pas l'habitude de peser ses mots. Pour preuve, il cite comme exemple le Trophée de la Qualité de l'Adresse organisé par le SNCD (Syndicat national de la communication directe) dans le cadre de la dernière SIMD (Semaine internationale du marketing direct). Afin de désigner les lauréats du Trophée 1999, 25 demandes de documentation - composées de libellés volontairement altérés - avaient été envoyées aux 50 membres les plus importants du SEVPCD (Syndicat des entreprises de vente par correspondance et à distance). « De nombreux annonceurs avaient été éliminés en 1998. En 1999, nous avons repris le classement à partir des messages reçus fin 1998. Tous les fichiers auraient dû être restructurés, cela n'a pas été le cas. Seuls Maty et France Loisirs ont résisté au test et ont été couronnés », commente-t-il. Alors, rien de nouveau sous le soleil ? Outre, la volonté du SNCD d'inciter à l'optimisation des adresses, colonne vertébrale du marketing direct, La Poste, souvent critiquée pour son manque de réactivité, est saluée par la plupart des professionnels du traitement de l'adresse pour ses efforts en matière de référentiels postaux.

Les efforts de la poste


Après une période d'incertitudes concernant les responsabilités respectives du SNA - le Service national de l'adresse - et Médiapost, la situation est désormais éclaircie. Médiapost se charge de la commercialisation de certains fichiers, la tarification étant établie conjointement avec le SNA. Désormais, six fichiers sont commercialisés par Médiapost (voir encadré). Le fichier Code Postal (celui des communes/ bureaux), le fichier Routage Distribution comportant les localités de plus de 30 000 habitants, le fichier Cedex et le fichier Routage/presse 205/206. Auxquels il faut ajouter deux nouveaux fichiers : Hexavia, le répertoire des voies des communes de plus de 5 000 habitants, et Cedexa, le répertoire des codes Cedex valides et la liste des entreprises avec leur numéro de Siret et leur adresse géopostale, un fichier qui devrait remplacer le fichier Cedex traditionnel. De son côté, le SNA commercialise le fichier Estocade, répertoire des anciennes adresses issues des abonnements de réexpédition échus, et le service Charade, restitution des nouvelles adresses à partir des abonnements de réexpédition. « La mise à disposition de ces fichiers prouve que La Poste fait des efforts », précise Yves Allard. Une initiative également saluée par Jacky Bertrand, directeur de marché logistique chez Koba, même s'il pondère sa satisfaction. « On constate un effort en matière de commercialisation, mais il reste encore des points à améliorer. Le fichier Hexavia ne comporte pas le code des quartiers, ce qui oblige à acheter également le fichier des voies/distribution. De même, le fichier Hexavia est codé sur 38 caractères, alors que le fichier des codes postaux est en 32 caractères. Cela dit, même si on a du mal à comprendre leur démarche commerciale, on ne peut que saluer leurs efforts. » Pierre Jabouley, directeur commercial de Cortex Laser, précise quant à lui : « Avant, avec le fichier des villes de plus de 30 000 habitants, on disposait d'un référentiel sur 50 à 60 % de la population. Maintenant, avec celui des villes de plus de 5 000 habitants, on devrait couvrir 80 à 85 %. Cela va nous permettre de mieux restructurer les adresses, réduire les NPAI - les adresses obsolètes - et mieux dédoublonner les fichiers. »

Trop de NPAI


Une des plus grosses sources de pollution d'adresses, ce sont les NPAI, les envois non-aboutis par erreur d'adresse. Même si des fichiers sont mis à disposition par La Poste pour les contrôler, il n'en reste pas moins qu'ils ne permettent pas de les traiter tous. Et les NPAI restent une source de perte d'argent. La solution la plus évidente serait de comparer les retours avec les fichiers originaux des envois. On trouverait aisément les adresses obsolètes. Mais la déontologie interdit au prestataire de fournir ces fichiers aux annonceurs. Deux technologies sont proposées pour pallier cet interdit. Celle de Chronaxies, appelée CPFF, recourant au cryptage, et celle de Data Square (voir encadré). Chez Raja, le n° 1 de l'emballage par catalogue, qui diffuse environ 500 000 catalogues par mois, le problème des NPAI est crucial. « Compte tenu des volumes de catalogues envoyés, les NPAI représentent une quantité non-négligeable à traiter, une centaine de milliers par an, tient à souligner Christophe Lafolie, qui travaille au service base de données chez Raja. De plus, le délai de latence entre la sélection des adresses, l'envoi des catalogues et les retours de NPAI peut aller jusqu'à trois ou quatre mois. » Auparavant, les NPAI étaient traités à la main. Il fallait compter les retours, les trier selon les opérations, les stocker. 2 000 NPAI pouvaient être traités en une semaine. Depuis environ six mois, Raja utilise la technologie Data Square, et les envois sont accompagnés d'un code spécifique, imprimé sur chaque envoi par une imprimante laser VideoJet lors de la mise sous-film. Il contient l'adresse du destinataire. Et, lorsque les retours arrivent, il suffit de scanner le code ; l'adresse pouvant être comparée instantanément avec le fichier des envois. « Aujourd'hui, ajoute Christophe Lafolie, la même personne, qui traitait 2 000 NPAI par semaine, le fait en une journée. » En outre, le code peut être lu à travers un film plastique, ce qui permet d'accélérer encore le processus. « Avant, sur nos fichiers internes, nous recevions les NPAI, nous les pointions une première fois et ce n'est qu'au deuxième retour qu'on annulait l'adresse. Maintenant, grâce au temps gagné, on peut le faire dès le premier retour », précise-t-il. Pour les fichiers externes, de type Kompass, avec une méthode classique, il fallait découper la partie adressée et la renvoyer au fournisseur de fichier. Avec Data Square, il suffit de restituer un fichier magnétique, car les références des fournisseurs de fichiers sont intégrées dans le code Data Square. « Nous contribuons à améliorer les fichiers d'adresses, ce que très peu de vépécistes font. Notre démarche en partenariat avec les fournisseurs de données fait que tout le monde est gagnant. En outre, Data Square nous permet également de vérifier nos remontées sans que nous ayons à ressaisir les données initiales, tant en termes d'adresse que de type d'opération », poursuit Christophe Lafolie. Ce système fonctionne depuis six mois chez Raja. Les résultats, largement positifs permettent, après une période de test dans le processus industriel, de l'appliquer à la majorité des opérations de ce vépéciste.

Coûts postaux doublés ou même triplés


Pour bénéficier de tarifs avantageux lors de l'envoi d'un mailing, le premier traitement à effectuer sur un fichier d'adresses, c'est de le normaliser, afin que les adresses soient aux normes postales. Chacune des six lignes de l'adresse - les volets - doit être inscrite sur une longueur maximale de 32 caractères. « Souvent, les annonceurs gèrent leurs adresses sur 40 caractères, indique Jacky Roux, directeur commercial de DMG (Direct Marketing Gestion). Avec l'expansion de la micro-informatique, chacun s'est réinventé une structure personnelle, avec ses propres règles. Une adresse contient des informations géographiques, postales, des noms, des prénoms, des fonctions. Et, lorsqu'il faut réduire à 32 caractères, on peut perdre des informations. Nos logiciels possèdent des tables qui permettent de garder les informations signifiantes, tout en abrégeant le pavé adresse. » Et Yves Allard d'enfoncer le clou. « La gestion de l'adresse, c'est très compliqué. Un exemple : Annecy. Cette ville est composée de deux communes. Annecy et Annecy-le-Vieux. Elles sont contiguës, mais administrativement différentes selon l'Insee et postalement différentes. Un mailing incorrectement adressé à Annecy, alors que la bonne adresse est à Annecy-le-Vieux dépendra du bon vouloir du facteur. » Chez Sopres, on utilise un dictionnaire exclusif, le Dictionnaire des Voies, qui reprend les 1 200 000 voies de France, identifiées chacune par un numéro et assorties de nombreuses variantes orthographiques. Grâce à lui, la voie est toujours reconnue et éventuellement corrigée, mais le dictionnaire précise également le code postal de chaque voie ou segment de voie. Une fois l'adresse normalisée, il s'agit de procéder à la déduplication. Concrètement, pour effectuer un mailing, on loue des adresses à différents fournisseurs, et les mêmes adresses peuvent apparaître dans plusieurs fichiers. Lorsqu'un même mailing vous arrive plusieurs fois, c'est que la déduplication a été mal effectuée. A la clé, des coûts postaux doublés ou même triplés et une très mauvaise image de marque. Pour Philippe Cheval, directeur général de BCA, « la déduplication n'est pas exclusivement un problème d'informaticien, mais un mix d'informatique, de statistique et de décisionnel. Il faut manier les lois de probabilité. C'est un univers de paramètres qui permet de mesurer avec précision la probabilité de ressemblance d'adresses entre elles. Le traitement doit être à la fois phonétique, analogique et statistique ». Un exemple, quel est le degré de ressemblance entre le champ d'adresse “boulevard Sébastopol” et “bd. de c'est bath. opol” ?

Sue-Ellen et Charles-Edouard


Concrètement, la déduplication suit en général une logique constante. « Nous travaillons sur les lignes adresses les plus longues possible, on peut aller jusqu'à 50 caractères par volet, explique Jacky Roux. La première action, c'est de vérifier le code postal, le bureau de distribution et de calculer le code Insee de la commune. Ce code donnera la taille de la commune et permettra de contrôler le nom de la voie pour les communes de plus de 5 000 habitants. Ainsi, on contrôle le numéro de la voie, on resserre l'étau et on remonte vers le nom du prospect. » Pour les opérations vers des personnes physiques, on vérifiera les noms, prénoms au moyen de tables référentielles des prénoms. Ces prénoms de plus en plus cosmopolites complexifient l'opération. Un exemple : Duc, qui peut être un nom ou un prénom en vietnamien, mais aussi, bien sûr, une civilité. « Des tables différentes doivent être utilisées selon les opérations, précise Jacky Rou... Par exemple, pour une opération dans le Sud-Est de la France, on utilisera des tables comportant des prénoms italiens. » Yves Allard renchérit : « Ceux qui ne saisissent pas les prénoms perdent une information potentielle très importante. On connaît la distribution des prénoms depuis près de cent ans. Cela permet d'estimer l'âge du prospect, d'autant que les prénoms ont aussi une valeur socioculturelle. » Une habitante du Nord prénommée Sue-Ellen n'aura pas le même statut qu'un Charles-Edouard. De même, une Mathilde aura toutes les chances d'avoir 80 ans ou entre 4 et 10 ans ! De son côté, BCA en profite, en sortie de déduplication, pour analyser les fichiers selon des variables, les Téléstyles, qui prennent en compte l'habitat, l'environnement social et le niveau de ressources des ménages. « Cela permet de contrôler que la base de prospection est en adéquation avec la cible visée », précise Philippe Cheval.

Déduplication dynamique


Chez Koba, on pratique la déduplication dynamique. « Nous traitons les adresses au fur et à mesure de leur arrivée », énonce Jacky Bertrand. En effet, sur de grosses opérations, les annonceurs ne fournissent pas les fichiers en même temps, mais jour après jour. « Si le premier jour, je reçois quatre fichiers de 25 000 adresses. Sans attendre les suivants, nous commençons la déduplication, poursuit-il. Chaque adresse aura un statut, unique ou multiple, dont on conserve les informations. Lorsque les autres fichiers seront arrivés, on les dédupliquera avec les résultats des quatre premiers, et ainsi de suite. » Résultat : un confort accru pour l'annonceur et une meilleure réactivité. « Lors d'une opération pour un vépéciste, on s'est aperçu d'une erreur de sélection de fichier, ajoute Jacky Bertrand. Un fichier représentant les actifs de moins d'un an avait été confondu avec celui des actifs de plus d'un an. Nous avions deux fois les mêmes adresses. Nous nous en sommes rendu compte avant la date de dépôt. Nous avons alors pu le masquer et le remplacer par un fichier correct. Sans déduplication dynamique, il aurait fallu retraiter la totalité des fichiers, soit 8 millions d'adresses. » Reste qu'une déduplication nécessite un personnel compétent et une organisation précise. Chez BCA, un réceptionniste est chargé de récolter les bandes magnétiques et contacter le client. Un opérateur encode les fichiers, il lit les bandes, vérifie les quantités et formate les disques où seront transférés les fichiers. Son niveau de qualification : BTS. Un ingénieur est chargé d'écrire le programme de déduplication et vérifie les sorties. Il est à la fois informaticien et statisticien. Son niveau : Bac +5. Enfin, un ingénieur commercial valide et édite les rapports. Ceux-ci sont de plus en plus sophistiqués, leur présentation faisant plus appel à des notions marketing. Plus question donc de présenter des listings abscons.

Normalisation européenne


A l'heure du marché unique européen et des opérations de marketing direct internationales, le traitement des adresses se complique. En Belgique, les adresses sont libellées différemment selon qu'on s'adresse à un Wallon ou à un Flamand. En Suisse, il existe trois régions - italienne, allemande ou francophone - avec des libellés également différents. « Une déduplication pour des pays appartenant à l'Union européenne prend entre six mois et un an », estime Philippe Cheval. Les pays européens travaillent sur une norme postale identique au sein de la CEN/TC à Bruxelles. Et, selon un document publié par l'Union européenne, à la fin 1999, « un standard définira les composants de l'adresse, et leurs formats et les grandes lignes pour savoir comment indiquer l'adresse sur l'élément de la lettre à poster. Le standard définira également des éléments pour les adresses postales, les champs de données spécifiques et les règles pour la présentation des informations de l'adresse dans les fichiers et sur l'enveloppe comprenant le nombre de lignes et de caractères par ligne ». Reste que les réunions dans ce type de commission, impliquant un grand nombre de pays et d'industriels, voulant tous mettre en avant leurs politiques et technologies, prennent un temps très long. Une journée pouvant se passer sur la seule définition d'un term...

Ladislaw et £adis£aw


En attendant, il faut “faire avec”. Chez OBIMD International, on utilise un logiciel spécifique “Code 1 Plus International”, qui sait restructurer les adresses de 208 pays. « Nous disposons des référentiels postaux de 71 pays. Cela nous permet de reformater automatiquement les adresses, indique Gérard Clerquin, directeur général d'OBIMD International. Nous pouvons, par exemple, éclater un mailing entre la Flandre et la Wallonie en fonction du code postal. » OBIMD dispose de tables des prénoms en fonction des pays, ce qui permet de séparer noms et prénoms selon les pays et même de transformer les caractères spécifiques de fichiers provenant de claviers “nationaux”. Ladislaw, par exemple, s'écrit aussi £adis£aw, Andrea est un homme en Italie et une femme en Norvège, Jean est un homme en France et une femme en Grande-Bretagne, mais ce peut aussi être un Français résidant en Grande-Bretagne. OBIMD a ainsi mis en place une base de données de 125 000 prénoms identifiés par pays et par sexe. « Le traitement des adresses sert aussi à alimenter la base de données marketing, ajoute Jacky Roux. Les fichiers sont de plus en plus riches, mais leurs structures ne sont pas les mêmes selon leurs destinations. Une adresse destinée à un mailing n'a pas la même structure que si elle est destinée à être utilisée par un livreur de produits. Dans ce cas, ce sont les informations géographiques qui sont importantes. Pour un fax mailing, c'est encore différent. » Et, avec la montée en puissance des commandes sur Internet, le traitement des adresses devient crucial. Ainsi OBIMD est en train de mettre au point un produit destiné à normaliser directement les adresses internationales à partir du Web, en business to business comme pour les particuliers. Ce produit permettra, par exemple, de traduire automatiquement une documentation technique de constructeur automobile écrite en français en japonais, si le prospect remplit sa demande dans cette langue. Le traitement de l'adresse est un domaine de recherches. Louis Renaudin, membre du directoire de Koba le confirme : « Avec les outils d'analyse dont nous disposons, nous pouvons affiner les analyses de recrutement, ou encore le géocodage. En anticipant le fait que la remise postale va diminuer et que nous serons de moins en moins rémunérés pour la préparation et le tri, nous avons gagné en productivité en amont, dans le traitement de l'adresse. »

Les référentiels indispensables pour traiter ses adresses


Traiter ses adresses afin d'obtenir le mailing le plus efficace possible, c'est d'abord disposer de fichiers permettant de corriger ses adresses. Médiapost commercialise six fichiers indispensables. Le Fichier “Code Postal” permet de contrôler les codes postaux des 36 000 communes de France et de vérifier l'orthographe des localités existantes en France. Le fichier “Hexavia” permet de réaliser la normalisation des adresses et de procéder à des études géomarketing. Il référence les 500 000 voies et leurs synonymes pour les 1 850 localités de plus de 5 000 habitants, soit 60 % de la population française. Le fichier “Cedex” permet de contrôler les Cedex et de vérifier l'orthographe des 2 000 bureaux distributeurs Cedex. Le fichier “Cedexa” permet de réaliser la normalisation des adresses Cedex. Il contient l'exhaustivité des 150 000 entreprises ayant un Cedex avec leur code Siret et leur adresse géopostale. Le fichier “Routage Distribution” permet de réaliser un routage de presse. Il comprend les voies des localités de plus de 30 000 habitants et les localités TDM - Tri Distribution Mécanisé - distribuées par les facteurs. Il indique les indicatifs de distribution pour chacune des voies distribuées par les facteurs. Le fichier “Acheminement Presse” attribue les numéros de “Côtés” par Centre de Traitement du Courrier en fonction des codes postaux et des Cedex pour la France Métropolitaine et les DOM (routage 205/206). Il attribue les bureaux d'échanges, les façades et les cases pour tous les pays étrangers et les TOM en expédition économique ou prioritaire (Routage 207). Il est indispensable pour obtenir des tarifs d'affranchissement plus avantageux et bénéficier d'une plus grande rapidité d'acheminement.

Lutter contre la ressaisie


Si le traitement de l'adresse lors de l'envoi d'un mailing est délicat, l'analyse des remontées des mailings devrait être simple. Les adresses ont été saisies une fois, il suffit de les comparer avec celles provenant des retours. Mais ce serait trop simple. Lors d'une prospection, l'utilisateur d'un fichier n'en est pas possesseur. Le prestataire qui a réalisé les opérations de déduplication n'a pas le droit, sauf autorisation explicite de chacun des partenaires, d'utiliser ces fichiers pour contrôler les retours. Résultat, on perd l'ensemble de la prestation ; toute la valeur ajoutée est perdue. Forte de ce constat, la société Data Square a développé un concept utilisant un code bidimensionnel, crypté et facile à imprimer sur un coupon-réponse et contenant jusqu'à 500 caractères alphanumériques sur 1 cm2. « Ce code contient toutes les informations sur le destinataire de l'adresse, indique Marc-Olivier Ricordel, directeur de Data Square. Il permet dans un premier temps de détecter les NPAI par simple lecture des codes au moyen d'une douchette et ce, sans se connecter à une base de données, puisque toutes les informations sont contenues dans le code. En outre, ce code peut également contenir des données comportementales, les historiques des achats, et même identifier l'offre, sans que le prospect ait à remplir un bordereau. » Chez Chronaxies, Yves Allard propose une solution permettant aux annonceurs de n'avoir accès qu'aux seuls enregistrements correspondant aux remontées de son mailing en passant par le cryptage. Cette solution, appelée CPFF - Le cachet de la Poste Faisant Foi - consiste à crypter les enregistrements lors de la déduplication, le prestataire transmettant ces fichiers codés à l'annonceur ; la clé de décodage, individuelle et aléatoire, étant transmise par le facteur, celle-ci est inscrite sur le coupon de retour. L'annonceur disposant d'un fichier codé des envois, la clé de décodage lui permettra de détecter immédiatement les NPAI. Pour démontrer la fiabilité de son système, Chronaxies offre 10 000 euros au premier candidat qui arrivera à décoder un seul enregistrement sur un fichier de 10 000 enregistrements qui lui sera fourni.

OLIVIER BRUSSET

Pourquoi faut-il démocratiser la data ?

Pourquoi faut-il démocratiser la data ?

Pourquoi faut-il démocratiser la data ? Pourquoi faut-il démocratiser la data ?

Partager la compréhension et le traitement de la donnée à l'ensemble des métiers de l'entreprise. La démarche, data-driven, a beaucoup à apporter [...]

[Tribune] Data driven: il reste du chemin à faire!

[Tribune] Data driven: il reste du chemin à faire!

[Tribune] Data driven: il reste du chemin à faire!

Si les marques brandissent bien haut l'étendard de la data, toutes ne la gèrent pas de façon optimale, loin s'en faut. Ainsi, 62,5% des entreprises [...]

Safig Data, nouvelle entité du groupe HSK Partners

Safig Data, nouvelle entité du groupe HSK Partners

Safig Data, nouvelle entité du groupe HSK Partners

Le groupe HSK Partners vient de reprendre les activités de commercialisation de bases de données BtoB, de traitement informatique de l'adresse [...]