Recherche
En ce moment En ce moment

Petits fichiers : match-codez à la main !

Publié par le

Lorsque vous cherchez à dédoublonner un petit fichier (moins de 3 000 adresses), vous pouvez aussi bien le réaliser par vous-même avec les outils dont vous disposez. Un tableur ou un système de gestion de base de données suffisent largement. Outre l'économie qui en résulte, créer une "moulinette" bureautique vous apporte souplesse et rapidité. Mais comment allez-vous vous y prendre ?

  • Imprimer

1 Vos adresses présentent une hétérogénéité de saisie : les numéros des voies sont suivis une fois sur deux d'une virgule ; leurs intitulés comportent aléatoirement des traits d'union ou pas ; de nombreux espaces doubles en séparent les mots... De quelles fonctions et formules disposez-vous dans un logiciel bureautique comme Excel, par exemple, pour épurer votre fichier ?


RÉPONSE : L'incontournable Remplacer du menu Edition vous offre un grand nombre de possibilités : remplacer les traits d'union par des espaces (ou l'inverse) et les espaces doubles par des espaces simples, éliminer les virgules, etc. Créez une macro-commande très simplement, en enregistrant ces différentes manoeuvres grâce à Outils/Macro/Nouvelle macro.

2 Sur la plupart des systèmes de gestion de bases de données (SGBD), comme Access, Approach, 4D, Paradox..., il vous est possible de demander qu'une rubrique - le NOM, par exemple - soit considérée "unique". En d'autres termes, votre fichier ne pourra alors contenir deux prospects portant le même patronyme. Mais cette technique est par trop limitative. Sur quelles bases pouvez-vous construire un match-code facile à mettre en oeuvre dans le contexte d'un petit fichier, et adapté aux compétences restreintes d'un tableur ou d'un SGBD bureautique ?


RÉPONSE : Lorsque vous demandez à votre ordinateur de comparer vos adresses entre elles, il suffit d'une toute petite variation de saisie entre les deux adresses d'un doublon, pour que le logiciel ne s'aperçoive de rien : ETEICOS S.A. ETEICOS S.A. 4 rue Victor Hugo 4 rue Victor-Hugo 45000 Orléans 45000 Orléans Pour l'ordinateur, ces deux adresses sont différentes, si vous lui demandez de vérifier point par point leur identité : le trait d'union de la seconde joue ici le rôle du grain de sable. Tout comme l'aurait fait un "V." à la place de Victor, une virgule après le "4", un "boulevard" remplaçant "rue", etc. Comment faire alors ? Tout simplement conserver, avant d'effectuer la comparaison, les éléments les moins susceptibles de varier d'une saisie à l'autre. Dans notre exemple, vous retiendrez les trois premières lettres du nom de la société, le numéro de la rue, les trois premières lettres du dernier mot du nom de la rue, le numéro du département et les trois premières lettres du nom de la ville : ETEICOS S.A. 4 rue Victor Hugo 45000 Orléans La clef correspondante - le match-code - est : ETE4HUG45ORL. Elle est calculée instantanément par l'ordinateur, qui n'a plus qu'à la comparer avec celles des autres prospects pour vérifier si un doublon existe. Programmable dans tout bon SGBD bureautique, le "match-codage" varie d'un type d'adresse à l'autre, pour tenir compte des particularismes (CEDEX, zones d'activité etc.).

3 Une fois la structure de votre match-code déterminée en fonction de vos propres spécificités, comment allez-vous le mettre en oeuvre ?


RÉPONSE : L'outil le mieux adapté est le SGBD. Mais il n'est pas le plus simple. Tout le monde ne connaît pas sur le bout des doigts Access, par exemple, alors qu'un tableur comme Excel ou Lotus 1.2.3 a fait, bien souvent, l'objet d'une formation dans votre société. Or, notre démarche consiste ici à faire vite, simple et bien. Il suffit donc de connaître quelques formules disponibles sur un tableur pour mener à bien cette tâche. Les voici (nous avons choisi Excel du fait qu'il soit très répandu ; les formules équivalentes existent chez les concurrents de ce logiciel) : - CONCATENER (texte1;texte2; texte3...) : assemble plusieurs chaînes de caractères de façon à n'en former qu'une. Cette fonction vous permet de "coller" les différentes parties du match-code entre elles pour former ce dernier. "texte1", "texte2", "texte3..." sont en fait le résultat des fonctions GAUCHE et DROITE suivantes : GAUCHE (coordonnées d'une cellule contenant du texte ; nombre de lettres à extraire du texte) : extrait les derniers caractères à la gauche d'un texte. Par exemple, si la cellule A8 de votre feuille de calcul contient le nom de la société, "ETEICOS", GAUCHE(A8;3) extrait et affiche les trois premières lettres : "ETE" ; DROITE (coordonnées d'une cellule contenant du texte ; nombre de lettres à extraire du texte) : la même chose... mais à partir de la droite du contenu de la cellule ("COS", selon notre exemple). - TEXTE (coordonnées d'une cellule contenant un nombre ; format) : convertit en texte le nombre contenu par la cellule. Imaginons que vos match-codes soient dans la colonne G de votre feuille de calcul, ce qui revient à dire qu'une formule commençant par CONCATENER(GAUCHE(A... ; 3);... se trouve dans chaque cellule de cette colonne. Il convient maintenant de les comparer. Commencez par les trier : sélectionnez la colonne, puis utilisez Données/Trier ("étendre la sélection")/Trier par colonne : G (croissant/ligne de titre : NON). Dans la cellule située à droite de chaque match-code, incorporez une formule de comparaison. Vous avez deux possibilités : la plus simple, EXACT (G8 ; G7), par exemple. Placée en H8, cette formule compare le match-code situé à gauche (G8) avec celui qui le précède dans la colonne (G7). "FAUX" s'affiche s'il y a des variations de l'un à l'autre ; "VRAI" si les deux sont parfaitement identiques. Moins simple mais plus lisible quant au résultat : SI(G8=G7;"doublon ?";" "). Cette fois, "doublon ?" s'affiche lorsque les deux match-codes sont identiques, sinon rien n'apparaît dans la cellule, ce qui facilite le repérage visuel. Il ne vous reste plus alors qu'à vérifier "à la main", au cas par cas, s'il s'agit bien de doublons et, dans l'affirmative, à supprimer l'une des deux lignes incriminées...

Xavier Lucron

Quand le patrimoine s'ouvre aux marques

Quand le patrimoine s'ouvre aux marques

Quand le patrimoine s'ouvre aux marques

Le Louvre Opera Garnier la Colonne de Juillet ou encore eglise Saint Eustache Ces monuments parisiens se sont ouverts aux annonceurs pour des [...]

[Infographie] Les professionnels face à l'emailing

[Infographie] Les professionnels face à l'emailing

[Infographie] Les professionnels face à l'emailing

Il a seulement quelques jours loccasion du salon Paris Retail Week la SNCD et ses partenaires pour lannee 2017 Combbase EmailStrategie Kompass [...]

Comment intégrer l'eSport dans votre mix-marketing ?

Comment intégrer l'eSport dans votre mix-marketing ?

Comment intégrer l'eSport dans votre mix-marketing ?

Marques ne soyez plus AFK Grace ses audiences et des tickets entree peu onereux eSport la cote Reste aux annonceurs s emparer des codes et [...]

Avec GeoMatch, CSA fait dans le micro-local

Avec GeoMatch, CSA fait dans le micro-local

Avec GeoMatch, CSA fait dans le micro-local

institut etudes deploie une nouvelle offre de test offres et de concepts geolocalises l echelle de la plus petite division locale statistique [...]

Identifier, collecter et créer une DMP

Identifier, collecter et créer une DMP

Identifier, collecter et créer une DMP

65 des entreprises veulent investir dans enrichissement de fichiers existants dans les deux ans venir

La Big Data, le passage désormais obligé des TPE/PME

La Big Data, le passage désormais obligé des TPE/PME

La Big Data, le passage désormais obligé des TPE/PME

Si votre data est trop petite votre concurrent va vous ecraser et vous piquer votre petite copine dixit avec humour Christopher Mims sur le [...]