Recherche

L' ère du datamining

Publié par le

Accumuler des renseignements sur ses clients et ses prospects dans des bases de données ne suffit plus. Il faut aussi pouvoir en extraire les chiffres pertinents ou les statistiques opérationnelles. C'est le rôle des logiciels d'analyse et du datamining.

  • Imprimer


Le concept récent du datamining vise à utiliser des outils d'extraction de données issues des bases commerciales ou marketing. Objectif : modéliser les demandes, préciser les requêtes, optimiser les recherches pour monter ensuite des opérations ciblées sur des segments cohérents de la base. Mais pour ce faire, il faut disposer d'abord d'une base bien renseignée, avec des données "nettoyées" (data cleansing). D'après le Meta Group, 60 à 80 % du travail consiste à nettoyer les données au préalable avant de les exploiter. « Il y a des erreurs énormes dans les projets qui nous sont soumis », constate Daniel Delorge, directeur général de SAS Institute. Les variables (voir glossaire) servent à faire des tris pertinents selon différents critères. Par exemple, pour faire une opération ciblée, il convient de déterminer les segments et les profils de la base qui correspondent aux buts de l'opération. Pour Andréa Michaux, directrice associée d'AID, « les variables d'une base de données marketing servent à ajuster le discours, l'offre, le canal de vente aux caractéristiques, aux attentes et au vécu de l'individu ». Ces données pertinentes peuvent se trouver dans des lieux différents et avoir des niveaux de détail distincts. D'où l'importance de la qualification des bases de données marketing et des outils d'extraction.

Une nébuleuse de concepts


Comme toute nouvelle méthode, le datamining est difficile à définir précisément, et chaque fournisseur de solutions a son idée de la chose, d'autant plus qu'il est spécialisé sur un segment donné : VPC, grandes entreprises ou PME. La société d'études Meta Group recense ainsi 400 fournisseurs de solutions de datamining dans le monde ! Difficile de faire le tri dans cette nébuleuse, les concepts de datawarehouse (entrepôts de données), datamining, analyse de données, s'enchevêtrant à profusion. Sans compter qu'interviennent aussi des notions un peu ésotériques comme les réseaux neuronaux, la modélisation, les hypercubes, le clustering (classification) et d'autres encore (voir glossaire). Ce métalangage d'informaticien peut effrayer les non-spécialistes, qui sont pourtant les utilisateurs finaux de ces produits. Le programme choisi doit donc être utilisable par les responsables opérationnels, directeur commercial ou marketing, par exemple, sans qu'ils aient à appeler à la rescousse leur service informatique au premier ennui. Selon Sylvain Ballu, directeur associé d'AMM Consulting et AMM Ingenierie Service, « le succès d'un outil de type datamining doit beaucoup à l'acceptation psychologique de toutes les parties prenantes : marketing, commercial et informatique. Et comme ces outils engendrent souvent des conflits entre les différents services, il faut absolument que la direction générale soit très sensibilisée à ce genre de solutions ». Très utilisés aux Etats-Unis et en Grande-Bretagne, les logiciels de datamining sont encore récents en France, ce qui n'empêche pas l'offre d'être déjà considérable.

Des outils puissants pour les gros volumes


Parmi les prestataires spécialisés dans les logiciels ciblés VPC, AZ Informatique (11 millions de francs de chiffre d'affaires) se positionne sur ce créneau avec un produit pour AS 400 d'IBM, VPC 400 et un autre plus récent en mode client/serveur, VPC C/S. Ils permettent de gérer des clubs, des abonnements en presse magazine, faire de la gestion de stocks, etc. Formatés pour traiter de très gros volumes (jusqu'à 70 millions de caractères en ligne), ces logiciels ont nécessité 17 millions de francs d'investissements. Le coût pour le client dépend du nombre de licences achetées, la fourchette allant de 150 000 à 1,50 million de francs. Apparemment, ce type d'outil intéresse beaucoup les sociétés à réseaux de vente : « Nous sommes inondés de demandes. Bon nombre d'entreprises ont des solutions maisons vieillissantes, qui ne supportent pas l'an 2000 ou l'euro », explique Jacques Azoulay, P-dg d'AZ Informatique. Le Club Européen du Multimédia a acquis la version VPC 400 pour sa base de données de 150 000 adresses. Le choix a été fait après avoir étudié les divers progiciels complets adaptés à la VPC. « Le produit d'AZ possède toutes les fonctions recherchées, y compris la gestion de club, ce qui constitue notre activité », explique Hervé Vallin, directeur informatique et logistique. Autre point fort : la solidité du serveur AS 400 et la possibilité de faire des états et des analyses sur des segments de la base. « Les vépécistes essayent tous de se distinguer au niveau du marketing. Les outils d'analyse des données nous aident à y parvenir », ajoute Hervé Vallin. Mais le fait de travailler avec un progiciel entraîne une certaine dépendance vis-à-vis de la société prestataire, contrairement à un développement interne. Ainsi, Le Club Européen du Multimédia va migrer sur un système informatique équipé d'un nouveau microprocesseur, ce qui entraîne une révision et une mise à niveau du logiciel. Toujours pour les gros volumes, SAS Institute vient de lancer Enterprise Miner, module qui tourne, par exemple, à la Redoute ou chez Metro. Ce logiciel est utilisable à la fois par des analystes comme par des non-informaticiens, grâce à une arborescence visualisée à l'écran. Situé sur un serveur Windows NT, le programme va chercher les données sur un autre système, qui peut être un PC ou un mainframe (gros système), les rapatrie et les structure.

Le datamining au service de la fidélisation


D'après la société américaine de téléachat Home Shopping Network, qui utilise les produits de SAS, le retour sur investissement serait rapide, puisqu'elle a dégagé un chiffre d'affaires de 36 millions de dollars dès la première année d'utilisation. Autre avantage de ce produit : il permet de récupérer les informations de tous les types de bases de données (Oracle, DB2, Informix, etc.), ce qui n'est pas le cas de tous les logiciels du marché. Le coût dépend de la puissance du système sur lequel va tourner le programme, de 7 000 francs pour un PC à 200 000 francs pour un mainframe, plus les services afférents, soit un coût global d'environ 500 000. Ce qui positionne le logiciel sur la cible des grandes entreprises qui ont un projet impliquant de gros volumes de données à traiter. C'est, par exemple, le cas chez C-Link, filiale de Lafayette Services qui gère des programmes de fidélisation pour Cofinoga (programme Points Ciel) et bientôt pour d'autres distributeurs. Cette société spécialisée dans le marketing client utilise SAS depuis 1994. « Les modules couvrent tous les besoins en matière d'analyse de la décision », précise Alain Parize, directeur général. C-Link s'en sert même pour le développement d'applications qu'il commercialise ensuite à ses clients. La base de données Points Ciel est conséquente, puisqu'elle fait 200 gigaoctets (milliards de caractères) pour 1,5 million de clients. Mais ce qui intéresse surtout Alain Parize, c'est la capacité du programme SAS à « répondre à toutes les questions en matière d'analyse des données ».

Cibler le marketing opérationnel


Par exemple, le produit est efficace pour modifier les règles de récompense des adhérents du programme de fidélisation. De plus, le directeur général de C-Link pense que cette gamme de modules est suffisamment répandue pour que ses clients aient au moins un statisticien capable de l'utiliser. Quant au datamining qui sera possible avec Entreprise Miner (que C-Link possède mais n'utilise pas encore), il représente pour Alain Parize « la petite pointe de la pyramide. Cela ne sert pas à grand-chose si l'on n'a pas déjà bien travaillé ses données de manière classique », affirme-t-il. Toujours dans la catégorie "gros volumes", Marketic One de Marketic Conseil (filiale base de données de DDB Rapp&Collins) se positionne comme « le leader français des progiciels de marketing opérationnel », selon Didier Perraudin, directeur commercial. Ce produit permet de gérer toute base de données marketing (clients, prospects) et d'exploiter cette base pour réaliser des opérations de marketing direct, de ciblage, de comptage ou des mises à jour. Indépendant des types de bases de données relationnelles, Marketic One est orienté vers les grandes entreprises. « Plus les volumes sont importants, plus le programme est efficace », souligne Didier Perraudin. Entièrement architecturé en client/serveur, le progiciel est destiné à être utilisé par les responsables marketing. Il revient à environ 500 000 francs pour équiper l'ensemble des marketers d'un grand siège social. Ciblé sur les opérations, le programme ne fait pas de datamining mais peut travailler avec un outil de ce type. Par ailleurs, un nouveau module, Marketic One Fidélité, vient d'être lancé à la SIMD : il vise à mettre en place, suivre et mesurer l'efficacité commerciale des programmes de fidélisation.

Des produits packagés


Arrivé récemment sur ce marché : Total Marketer d'AID (20 millions de francs de chiffre d'affaires). Spécifiquement marketing, ce logiciel est destiné à traiter de gros volumes de données. Orienté grands comptes, plutôt pour des produits de grande consommation, il est destiné à faire des requêtes, du comptage, du ciblage, etc. Produit américain adapté pour la France, il équipe déjà 400 clients dans le monde dont la moitié dans la banque-assurance mais un seul en France, le Club Méditerranée. « Le temps de réponse est un des avantages du produit, puisqu'il peut traiter dix millions d'enregistrements à la minute pour une requête », précise Philippe Hassid, responsable commercial d'AID. Le coût du programme englobe le logiciel et le conseil et il est fonction du volume de données à traiter, de 500 000 à 1 million de francs environ. Au Club Méditerranée, le service marketing l'utilise pour ses campagnes de marketing direct et la mesure de leur efficacité. « Nous voulions être autonomes vis-à-vis du service informatique et acquérir une plus grande rapidité », explique Brigitte Pouchoulin-Richard, responsable du marketing direct. La base de données comprend 1,4 million d'adresses et un historique de dix ans. Néanmoins, l'utilisation du progiciel se heurte à un problème structurel : il faut sortir le fichier du système informatique, le compresser et l'introduire dans Total Marketer. L'interrogation de la base ne se fait donc pas en temps réel. De plus, l'utilisation n'est pas assez conviviale aux dires de la responsable du marketing direct mais la version sous Windows à venir devrait améliorer la consultation. Le Club Méditerranée utilise en parallèle un autre logiciel, Harry Client d'Adviser (filiale d'IBM) qui permet de faire du comptage, de l'extraction et de la simulation. Mais le datamining n'est pas pour autant réservé aux grosses sociétés manipulant des millions de données. Il existe des produits packagés destinés à des utilisations marketing ou commerciales plus modestes en termes de volume. Alice d'Isoft (11 MF de CA), logiciel d'analyse de données, permet, par exemple, de déterminer le profil des clients en expliquant les champs (caractéristiques) les plus importants. Ce programme cible les secteurs de la banque, de l'assurance, des laboratoires pharmaceutiques ou des télécoms. Il fonctionne sur toutes les bases de données, selon Raphaëlle Thomas. « Quand on ouvre Alice, on va chercher les données sur la base, le logiciel les transforme et les importe sur le PC de l'utilisateur. Une fois transformées dans notre configuration, on peut les analyser », détaille la responsable du développement international.

Datamining par métiers


Le datamining se fait par métiers et l'information est disponible en ligne et en direct. « Il est possible d'envoyer un mailing directement à partir de la sélection effectuée à l'aide du logiciel », ajoute Raphaëlle Thomas. Fonctionnant sur un PC sous Windows, Alice coûte de 12 500 à 25 000 F par licence. Simple à utiliser selon Isoft, il ne demanderait qu'une demi-journée de formation. Mais, comme toujours, il faut que les données de la base soient utilisables, d'où le test préalable que réalise la société sur les informations à traiter. Smart Miner de Grimmer Logiciels (4 MF de CA) est un logiciel de datamining au prix accessible (5 900 à 10 500 F par licence), qui permet de créer des arbres de décision, de la classification, du scoring ou encore de la modélisation par réseaux de neurones. Orienté vers la gestion de commerciaux, il aide à la segmentation de la clientèle en sélectionnant les variables les plus discriminantes. Il fonctionne sous Windows et utilise des fichiers Access (de Microsoft) en mode natif. « Notre cible vise les sociétés qui ont entre 2 000 et 500 000 clients ou prospects », détaille Jean-François Grimmer, P-dg. Très récent, ce produit n'a pas encore trouvé de client mais la société revendique plusieurs références comme France Télécom ou EDF pour ses autres produits Question (enquêtes), Statbox (statistiques sur Excel) ou Neurotext (analyse automatique de texte). Parmi les fournisseurs de logiciels d'analyse de base de données, il y a évidemment une forte offre nord-américaine, comme le produit Knowledge Seeker du Canadien Angoss, distribué par Cognos. Les grands de l'informatique offrent le plus souvent des solutions de partenaires. IBM a développé ses propres outils de datamining comme Intelligent Miner. Le leader de l'informatique a regroupé son offre sous le vocable de "business intelligence" ou intelligence économique et équipe des sociétés comme le distributeur anglais Safeway, qui s'en sert pour son programme de cartes de fidélité ABC, le fabricant d'électroménager allemand Miele (suivi des fournisseurs et des réseaux de vente), ou Mag Info, filiale de Lafayette Services, qui utilise Intelligent Miner pour faire du datamining sur la segmentation de clientèle des magasins du groupe. La problématique principale de ce type d'outils semble être la capacité des sociétés orientées marketing à choisir le progiciel adéquat au sein d'une offre multiforme. Définir ses besoins, nettoyer sa base puis tester les différents prestataires sont donc les trois étapes indispensables avant l'acquisition d'un produit de datamining. Prochain chantier à envisager : la consultation à distance des bases de données via le Web.

Glossaire


Arbre de décision : technique visuelle permettant de diviser les données en groupes basés sur les valeurs des variables. Classification : technique de datamining. Deux types existent : classer les éléments dans des classes connues (bons et mauvais clients, par exemple) ou regrouper les éléments ayant des comportements similaires dans des classes inconnues au départ. Client/serveur : architecture informatique dans laquelle un serveur stocke les informations et les envoie aux postes clients. Clustering : classification du second type. Datamart : base de données orientée sujet mise à la disposition des utilisateurs dans un contexte décisionnel décentralisé. Datamining : ensemble des technologies susceptibles d'analyser l'information d'un datawarehouse pour trouver des corrélations dans les données. Datawarehouse : "entrepôt de données", base de données spécifique au monde décisionnel et destinée principalement à analyser les leviers "business" potentiels. Multidimensionnel : caractérise une base de données dédiée au décisionnel stockant les données sous forme de tableaux. OLAP : on line analytical processing. Ce terme désigne souvent les outils d'analyse s'appuyant sur des bases de données multidimensionnelles. Réseau de neurones : processus permettant, à partir de variables, de découvrir la valeur d'une ou plusieurs autres variables. Variable : les données étudiées dans un datawarehouse par un outil de datamining se décomposent en lignes et en colonnes. Chacune de ces colonnes représente une variable, soit une propriété des éléments considérés. Glossaire effectué à l'aide de l'ouvrage Le Datawarehouse et le datamining de Jean-Michel Franco et EDS Institut Prométhéus, éditions Eyrolles.

Un progiciel au service du caritatif


Les associations caritatives n'ont qu'une richesse : leurs donateurs. Et un outil unique, leur base de données. Chez Médecins du Monde, par exemple, la base contient 1,2 million de noms. « C'est notre patrimoine, à part cela, nous n'avons rien », affirme Philippe Lévêque, directeur marketing. En 1996, Médecins du Monde fait un appel d'offres pour remplacer son ancien système informatique peu adapté aux exigences d'un marketing direct moderne. « Pour extraire un segment de 500 000 noms de la base, il nous fallait quatre jours ! », poursuit Philippe Lévêque. Médecins du Monde étudie alors la possibilité d'un développement spécifique, regarde vers des produits canadiens, et opte finalement pour Marketic One de Marketic Conseil. Ce progiciel intéresse Philippe Lévêque pour plusieurs raisons. D'abord par son côté standard, l'organisation ne disposant d'aucun informaticien ; ensuite, parce que les sociétés qui utilisent déjà le produit (Elf, SFR, Bouygues Telecom) lui semblent capables de réclamer et d'obtenir certains développements ; enfin, parce que la société appartient à un groupe de communication suffisamment solide pour qu'il y ait pérennité du choix. Philippe Lévêque fait alors tourner Marketic One pendant six mois, en doublure de son ancien système, pour vérifier qu'il n'y a pas de problème. Installé mi-1997, le progiciel est mis en production début 1998. Médecins du Monde s'en sert pour extraire des segments de donateurs et faire des mailings ciblés, pour consulter et modifier les profils et rajouter des commentaires, grâce à une fonction qui permet de renseigner ce champ. Le directeur marketing l'utilise aussi quotidiennement pour faire des statistiques. « Dans ce domaine, il manque de puissance », précise Philippe Lévêque. Néanmoins, l'association se déclare satisfaite du produit qui permet par exemple d'abaisser le temps d'extraction de 4 jours à deux heures pour 500 000 noms. Et pour les comptages simples : à peine une minute.

Comment choisir son outil d'analyse de la BDDM


L'offre en progiciels d'analyse de bases de données marketing est conséquente. Difficile de s'y retrouver, surtout quand on n'est pas informaticien. Sans compter que certaines sociétés auraient plutôt intérêt à s'orienter vers un développement spécifique. La société Action Micro Marketing Consulting se propose d'aider les entreprises à faire le bon choix. Sylvain Ballu, directeur associé et ancien d'AID, a mis au point une méthode en six points qui permet de choisir la solution adéquate. « Nous envisageons tous les scénarios, nous décrivons les avantages et les inconvénients du spécifique comme des progiciels », explique Sylvain Ballu. Au programme également : audit du système d'information, cahier des charges, recommandations sur le choix des solutions, formation des administrateurs de la base. Les deux critères majeurs du choix sont la fiabilité du prestataire et les capacités d'évolution de l'entreprise et du progiciel. Europcar, Atos et France Télécom ont déjà bénéficié de ses conseils. Parallèlement, la société AMM Ingénierie et Service commercialise une gamme de progiciels comme Phoenix Vente Marketing (gestion de bases de donnés marketing), Versatility (services clients, SAV), Digi-Tao et Phonelly (marketing direct et télémarketing). Sylvain Ballu revendique néanmoins une totale objectivité pour son activité conseil : « Nous ne proposons pas obligatoirement nos produits. Par exemple, Europcar a choisi au final Business Manager, que nous ne commercialisons pas. »

PATRICK CAPPELLI

Big Année et Bonne data !

Big Année et Bonne data !

Big Année et Bonne data !

Avec la collaboration de Thiery Vallaud*, éminent spécialiste du datamining, nous vous proposons d'aborder la data science et le big data sous [...]

Publicis Groupe acquiert ETO

Publicis Groupe acquiert ETO

Publicis Groupe acquiert ETO

Publicis Groupe va étoffer son offre de services dans le secteur du CRM et du datamining avec l'acquisition de l'agence de marketing relationnel. [...]

Datamachin, data qui ? Data quoi? mais non dataminer !

Datamachin, data qui ? Data quoi? mais non dataminer !

Datamachin, data qui ? Data quoi? mais non dataminer !

Ecrit avec la collaboration de Thierry Vallaud*, spécialiste du datamining, nous vous proposons d'aborder ce métier et cette expertise sous [...]

Soft Computing choisit IBM SPSS

Soft Computing choisit IBM SPSS

Soft Computing choisit IBM SPSS

Le spécialiste du datamining, de la business intelligence et du CRM intègre le logiciel IBM SPSS dans son offre "Big Data Marketing".

Fnac.com souhaite mieux connaître ses clients

Fnac.com souhaite mieux connaître ses clients

Fnac.com souhaite mieux connaître ses clients

Fnac.com a choisi la solution de datamining Coheris Spad pour développer une connaissance plus fine de ses clients et mieux anticiper leurs [...]

Amabis distribue le logiciel DataLab de Complex Systems

Amabis distribue le logiciel DataLab de Complex Systems

Amabis distribue le logiciel DataLab de Complex Systems

Déjà partenaires depuis plusieurs années, Amabis et Complex Systems étendent leur collaboration à la distribution de la nouvelle version de [...]

Les techniques du scoring

Les techniques du scoring

Les techniques du scoring

Voici quelques méthodes de scoring passées en revue par Mahamoud Azihary, directeur de Cofidis Datamining.