| |
|
|
| |
|
Genèse et balbutiements
C’était pendant la pénultième année du siècle dernier,
une base de données de quelques gigas octets paramétrée
et construite de façon simple autour du client par et pour
les utilisateurs internes en charge de la connaissance client.
Le site dit communautaire (déjà !) au nom de friandise (vous
avez deviné ?) avait pour vocation d’offrir moult fonctionnalités
de communications dont le Web mail. De jour en jour de mois
en mois à la bourse de la valeur d’un site c’était le nombre
d’internautes et le trafic (pages vues...) qui importaient,
la fameuse masse critique, aujourd’hui on parle enfin de
taux de transformation. Il fallait donc être apte à fournir
plus qu’une idée du volume de vos ID (identifiants par abonnés)
en base de données. Chacun y allait de son petit formulaire
d’inscription par mimétisme, plagiat pur et simple (sur
certains items ou formulations spécifiques d’items), d’autres
plus aptes à se projeter se disaient sans doute « engrangeons
toutes les données même les plus privatives ou les plus
inutiles, on ne sait jamais, cela peut toujours servir !».
Ainsi donc commença une «datagenèse » une préhistoire de
la donnée Web qui n’était pas de la connaissance client,
rappelons-le.
|
|

“ Engrangeons toutes les données
même les plus inutiles, on ne sait jamais, cela peut
toujours servir ! ”
|
Les données sociodémographiques de base qualifiaient sur une
base minimaliste les membres de notre site qui dans sa vocation
de Webmailer nécessitait un « sign-up ». Tris à plats tris croisés
permettaient ainsi d’extraire des états statistiques descriptifs
à vocation panoramique (les grandes données clés diffusables
en interne, à la presse et en première intention aux annonceurs).
Mais un premier saut qualitatif se fit jour quand les sites,
dont le nôtre commencèrent à s’intéresser aux centres d’intérêts
« hors site » des internautes.
A cette période beaucoup de ces questionnaires étaient soit
mal formulés (catégories « valises » des items a cocher, trop
étroites ou trop larges) soit trop longs (donc dissuasifs pour
l’internaute nouvel entrant) soit réduits au stricte minimum
(log in, mot de passe) et donc frustrant pour l’analyse de données.
Se posait donc alors au chargé d’études Web un tant soit peu
curieux et rigoureux une véritable problématique du questionnaire
d’inscription. Ce souci et cet art du questionnaire sont encore
d’actualité puisque sur certains sites (e-recrutement et Cvthèques
par exemple), l’hétérogénéité persiste d’un site à l’autre.
En effet sur nombre de ces sites on constate trop souvent au
niveau des items des questionnaires :
-
Des confusions entre secteurs, métiers et fonctions, des
référentiels différents,
-
Une absence dans les sélections de certains « nouveaux
métiers » (type Km, dataminer...),
-
Une impossibilité de sélections multiples dans certains
choix (assez frustrant).
Ici comme ailleurs on peut donc parfois s’interroger
sur la communication inter-services qui préside à la conception
« amont » de certaines bases de données en terme d’inputs notamment.
La fameuse « inculture » organique et le cloisonnement intra-organisation
encore et toujours …
|
|
| |
|
Promesses et vertiges
A cette époque la cyber-évangélisation happe frénétiquement
nombres d’annonceurs. Le cyberespace enfante et s’enfante
lui même (autopoïèse [1] ) prolifère de façon exponentiel
faisant se côtoyer créativité, arnaque, le tout et n’importe
quoi, mais aussi les germes prometteurs de sites encore
viables aujourd’hui. Naturellement un certain nombre de
fondamentaux en management, marketing, finance, logistique,
passe à la trappe et des concepts émergent ou sont réappropriés
et réinvestis d’une nouvelle identité fructueuse pour
nombre de prestataires et autres gourous (exemple le « one
to one [2] »). Et chacun connaît la suite de la transition
de la bulle à la baudruche Internet, où certains voulant
oublier où se faire oublier ont brûlé rapidement certaines
idoles adorées hier.
Audience de la mesure et mesure
d’audience
Concernant la mesure d’audience Internet, le CESP [3]
entame l’audit de certains logiciels de mesures (« site-centric »
et user-centric » [4] ) et délivre par ailleurs une
terminologie officielle des indicateurs d’audience (visite,
visiteurs...). Plus tard, en 2002, face au développement
de formats d’espaces publicitaires de plus en plus interactifs
(Rich-media) l’IAB [5] en définit les standards et entame
l’étude NetImpact II [6] sur l’efficacité publicitaire.
|
|

“ Naturellement un certain nombre
de fondamentaux passe à la trappe ”
|
Quant aux organismes d’études spécialisées ainsi que les régies
d’achats d’espaces publicitaires, ils collaborent pour s’accorder
sur de nouvelles définitions ou extensions de définitions (Bêta
de mémorisation
[7] par Carat, notion de GRP [8] Internet plus récemment) communes
et acceptées par tous. En clair, l’émergence d’une certaine
rationalisation par les méthodes (réimposer des fondamentaux)
permet de lutter contre l’entropie [9] d’un système à la complexité croissante.
Ainsi donc cette âge de l’accès et de l’excès a engendré une
multiplication des interactions et des processus qui les portaient.
Les prémisses de l’ADSL haut débit (enfin ce qu’on appelait
haut débit en France en regard de la Corée du Sud, comme quoi
tout est relatif ; notons cependant que l'offre d’aujourd’hui
tend à se mettre à la hauteur de nos ambitions, voire même à
les dépasser), les possibilités d’interactions et de rétroactions
(feedback temps réel de services personnalisés en CRM) avec
les internautes sont à ce moment là encore pauvres (malgré quelques
applications en B to B type Web call-back). Ce qui signifie
que certaines données plus qualitatives, potentiellement « historisables
[10] » ne sont pas intégrées dans les bases de données clients
dès lors orientées « volume » et non « valeur », mais encore
eût-il fallu que les outils existent ou qu’ils soient accessibles
(coût et dimensionnement).
|
|
| |
Les missions du Gestionnaire de la Base
de données
Ainsi, les premières briques de notre « méga base » nous permettaient :
- Le croisement et la consolidation et de données pour sortir
de nouveaux agrégats calculés (données trafic et données
internautes),
- La diffusion de tableaux de bords et de « profiling
[11] » mensuels en terme de trafic et d’usage du site,
- Le ciblage (via une interface ad hoc) pour le compte des
régies publicitaires,
- Des études dites « flash » synthétique sur des segments
d’internautes eu égard à leur(s) centre(s) d’intérêts,
- Une mini R & D local, qui m’ont permis de tester quelques
indicateurs (notion d’élasticité page vue / visite selon un
modèle behavioriste stimulus / réponse).
La notoriété de notre site, le trafic engendré,
l’effet volume (plusieurs millions d’abonnés) aiguisaient naturellement
l’appétit de prestataires de données qui se seraient bien vu racheter
notre base. Au lieu de se précipiter peut-être auraient-ils dû
s’interroger sur ce que représentaient véritablement le nombre
d’internautes réellement actifs sur le site plutôt que de compter
un nombre d’identifiants dans une base de données, qui le temps
faisant, appelaient naturellement des actualisations (nettoyage,
dédoublonnage, suppression compte inactifs, etc.).
Mais note base, véritable gisement, n’était
pas à vendre.
Lire la IIème
partie
|
|
|
|