Quel joie de voir que les concepteurs d’outil de statistiques prennent notre enquête avec sérieux en acceptant de répondre aux quelques questions que nous leur soumettons. Ainsi, après eStat et phpMyVisites, au tour de W3Perl de nous livrer ses « secrets ». Et c’est Laurent Domisse, le concepteur de cet outil qui nous répond.

statistique w3perl chiffre Depuis quand existe votre logiciel ?
Depuis 1995. A l’époque j’étais webmaster et je désirais connaître la fréquentation du site sur lequel je travaillais. N’ayant trouvé aucun outil qui me convienne, j’ai commencé à écrire quelques scripts en shell, puis en Perl.

Quels sont les atouts de ce dernier? (options, exclusivités, fonctions globales) Comment expliquer vous que si j’installe votre logiciel et un autre j’ai un écart de stats ?
Le logiciel supporte un très nombre de formats de fichier de log (Apache/IIS/FTP…) avec des noms de fichiers différents (compressés et/ou écoupés par jour/semaine/mois) . Il dispose d’une interface d’administration à distance pour gérer ses stats (gestion des configs, possibilité de lancer ses stats par le web). Il peut fonctionner en local ou en accès à distance (récupération automatique des fichiers de log quand c’est possible). Il se met à jour de manière incrémentale automatiquement. Ses atouts sont la possibilité de connaitre le chemin précis de chaque internaute sur son site Web (gestion des sessions), de pouvoir disposer des stats temps réel, d’avoir des statistiques très complètes pour chaque jour (pays, références, pages, répertoires, sessions, scripts…).
Enfin je me fais un point d’honneur de répondre le plus rapidement possible à toutes les questions des utilisateurs, notamment dans le cas de rapport de bugs.

Concernant les écarts entre logiciels, c’est relativement simple. Il existe de nombreuses manières de compter les requêtes (certains logiciels comptent par exemple les accès des proxy pour ‘gonfler’ leur chiffre). Les configurations possibles de chaque logiciel sont différentes, certains pourront filtrer les robots, d’autres non. Dans ce cas, le filtrage des robots peut se faire sur une liste qui peut être différente d’une application à une autre. De plus, la nomenclature utilisée est parfois différente d’où la nécessité d’avoir une définition pour chaque terme employé. Certains n’hésitent pas à associer la notion de visiteur et de sites. Pour comparer donc des logiciels entre eux, il faut veiller à utiliser la configuration la plus semblable ainsi que des outils qui possédent les mêmes possibilités. Dans ce cas, on ne doit pas observer de différences plus grandes que quelques pourcents.

Quelle est, mais peut être le chiffre est-il confidentiel, le nombre d’utilisateurs de votre logiciel ?
Difficile de répondre car la plupart des personnes me contactent suite à des bugs rencontrés et très peu envoient spontanément un mail de remerciement. Depuis l’année dernière, le logiciel a été téléchargé plus de 4000 fois, soit une moyenne de 10 par jour. Si je reste conservateur avec un taux de quelques pourcents d’utilisations par téléchargement, je dirais environ une centaine d’utilisateurs en ce moment …

Existe-t-il un système de filtrage permettant d’exclure certaines IP des stats (robots, utilisateurs…) ? Si non pourquoi ?
– Avec W3Perl, le fichier de configuration permet de définir une liste d’adresses à rejeter en utilisant les expressions régulières (la chaine de caracteres ‘.wanadoo.’ permet par exemple d’exclure toutes les machines de wanadoo de tous les pays).
– Il est possible de filtrer les robots également à partir d’une liste mise à jour régulièrement. C’est une simple option dans le fichier de configuration.
– On peut également filtrer les referer spam (des sites douteux qui effectuent des requêtes quotidiennement pour être visible dans vos rapports de stats).

Existe-t-il une solution qui permettre de reprendre en compte une IP ou de ne pas la reprendre en compte en fonction du fait que le contenu du site ait changé ? Je m’explique, je tiens un blog, je mets une note ce matin à 8h, un visiteur passe à 9h et est donc comptabilisé. Il repasse à 10h la page n’a pas bougé, comment est-il comptabilisé (visiteurs, pages vues –> il voit la même page). Maintenant, il revient à 11h (c’est un accro), le contenu du blog a changé… comment cela est-il interprété dans les stats ?
Dans les stats principales, la page sera comptabilisée 3 fois et le visiteur une fois. Si par contre cette page est un script PHP appelé avec un paramètre (l’heure ou le numéro de la modification), il est possible alors de voir les accès sur la page en fonction des paramètres d’appel du script.
Au niveau des sessions, il est possible de séparer ces 3 visites en 3 sessions individuelles. Une session correspond à un certain nombre de pages lues pendant un certain intervalle de temps sans interruption (la valeur par défaut est de 30 minutes sans activité pour terminer une session). Dans l’exemple donné, cette utilisateur aura alors 3 sessions distinctes. Dans les stats heure par heure ou temps réel, les sessions sont ainsi visibles, séparées par un tiret, pour un même visiteur.
Enfin, il est toujours possible d’ajouter ce genre de fonctionnalité dans W3Perl en associant un couple : URL et taille du fichier. Cette nouvelle unité permettrait de séparer ce genre de comportement sans devoir modifier quoi que ce soit sur le serveur Web.
En tant que webmaster, à part le vôtre, quel outil de statistique dois-je utiliser (en complément)? Et pourquoi ?
AWStats me parait un très bon outil. Il produit moins de stats mais est plus synthétique.

Trouvez-vous votre application facile à utiliser ?
Une fois l’application installée, (c’est juste un exécutable sous Windows), il suffit de lancer un script pour mettre à jour automatiquement ses stats. Donc oui, je pense qu’elle est facile à utiliser, mais étant informaticien, je ne suis pas le mieux placé pour répondre à cette question !

Comment sont stockées les données ? BDD, On-line …?
Dans des fichiers texte.

Une nouvelle version de votre application sera-t-elle bientôt proposée ? Si oui, avec quels genres de nouveautés ?
De nouvelles versions sont disponibles tous les 3 mois en moyenne. Je travaille actuellement sur le support pour les fichiers de log de mail. Je compte ajouter un envoi automatique de rapport de stats par mail quotidien ou hebdomadaire. Je ne désespère pas de trouver un graphiste pour avoir une interface plus belle et en profiter pour supprimer les frames et les passer en menu CSS. Il faudrait aussi rajouter des outils d’administration (validation de fichier de config, gestion des referer spam…) et saupoudrer un peu plus l’application avec de l’Ajax pour effectuer des recherches intra-pages … Bref ce ne sont pas les idées qui manquent.
La liste des fonctionnalités à venir est disponible dans la documentation.
Un forum est également disponible sur mon site pour que les utilisateurs puissent exprimer leurs désirs en terme de fonctionnalité de W3Perl.

Que pensez-vous de l’étude que nous réalisons, et qu’attendez-vous d’une telle étude? Seriez vous prêt a répondre a un complément d’enquête?
Je trouve ça très courageux vu le nombre de logiciels dans ce domaine. J’espère que cela permettra aux utilisateurs de choisir en connaissance de cause le logiciel qui leur conviendra le mieux.
Mon but étant de produire un bon produit qui puisse servir à d’autres personnes, je suis toujours à l’écoute des critiques.
Pas de problème pour un complément d’enquête.