Marre de se faire balader sur le net !

Aller au contenu | Aller au menu | Aller à la recherche

mercredi 16 mai 2012

Volunia

Dans son billet du 15 mai 2012 (publié sur son nouveau blog officiel http://blog.volunia.com/), l'équipe du moteur de recherche Volunia annonce la sortie de la phase Bêta Test le 14 Juin 2012, si tout se passe bien avec les power users impliqués depuis quelques mois dans les test des fonctionnalités en ligne.

La firme de Padoue (http://fr.wikipedia.org/wiki/Padoue) - ça rime avec Mountain View, faut-il y voir un signe ? simple question - en profite d'ailleurs pour s'excuser auprès des testeurs qui ont continué d'explorer le moteur sans recevoir plus d'informations officielles. Elle explique que depuis l'accès à la version Bêta, suggestions, critiques et recommandations ont été considérées avec attention.

A partir du 18 mai, un grand nombre de modifications vont être mises à la disposition des Power Users (annonces ici), parmi lesquelles :

  • Nouvelle interface plus fonctionnelle et redessinée suite aux suggestions
  • Documentations plus claire et complète sur les conditions d'utilisation et la protection des données personnelles
  • Intégration d'un moteur de recherche supplémentaire (externe à Volunia) au système. Le moteur Volunia continue d'être développé.

D'autres modifications seront à suivre le 21 mai.

Premiers tests de l'interface Volunia seek and meet

Tout d'abord, Volunia se présente comme une interface sociale complète. Il ne s'agit pas d'un champ de saisie à remplir, mais d'un environnement qui intègre les fonctionnalités suivantes :

De haut en bas et de gauche à droite :

Barre horizontale avec les fonctionnalités suivantes : Retour Accueil / Carte / Média / Personnes / Compte ou Connexion / Partager / Champ de recherche / Logo retour accueil (bis) / Aide générale / Personnalisation de l'interface (principalement langue et filtre safesearch) / Réduire les icônes pour ne laisser que les étiquettes textes

Sous-barre horizontale : Messages / Informations sur le site / A été / En ce moment / Demande d'ajout en tant qu'ami / Ami(s) en ligne

Panneau central : zone de surf

Barre d'outils en colonne de droite : Afficher l'heure des messages / Stopper le défilement automatique des messages / Signaler un abus / Agrandir / Accéder à l'aide en ligne / Fermer

En bas à gauche : picto haut-parleur pour tout commentaire / En bas du cartouche des messages : envoyer votre message. Il s'agit en fait d'un système de chat "archivé".

Comme il est possible de le deviner, la zone de navigation centrale encapsule les sites dans des frames. Il va donc falloir s'habituer à ce genre de page ci-dessous (je voulais afficher twitter) lorsque les sites visités n'acceptent pas "l'encadrement" !

Il est à noter que les scripts "anti-frame" de type détection JavaScript ne sont pas "excusés" comme ci-dessous, vous perdez alors l'environnement Volunia.

Ergonomie moteur Volunia

Sur la droite on constate que d'autres internautes ont déjà tenté de se rendre sur Twitter !

Voici un autre essai plus concluant, avec une annotation "à la volée" (création de pseudo en 2 secondes sans login),

qui permet déjà de laisser un commentaire sur la page visitée !

Commentaire sur page

L'intérêt de l'environnement Volunia seek & meet est de pouvoir échanger des informations entre utilisateurs.

Il est en effet possible de voir à tout moment qui est connecté, de visiter les profils en ligne (en accédant aux informations qui sont paramétrables pour le respect de la vie privée), de faire la demande d'ajout en tant qu'ami.

Chaque page visitée comporte la possibilité de recevoir des commentaires identifiés, permettant ainsi de se trouver des affinités avec d'autres utilisateurs puisqu'on peut là encore clique sur leur profil (options disponibles : Contacter le Voluniaute, Commencer à discuter avec lui, Ajouter en tant qu'ami, Accéder au profil). Notez que seul la dernière action est disponible lorsque vous n'êtes pas identifié.

Enfin, dans la barre horizontale, vous retrouvez l'historique des visites sur la page, avec les avatars des membres qui sont passés (qu'ils aient laissé un commentaire ou pas). Là encore, il est possible d’interagir avec eux. Un vrai réseau social !

mercredi 25 avril 2012

Google webspam algorithm update

Mise à jour des pages de résultats !

Cela faisait plusieurs mois que Google jouait avec les nerfs des webmasters et autres prestataires SEO...en fait depuis l'apparition du filtre Panda.

Et depuis quelques semaines, le rythme des modifications apportées à l'affichage des pages de résultats ne fait que s'accélérer. Le point culminant de ce "printemps noir" pour les référenceurs est arrivé cette nuit à 00:00, avec la mise en application en France de la mise à jour de l'algorithme au travers de critères principalement orientés anti-spam.

Référencement : bonnes pratiques contre black hat

Le blog dédié de Google sur le sujet, lire http://insidesearch.blogspot.fr/2012/04/another-step-to-reward-high-quality.html, parle clairement de politique d'amélioration des résultats de recherche qualitatifs dans les pages. Matt Cutts mentionne les différentes façons de promouvoir un site internet, ou plutôt, il fustige les méthodes assimilées au Black Hat qui consistent à créer des liens artificiels en masse vers des sites pauvres en contenu. Car selon l'article qui vise à récompenser les sites de grande qualité, c'est d'abord le contenu qui prime, et Google préfère que les webmasters usent leur énergie et leur créativité à publier de beaux sites bien faits et utiles aux internautes plutôt que d'utiliser des outils dont la finalité est de duper le moteur de recherche par la création d'un très grand nombre de liens postés automatiquement, conférant ainsi au site ciblé une popularité mal acquise.

Il en ressort que de nombreux sites permettant cette acquisition de liens (backlinks) sont sous le joug de Google depuis quelques temps, et parmi eux les sites de communiqués de presse. Si le principe du communiqué de presse n'a en teneur rien à se reprocher, c'est l'utilisation qui en est faite sur internet qui se révèle problématique : 

Sites de communiqués de presse en ligne : le fourre-tout du référenceur

Facilement et rapidement installé, par exemple en automatisant le déploiement sur un serveur dédié de blogs WordPress optimisés SEO grâce à quelques plugins, le site de CP de base n'a pas pour vocation de fournir un contenu ciblé vers l'internaute. Il s'agit plutôt de publier des liens vers les sites à promouvoir au sein d'articles, le tout en comptant sur le meilleur ratio quantité/temps.

En effet, pour "rentabiliser" l'investissement déjà minime, les éditeurs de tels sites invitent leurs congénères à poster leurs propres articles sur leurs plateformes afin de maximiser l'effet de fraîcheur de contenus, montrant ainsi à Google que le site est très "vivant" puisqu'il engrange chaque jours de nombreux communiqués.

Il s'est ainsi constitué un réseau impressionnant de sites CP, qui ne cessait de croître... tant que cela fonctionnait ! Devant l'ampleur du mouvement, Google ne pouvait pas rester de marbre et laisser ainsi son algorithme trompé par un de ses critères le plus ancien : le nombre de backlinks pointant vers un site.

D'autant plus que les communiqués, bien intégrés dans des réseaux de sites destinés à pousser (du bas des pages de classement vers le haut de la première page Google) un certain nombre d'outils de publication, qui font office de fusibles : en cas de détection et de sanction par le moteur, ces intermédiaires se retrouvaient blacklistés et sortaient de l'index, sans toutefois faire tomber avec eux le site à référencer, qui dans le pire des cas perdait quelques places dans les serps.

La fin des linkwheel

Or depuis ce mercredi 25 avril 2012 (même si des changements ont pu être enregistrés auparavant), la fonction de fusible ne fonctionne plus : en plus des sites à faible valeur ajoutée repérés et sanctionnés par Google, les sites liés à leurs pages se trouvent eux aussi touchés par le déclassement.

Du coup, les réseaux de sites / linkwheel / mininets n'ont plus raison d'être ! L'analogie avec la biologie permettra peut-être de mieux comprendre :

Imaginez les sites intermédiaires (qu'ils soient CP, annuaires, digg-like, blogs ou autres) comme étant porteurs de microbes. Avant Google Panda update 3.4, Google éradiquait ces sites une fois repérés (ce qui n'était ni immédiat, ni automatique : de nombreuses interventions manuelles humaines ont été, et sont encore, réalisées, par des équipes de Googlers et de Quality Rater, dont la plupart sont des travailleurs indépendants à domicile), mais sans prendre en compte le maillage de liens : le site "malade" était déclassé, et Google passait au site suivant présentant les symptômes de la même maladie (ces symptômes pouvant être : publication régulière de contenus parfois dupliqués comportant uniquement des liens sortants fabriqués avec des ancres optimisées - nous y reviendrons).

Dorénavant, Google pénalise également les sites qui sont liés à l'intermédiaire CP. Mais comme toujours dès lors qu'il y a un grand nombre de critères, la pondération est de mise. C'est à dire que la maladie qui est transmise affecte le mode de transmission, à savoir le lien, ou plutôt l'intitulé du lien qu'on appelle "ancre".

De fait, il apparaît que dans mes tests, les ancres de liens (optimisées pour le positionnement des sites sur des termes pouvant être utilisés dans les requêtes des internautes sur le moteur) publiés sur des sites de communiqués ne transmettent (au mieux) aucun jus, c'est à dire que je ne retrouve plus le site référencé en tapant cette requête. C'est clairement nouveau dans le fonctionnement du moteur, surtout lorsque les termes de recherche en question sont plus ou moins uniques sur le web (3 à 4 termes).

Google contre le spam : plus qu'une mise à jour, une mission !

Ce qui est présenté comme une mise à jour de l'algorithme n'est pas une tâche automatisable. Il s'agit plutôt d'actions manuelles de la part de Googlers ou de Quality Raters, car le prise en compte des signaux de détection de sites spammy, et surtout l'application de sanctions pouvant être très préjudiciables à certains propriétaires de sites, ne doit pas être fait automatiquement.

Cela reviendrait à corriger ensuite à la main un nombre inimaginable de sites en attente de statut (spammy ou non). Google veut sans doute faire croire que tout est automatisé mais le fondement même de son algorithme (le lien, et surtout le nombre de backlinks pointant vers une adresse, lui conférant ainsi une popularité voire une autorité truquées dans le cas des sites spammy) ne peut être modifié sans complètement bouleverser le fonctionnement du moteur. Et ce, malgré l'annonce récente de Matt Cutts à propos du bug des sites malencontreusement assimilés à du squatting de noms de domaine (cybersquatting).

Un filtrage continu sur les signaux sensibles ?

Reste à penser que Google va s'attacher à démanteler les mininets en appliquant ce déclassement / cette non-indexation des pages liées par des ancres sur-optimisées. C'est en effet une façon assez simple et rapide (selon la complexité de la linkwheel) de procéder à la purge de bien des sites spammy : si les pages ne répondent plus (n'apparaissent plus) dans les serps pour les requêtes qui intéressaient les webmasters, le positionnement sur ces termes n'est plus possible (ou grandement altéré), ce qui revient à perdre tout le bénéfice de l'entreprise (c'est à dire que la linkwheel ne transmet plus de jus qualifié et ne pousse plus vraiment les moneysites).

Pour l'instant ce sont les sites CP qui sont dans le collimateur des modérateurs, sûrement du fait de leur grand nombre de signaux très caractéristiques lors-qu’utilisés à des fins spammy basiques, qu'on pourrait résumer ainsi :

  • Moteur de template type Blog ou CMS, le plus utilisé étant WordPress
  • Adresses IP communes ou voisines lors de réseaux montés sur des serveurs dédiés/privés
  • Aspect graphique réduit à néant ou presque (selon les standards du moteur, template WP gratuite, maquette basique...)
  • Typologie de contenus toujours identique : volume de texte contenant un nombre de liens sortants. La norme pour les sites CP était de rédiger un texte de 300 mots minimum dans le but d'y poser 2 à 3 liens.
  • Contenu rédactionnel généralement pauvre. Qu'il s'agisse de spun (textes spinnés) ou non, les textes ne sont pas rédigés pour vraiment intéresser l'internaute
  • Le site n'est clairement pas choyé par son webmaster, il ne bénéficie que de très peu de liens internes, n'a pas fait l'objet de référencement lui-même ou alors avec d'autres sites CP. Tout cela se comprend, puisque le site CP spammy n'a pas pour vocation d'occuper le devant de la scène (on se rendrait alors vite compte de l'imposture et des dénonciations seraient faites). Je rappelle que son but et de passer du linkjuice aux moneysites.
  • La structure du site est clairement choyée par son webmaster, elle bénéficie des meilleurs plug-in SEO, tout est optimisé pour faire ressortir les termes utilisés dans les communiqués : tags/étiquettes, catégorisation thématique du communiqué, calcul de densité des mots-clés dans la page, calcul du nombre de caractères, chapô d'article, fil RSS, etc... Il y a donc une sur-optimisation du site, surtout si l'on compare à la médiocrité de son contenu et à sa très faible popularité (fréquentation anecdotique, taux de rebond très élevé, signaux sociaux inexistants...)

Pour savoir comment éviter le filtrage appliqué à la sur-optimisation de sites, regardez ces vidéos : http://www.seomoz.org/blog/6-changes-every-seo-should-make-before-the-over-optimization-penalty-hits-whiteboard-friday ainsi que http://www.seomoz.org/blog/stop-optimizing-and-start-creating-whiteboard-friday

  • Incitation au système de publication participatif par la distribution de comptes auteur et l'incitation aux comptes VIP (les articles n'ont alors pas besoin d'être validés/modérés par l'éditeur du site) : ce schéma fait que les référenceurs ont tendance à s'ouvrir des accès partout mais ne répartissent pas toujours bien leur publication. Résultat : les même liens vers les même moneysites sont ainsi publiés sur des plateformes différentes en un temps très court, facilitant la détection du spam.

Cette liste n'est pas exhaustive ;-)

On peut lui ajouter un signal supplémentaire, qui n'est pas toujours du fait des éditeurs de sites : le blast. Réalisés avec des logiciels d'automatisation de création de liens, ces blasts pointent tous vers le communiqué qui a été publié par le détenteur du compte auteur. Ils émanent la plupart du temps de sites sans aucun rapport avec le thème de l'article (profil de forum, profil social, referrer...)

Il est souvent à l'initiative de l'auteur du communiqué qui espère ainsi lui envoyer du jus. Mais l'afflux massif de milliers de liens en même temps vers une page nouvelle, sur un site ne faisant pas autorité est maintenant perçu comme signal de spam. C'est ce qui fait dire à de nombreux référenceurs, francophones ou autres, que ce critère risque grandement d'être détourné pour faire chuter les sites concurrents, on parle alors de Negative SEO ou NSeo.

Lire à ce sujet le forum suivant qui détaille la procédure et les effets dévastateurs de blasts : http://trafficplanet.com/topic/2369-case-study-negative-seo-results/#entry33318

D'autres réflexions ici : http://searchenginewatch.com/article/2169138/Negative-SEO-Looking-for-Answers-from-Google

A l'avenir ?

On peut penser que les principes expliqués ici (détection automatique via Panda + modération manuelle via Quality Raters) vont s'appliquer par la suite à tous les types de sites. A partir du moment où l'autorité d'un site est tombée à zéro, le signal qu'il transmet est insignifiant au mieux, au pire est pénalisant et permet de remonter la source vers d'autres sites de spam.

Ce mercredi 25.04.2012, l'application de cette mise à jour d'algorithme perturbe grandement le classement des sites indexés dans les datacenters. La communauté des référenceurs observe anxieusement les fluctuations heure après heure comme en attestent fora (http://forum.webrankinfo.com/filtre-google-contre-spam-suroptimisation-seo-t153907.html) et services de micro-blogging comme Twitter.

Si votre site se trouve pénalisé, vous avez des leviers pour demander un ré-examen après avoir corrigé le tir. Vous pouvez également, comme cela se voit déjà, abandonner purement et simplement les domaines vidés de leur PR/TrustRank/substance.

N'hésitez pas à me faire part de vos commentaires !

mardi 7 février 2012

Volunia test complet

L'interface dédiée aux Power Users du moteur Volunia a été révélée hier lundi 6 février 2012.

Voici le test complet de ce moteur de recherche Italien dont on parle depuis plusieurs mois !

Volunia power user

Adresse du plugin Volunia pour Firefox :https://addons.mozilla.org/fr/firefox/addon/volunia/

mercredi 25 janvier 2012

Duck Duck Go Stickers

Suite au billet sur le moteur Duck Duck Go, dont le caractère différenciant principal est le respect de l'anonymat des requêtes de recherche internet, le site Sticker Mule, fournisseur des objets promotionnels officiels dont il était question, a envoyé à Marre de Se Faire Balader sur le Net une enveloppe pleine d'autocollants.

Stickers Duck Duck Go

Parmi les stickers reçus, citons le canard emblématique, la mascotte du moteur Duck Duck Go, représenté avec les traits de diverses personnalités.

De gauche à droite et de l'arrière plan vers le premier plan :

  • DDG
  • Space
  • Frankenstein
  • DDG Logo Tall
  • Nikola Tesla
  • John McCarthy
  • Stop Censorhip
  • German Unity Day

La recherche sur Internet a besoin de diversité et d'alternatives à des modèles de monopole comme Google, et les récents évènements autour du projet SOPA (cf. site American Censorship ont montré les capacités de pouvoirs politiques à censurer des services en ligne selon des critères aux interprétations arbitraires. La censure américaine risquerait de brider des pans entiers d'Internet et de réduire le réseau des réseaux à des bouts de Toile troués.

mercredi 18 janvier 2012

Volunia : invitation des power users

Volunia, nous en avons parlé dans de précédents billets (cf. Volunia, forza Italia). Depuis quelques semaines sur Twitter certains profils annoncent leur sélection par le moteur de recherche italien pour faire partie des power user, et "Marre de se faire balader sur le net" en fait désormais partie.

Voilà ce qui est concédé à ces internautes chanceux :

  • un accès exclusif à VOLUNIA en avant-première.
  • un contact direct avec l'équipe de VOLUNIA.
  • des informations exclusives sur les évolutions de VOLUNIA.
  • des pass bonus pour inviter vos amis.

Les Power User sont également invités à envoyer des invitations à leurs amis (par défaut 6 champs email).

Les messages d'invitation mentionnent "exclusive Bonus Activation to become a Power User".

Tiens, ça rappelle le marketing viral récemment utilisé pour Google+ ça...

Volunia, toujours à suivre !

- page 1 de 6