Commençons notre note sur les sites miroirs par une compilation des différentes définitions que l'on peut trouver sur le web. Nous avons recupéré quatre définitions que nous vous livrons ici en vous indiquant les sources:

Définition du terme : "site miroir"

  • C'est avant tout une "copie multiple de sites ou de pages. Pour certains sites très fréquentés les fournisseurs d'accès réalisent parfois ces copies, accessibles par d’autres adresses pour éviter la saturation du réseau. Cela peut compliquer la recherche du lieu réel d’émission des informations. Les auteurs des sites réalisent parfois eux-mêmes des miroirs afin d’accroître artificiellement leur présence dans les résultats des recherches."

    Source : www.minefi.gouv.fr

  • Cette seconde definition est assez proche de la premiere en introduisant quelques termes techniques tres important pour la suite. C'est la copie multiple de sites ou de pages Web sur différents serveurs, pour des raisons de rapidité d'accès. Le processus d'enregistrement de ces miroirs dans les Moteurs de Recherche est souvent traité comme du spamdexing, parce que ça augmente artificiellement la pertinence des pages. Les filtres tels que le Sniffer d'Infoseek retirent maintenant les miroirs multiples.

    Source : www.mpl.ird.fr

  • Cette troisieme definition met l'accent sur l'aspect geographique du site miroir : Se dit d'un site web dont le contenu est identique à celui d'un site principal, mais qui se trouve physiquement à un endroit différent. Les sites miroirs sont souvent implantés dans d'autres pays ou régions que le site principal, afin d'être plus proches des utilisateurs concernés. La présence de sites miroirs permet de soulager le trafic sur le site principal et de réduire les délais de téléchargement pour les utilisateurs proches du site secondaire.

    Source : www.ac-rouen.fr

  • Finalement la définition suivante souligne bien le fait que les sites miroirs ne sont pas systématiquement déployés à des fins malhônnètes et donc la difficulté pour les moteurs de recherche est de faire le tri. C' est une copie conforme d'un site sous une adresse IP différente. Le même site est ainsi hébergé sur plusieurs serveurs. De cette façon, les sites miroirs permettent de répartir la charge sur les serveurs d'un site à forte demande internationale. Les sites miroirs sont difficiles à faire indexer convenablement, car les moteurs de recherche considèrent la duplication de contenu comme une forme de spamdexing.

    Source : www.a-yant.com

Si vous visitez cette page de wikipedia version anglaise : http://en.wikipedia.org/wiki/Mirror_site, vous constaterez qu'il existe un très grand nombre de raisons pour lesquelles nous voulons mettre en place un ou des sites miroirs. Les raisons sont plus ou moins bonnes et plus ou moins justifiées mais ce qui est certain : ces raisons existent.

Utilisation légitime

Prenons en vrac les raisons suivantes qui font partie des "bonnes raisons", et nous détaillerons ensuite la raison qui nous intéresse vraiment.

  • Mettre en place un système de sauvegarde de ses données.

  • Contourner les obligations de fermeture, par exemple rappelez vous Google en chine qui possède aussi bien au sens propre qu'au sens figuré son site miroir que l'on peut consulter à cette adresse.

    elgooG

    On y retrouve donc même une dimension politique, un moyen de défense de la liberté d'expression...

  • Augmenter la vitesse de téléchargement en fournissant les mêmes services à plusieurs endroits différents de la planète. Prenons par exemple sourceforge.

    sourceforge

Utilisation illégitime

Mais comme tout chose, nous avons également les moyens d'utiliser cette technologie à des fins moins nobles.

  • Cela peut être utilisé comme un moyen d'augmenter le revenue des publicités.

  • Plus rarement, on s'en sert pour plagier un site web, même si celui-ci finit par s'en apercevoir.

  • Et on peut utiliser les sites miroirs pour augmenter le "site's ranking", dont nous vous parlerons plus en détail dans une prochaine note. Remarquer bien que nous continuerons à étudier exclusivement cette méthode. Comment cela fonctionne-t-il ? Sur chacun des sites miroirs, on met en place des hyper liens qui pointent vers tous les autres sites miroirs. Cette technique est appelée le link farming que l'on pourrait traduire en français par "affermage de liens". En général, les administrateurs des moteurs de recherche et les surfeurs considèrent cela comme une méthode qui ne respecte pas l'éthique.

Sites Miroirs et Link Farming

Si le mot affermage vous semble étrange, voici une définition que nous avons trouvé :

n. m. XVe siècle, au sens (vieilli) de « engagement d'un serviteur » ; XIXe siècle, au sens actuel. Dérivé d'affermer.Action d'affermer, de donner ou de prendre en location, moyennant une redevance. L'affermage d'un domaine agricole. L'affermage d'un emplacement publicitaire, des droits de place sur les marchés.

Source : Patrimoine de France

Mais qu'est donc exactement le "link farming" ?

Nous pouvons trouver une assez bonne definition present sur le site www.webopedia.com.

Cela consiste à avoir un grand nombre de liens réciproques entre différents sites webs, ici des sites miroirs donc en fait un seul et unique site. Quand nous disons un seul et unique site, nous évoquons l'entité logique et pas l'entité physique car il faut bien se rappeler que le but des sites miroirs est de dupliquer physiquement un site web et son contenu.

Le 'link farming' tend donc à augmenter la qualité de réferencement éffectuée par les moteurs de recherche. Rappelez vous la note sur les moteurs de recherche qui expliquaient que l'un des critères de notation de la popluarité d'un site consiste à compter le nombre de sites qui pointent justement sur le vôtre. Plus il y a de liens, plus votre site est logiquement populaire. Cependant, la mise en pratique de cette théorie avec des sites miroirs est considérée comme du spam ou plus précisemment du spamdexing.

Article sur le spamedxing.

Comme il est dit dans cet article, le spamdexing a connu un réel essor dans les années 90, ce qui tendait à rendre les moteurs de recherche presque inutiles. Ces derniers ont su développer des algorithmes qui contournent plus ou moins bien ces écueils.

Vous constaterez qu'il existe plusieurs formes de spamdexing. L'utilisation de sites miroirs en est une, mais il en existe principalement deux autres : URL redirections et le Cloaking. Nous laisserons cependant de côté ces techniques. Si vous voulez plus de renseignements, un bon début se situe à la page web de wikipedia qui traite du sujet.