Che cos'è lo spam? In linea di massima può
essere considerato spam ogni pagina con contenuto ridondante
o che è palesemente costruita con il solo scopo di
migliorare il ranking del sito o fattori che lo influenzano,
come ad esempio la link popularity.
Un motore di ricerca sarà tanto più utilizzato
quanto più in grado di restituire in tempi brevi risultati
appropriati e consistenti a fronte delle ricerche effettuate
dal navigatore. Se i motori fanno quindi di tutto per ottimizzare
tempi di risposta e rilevanza dei risultati, i webmaster escogitano
espedienti sempre nuovi per dare maggiore visibilità
alle loro pagine. Ne risulta che il navigatore si trova talvolta
di fronte a pagine semanticamente poco rilevanti, realizzate
appositamente per migliorare il posizionamento del sito internet:
non facilmente riconoscibili, queste pagine possono avere
contenuto minimale e disorganizzato (per chi legge, non per
i software di indicizzazione), talvolta molti link, visibili,
nascosti o automatici (redirect). Questa tipologia di pagine
disorienta fortemente l'utente.
Con il diffondersi di questi comportamenti è sorta
la necessità di rendere sempre più restrittive
le regole che un sito (e quindi il webmaster) deve soddisfare
per essere ammesso all'interno di un database: l'insieme di
queste norme costituisce la Spam Policy del motore.
Ogni motore di ricerca ha una propria Policy, che penalizza
in maniera diversa (in genere non specificata) pagine con
le seguenti caratteristiche, ritenute spam:
- pagine contenenti un redirect (reindirizzamento) automatico
ad altre pagine: sono chiamate doorway pages, pagine di
ingresso. Quando il navigatore le raggiunge, viene dopo
poco automaticamente "spedito" ad un altro indirizzo
- pagine contenenti testo dello stesso colore o colore simile
al proprio sfondo. Questo trucchetto permette di inserire
testo non visibile all'occhio del navigatore ma indicizzabile
dallo spider
- pagine farcite con keywords superflue che sono irrilevanti
o non hanno il significato espressivo
- pagine che contengono un numero eccessivo di link ad altre
pagine: hanno unicamente lo scopo di incrementare la link
popularity del sito
- pagine con link nascosti: ad esempio collegamenti ancorati
a immagini .gif trasparenti o troppo piccole perché
siano effettivamente cliccabili dal navigatore
- in genere ogni pagina che tenda ad interferire con gli
algoritmi del motore
Spam Report: spesso i motori di ricerca chiedono ai navigatori
di segnalare loro le url che possono essere considerate spam,
attraverso la compilazione di apposite form oppure fornendo
indirizzi di posta dedicati.
Le conseguenze alle quali si può andare incontro non
rispettando queste regole variano da motore a motore: si va
dalla semplice penalizzazione del ranking della pagina all'esclusione
(in gergo: banning) del dominio del sito dagli indici. Se
vengono ravvisati comportamenti gravi si può arrivare
anche al banning dell'indirizzo IP (Internet Protocol, identificativo
del server) del web server sul quale risiede il sito, con
la conseguenza che tutti i siti residenti su quel server (moltissimi
sugli hosting condivisi) saranno esclusi dal motore, con danno
notevole per i proprietari.
|