|
POSIZIONAMENTO
SUI
MOTORI DI RICERCA
di Andrea Cappello ©
06/2001
per suggerimenti e contatti:
Studio
Cappello
COSA NON FARE PER APPARIRE NEI MOTORI
DI RICERCA
Vediamo
ora di trattare tutte quelle tecniche
da non utilizzare per migliorare il ranking
del proprio sito. Innanzitutto è
espressamente sconsigliato inserire parole
chiavi che non abbiano attinenza con le
tematiche trattate nel sito (per esempio
scrivere "sex" in un sito di
sport).
Un altro trucco da non utilizzare, è
la creazione di pagine Web che, grazie
ai cosidetti "auto forwarding page",
trasportino l'utente su un'altra pagina
dopo un tot di secondi. Per far cià,
viene utilizzato il meta tag refresh:
<meta
http-equiv=refresh content="3; url=pagina.htm">
Questo
tipo di pagina viene spesso utilizzata
per enfatizzare alcune keywords. Il fatto
di per sé aumenta il nostro ranking,
ma la presenza del meta tag refresh ci
penalizza di molto. Per evitare ciò,
è possibile utilizzare Javascript;
ecco come:
<SCRIPT
LANGUAGE=Javascript>
<!--
setTimeout("location='pagina.htm'",
3000)
//-->
</SCRIPT>
In
questo modo, dopo 3000 millisecondi (3
secondi) si viene trasferiti al documento
pagina.htm. Per chi avesse timore di modificare
un setTimeout, può utilizzare questo
sistema a variabili:
<SCRIPT
LANGUAGE=Javascript>
<!--
secondi=3 // i secondi di attesa
indirizzo="pagina.htm" // l'url
caricato al termine dei secondi
setTimeout("location=indirizzo",secondi*1000)
//-->
</SCRIPT>
A
titolo didascalico, diciamo che è
possibile utilizzare document.write (permette
di scrivere codice con Javascript) scomponendo
il meta tag refresh.
<SCRIPT
LANGUAGE=Javascript>
<!--
document.write("<ME"+"TA
ht"+"tp-eq"+"uiv=REF"+"RESH
con"+"tent='3;
u"+"rl=pagina.htm'>")
//-->
</SCRIPT>
Per chi volesse mantenere la massima compatibilità
con tutti i browsers, anche quelli che
non leggono sintassi Javascript, allora
consigliamo l'utilizzo del marcatore <NOSCRIPT></NOSCRIPT>,
il quale viene ignorato dai browser compatibili
con Javascript e letto da quelli più
obsoleti o con Javascript disabilitato.
Ecco come fare:
<NOSCRIPT>
<H1 ALIGN=CENTER>Clicca per accedere
al sito</H1>
<CENTER><BIG><BIG><A
HREF="pagina.htm">Collegati</A></BIG></BIG></CENTER>
</NOSCRIPT>
Tutte
questi escamotage servono a ingannare
i robots dei motori di ricerca. In questo
modo infatti, si impedisce al ragno di
trovare il meta tag incriminato, permettendoci
quindi di creare pagine enfatizzando alcune
keywords relative al nostro sito.
Sempre
a proposito delle tecniche da non seguire,
i tanto comodi frames, rappresentano dei
nemici per il tuo ranking. In caso di
riquadri infatti, la pagina principale
non contiene altro che il frameset per
caricare le altre pagine. Se i frames
fossero proprio indispensabili, è
importante inserire una dettagliata descrizione
del sito all'interno del marcatore , il
quale altro non è che il testo
visualizzato dai browser non compatibili
con i riquadri. La descrizione inserita
all'interno di questo tag, darà
qualcosa in pasto ai ragni dei motori.
Un
altro espediente da evitare, è
la ripetizione di alcune parole all'interno
del tag <title> e del meta tag Keywords
come ad esempio:
<TITLE>
Sport, sport, SPORT, Sport, sport, SPORT,
Sport, sport, SPORT, Sport, sport, SPORT,
Sport, sport, SPORT
</TITLE>
Ciò
potrebbe comportare la cancellazione dal
database dei motori di ricerca.
TAG HIDDEN
Avrete
oramai compreso che non è semplice
inserire tutte le parole chiave all'interno
della parte iniziale della pagina (meta
tags, title e righe iniziali), soprattutto
se si utilizzano delle immagini anziché
semplici scritte.
Ci sono diversi siti che elencano semplicemente
le keywords all'inizio della pagina, condizionando
la grafica del sito web.
I metodi per aggirare questo problema
sono diversi ma il migliore è quello
dell'utilizzo dei tag hidden. Tag che
non sono visibili per l'utente che con
il suo browser visualizza la pagina in
questione.
Questo tag va nel "corpo" della
pagina, all'interno dei tag <body>
</body>:
<imput
type="hidden" value="la
lista delle keyword va qui">
Per
la precisione questo tag va inserito immediatamente
dopo il tag <body>, prima di ogni
altra cosa. Alcuni motori infatti, tengono
conto solo dei primi 200 caratteri circa
di una pagina, così e necessario
posizionare i tag hidden prima di immagini
e loghi grafici.
La cosa migliore dei tag hidden è
che sono completamente invisibili e quindi
non condizionano la grafica; alcuni motori
di ricerca li considerano alla stregua
di testo.
Altri motori di ricerca invece, rilevano
e penalizzano questo espediente. Prima
di utilizzare il tag hidden per questo
scopo analizzare motore per motore e effettuare
le modifiche se necessario. Fate delle
prove, se il tag hidden non da risultati
non continuate ad utilizzarlo. E ricorda
che i motori di ricerca modificano continuamente
le loro regole.
L'unico modo per vedere cosa funziona
è testare. Se trovi la formula
giusta usala nuovamente.
INDIRIZZIAMO I RAGNI
Abbiamo
visto che, qualsiasi cosa facciamo, siamo
noi a doverci adattare agli spider dei
search engine. E' possibile però
far adattare i robots alle nostre esigenze,
indirizzandoli (Cloaking) all'interno
del sito, a nostro piacimento.
Se foste in possesso di un dominio, è
possibile creare un file di nome robots.txt
che va inserito nella root principale
(www.dominio.com/robots.txt). In questo
file, vanno inserite le istruzioni per
"governare" il ragno. Ad esempio:
"
Escludere tutti i robots dai files contenuti
nel dominio:
User-agent: *
Disallow: /
" Consentire l'accesso a tutti i
robots:
User-agent: *
Disallow:
(è anche possibile non creare il
file o lasciarlo vuoto)
" Escludere tutti i robots da una
o più cartelle:
User-agent: *
Disallow: /cgi_bin/
Disallow: /secret/
" Escludere un robot (nell'esempio
quello di Excite) da alcune cartelle:
User-agent: ArchitextSpider
Disallow: /cgi_bin/
Disallow: /secret/
" Escludere un robot (nell'esempio
quello di Altavista) da tutti i file del
dominio:
User-agent: Scooter
Disallow: /
" Lasciare passare un unico robot
(nell'esempio quello di Hotbot):
User-agent: Slurp
Disallow:
User-agent: *
Disallow: /
Per
conoscere i nomi dei ragni di altri motori
di ricerca, rimandiamo alle pagine dei
rispettivi search engines.
Se
non in possesso di un dominio, esiste
un meta tag ad hoc, che nonostante la
minore flessibilità e potenza rispetto
all'inserimento del file robots.txt, consente
un discreto risultato:
<meta name="robots" content="noindex,
nofollow">
Il Cloaking, se usato in maniera scorretta
inviando informazioni sbagliate agli indicizzatori,
può portare al "banneraggio"
del sito
AVANTI...>>>
|