Zoekmachine Spam

Een groot deel van de internetters maakt gebruik van zoekmachines bij hun speurtocht naar informatie over bepaalde onderwerpen. Voor de meeste sites geldt dat meer dan 80% van de bezoekers via zoekmachines de site gevonden heeft. Internet is een grote bron van informatie, zoekmachines zijn bedoelt om deze informatie te vinden. Er zijn echter ook veel sites die (uitsluitend) financiële bedoelingen hebben, geld verdienen met producten, advertenties of diensten.

Voor sommige sites  zijn inkomsten een leuk extraatje, andere verdienen er hun brood mee. Er zijn commerciële sites die ook zeer goede informatie bieden, er zijn echter legio sites die uitsluitend commercieel zijn. Informatieve sites scoren in principe hoog in zoekmachines, voor een puur commerciële site is het dus zaak zich voor te doen als een informatieve, liefst populaire site. Webmasters bedienen zich van technieken om informatiever of populairder over te komen, waardoor hun sites hoger scoren in zoekmachines. Hierdoor treedt een vervuiling op van de zoekmachines, de top posities van populaire trefwoorden worden ingenomen door sites die weinig informatie hebben. Zoek je informatie over de palm-pda, of de spelregels van black-jack, met een gewone zoekopdracht kom je er dan niet, je zult dieper moeten spitten. Deze vervuiling van zoekmachines is bijzonder vervelend, en vergelijkbaar met email-spam.

Hieronder een overzicht van gebruikte technieken om zoekmachines te spammen. Als je kiest van een optimalisatie van je site voor zoekmachines blijf je het beste web bij bedrijven die deze technieken gebruiken, goede kans dat ze op korte termijn resultaat bieden, omdat zoekmachines hun technieken steeds aanpassen vereisen spam technieken ook voortdurend onderhoud. Beter is het om door een gedegen opbouw van de site, in combinatie met goede inhoud te zorgen voor een goede score in zoekmachines, op de lange termijn zal dat het winnen.

Cloaking

Cloaking is een techniek waarbij bezoekers, bijvoorbeeld de zoekrobot of spider van een zoekmachine verschillende versies van een site krijgen voorgeschoteld. Dit kan legitieme redenen hebben, cloaking wordt toegepast om de site aan te passen aan de browser, scherm resolutie, bandbreedte of herkomst van de bezoeker. Minder fraai is het als de zoekmachine een totaal andere pagina krijgt, onschuldige inhoud versus porno, of sites waar betaalde pagina’s open staan voor zoekmachines, maar waar een gebruiker moet betalen.

Redirects

Met een redirect worden bezoekers doorgestuurd naar andere pagina’s of sites. In feite is dit ook een vorm van cloaking. Ook voor redirecting kunnen er goede redenen zijn, google doet het zelf ook. Als je naar www.google.com gaat wordt je afhankelijk van de instellingen van je site doorgestuurd naar de nationale versie bijvoorbeeld www.google.nl

Ook als een pagina vervallen is kan een redirect gebruikt worden om de bezoeker door te sturen naar de nieuwe pagina.

Cloaking en redirects zijn lastig te detecteren, nog lastiger is het om onderscheid te maken tussen goed en kwaadwillende versies. Gebruik het met zorg en door waar nuttig, in geval van twijfel andere technieken gebruiken. Robots zijn argwaanend als het gaat om de meta-tag refresh en java script redirects. Gebruik liever 301/302 redirects via de .htaccess file of via server-side scripting .

In het algemeen wordt beweerd dat zoekmachines cloacking kunnen detecteren, toch lijkt het te werken, zo zijn de eerste twee resultaten bij zoeken op google:afzuigkap duidelijk cloacks/doorways (15-01-2004)

Onzichtbare tekst

Eenveel gebruikte techniek is het plaatsen van onzichtbare tekst op een pagina. Dit kan door:

  • De tekst heel klein te maken
  • De tekst in dezelfde kleur weer te geven als de achtergrond.
  • Het schuiven van layers of plaatjes over tekst.

Met deze technieken is het mogelijk om extra tekst of trefwoorden aan een pagina toe te voegen zonder dat de gewone gebruik ze ziet. De methoden zijn zonder meer verwerpelijk, niemand heeft er baat bij als er onzichtbare informatie op een site staat. Zoekmachines doen er dan ook veel aan dit te detecteren, als er een om een tekst staat is het makkelijk te detecteren. Als het via een style-sheet gaat is het lastiger, maar zoekmachines worden daar steeds beter in.

In tegenspraak met de gangbare omvatting heeft deze site goede resultaten gehad met verborgen zoekwoorden

Tekst in frames

  • De tekst te verbergen in de sectie van een frame pagina
  • De tekst te verbergen in de

Deze technieken zijn legitieme methoden om informatie aan te bieden aan bezoekers die niet over (I)frames beschikken, hier is het al weer een stuk lastiger om onderscheid te maken tussen goed en kwaad.

Misleidende tags

Elke pagina is voorzien van een titel, als het goed is via de

Plaats een reactie