Robots.txt

Filen robots.txt används främst för att hindra sidor från att komma med i sökmotorernas index och för att ta bort sidor som redan finns med. Har du ingen robots.txt betyder det att alla sökmotorer har fritt fram att komma åt och indexera allt innehåll på din webbplats.

Det är dock rekommenderat att du har en sådan fil även om den är tom (tillåt allt) eftersom sökmotorerna kommer att förfrågningar efter den.

Alla stora sökmotorer (Google, Yahoo, Live) och förmodligen de flesta små har kommit överens om en gemensam standard och följer de instruktioner du har i din robots.txt.

Ska vara en enkel textfil som ska ligga på rooten i din domän, alltså här: www.dindomän.se/robots.txt

Annons

Nu kan du anlita SEO-konsulten Jim Westergren för 5900 kr + moms. Läs mer på SEO-konsult.se

Exempel

Blockera hela webbplatsen från alla sökmotorer:

User-agent: *
Disallow: /
Blockera mappen temp:

User-agent: *
Disallow: /temp/
Blockera särskilda delar från enbart Google:

User-agent: Googlebot
Disallow: /temp/
Disallow: /onödigt/skräpkatalog/
Disallow: /privat_fil.html
Blockera och ta bort alla bilder från Google Bildsökning:

User-agent: Googlebot-Image
Disallow: /
Tvinga robotar att vänta 10 sekunder mellan förfrågningar i sin spindling:

User-agent: *
Crawl-delay: 10
Ge godkännande till en viss fil i en annars ej godkänd mapp:

User-agent: *
Allow: /mapp1/fil.html
Disallow: /mapp1/
Blockera alla robotar förutom Google:

User-agent: *
Disallow: /
User-agent: Googlebot
Allow: /
Visa var din XML-sitemap finns (du kan ange flera):

Sitemap: http://www.din-domän.com/sitemap.xml
Sitemap: http://www.din-domän.com/sitemap2.xml
Kommentarer markeras med en inledande #:

# Här kommer en kommentar

Exempel på mönstermatchning

Asterisk (*) matchar en teckensekvens och dollartecken ($) anger slutet på en URL.

Blockera alla kataloger som inleds med privat:

User-agent: *
Disallow: /privat*/
Blockera alla URLer på din domän som slutar med .gif:

User-agent: *
Disallow: /*.gif$
Blockera alla URLer där ett frågetecken (?) ingår:

User-agent: *
Disallow: /*?
Blockera alla URLer som innehåller sessionid men tillåt /hur-du-fixar-sessionid.html:

User-agent: *
Allow: /hur-du-fixar-sessionid.html
Disallow: /*sessionid
Blockera alla URLer som börjar med konto:

User-agent: *
Disallow: /konto

Verkliga exempel:

Lista på vanliga spindlar att användas med robots.txt

Några råd och varningar


Mer läsning / källor

Fråga / diskutera på SEO-forum.se

I denna tråden eller som en ny tråd i sektionen Allmän SEO-info.

Denna sida senast uppdaterad: 6 May 2009
Skriven av Jim Westergren
Feedback uppskattas.