Как правильно написать robots.txt


Как правильно написать robots.txtРоботы поисковых систем при входе на сайт первым делом обращаются к файлу robots.txt, чтобы получить инструкции к дальнейшему действию и узнать, какие файлы и директории запрещены к индексированию. Поэтому веб-мастеру крайне необходимо знать, как правильно написать этот файл, так как ошибки в нём могут привести к очень плачевным последствиям. Ещё раз повторимся и уточним, что файл robots.txt ничего не разрешает к индексации, а только запрещает. И ещё один нюанс. Он не является стопроцентным указанием для поисковых роботов. Скорее можно сказать, что он является рекомендательным документом.

Файл robots.txt – обыкновенный файл с расширением txt, который создают с помощью Блокнота и располагают в корневой директории конкретного сайта и который содержит инструкции по индексации для поисковых роботов. Инструкции могут быть, как общие, так и для конкретных роботов отдельные.

Основные правила при создании и загрузке файла robots.txt:


• не путать название, то есть называть файл robots.txt, а не robot.txt и так далее.
• писать название файла robots.txt обязательно в нижнем регистре, то есть robots.txt, а не Robots.txt и ROBOTS.TXT и так далее.
• размещать файл robots.txt именно в корневой директории сайта, а не в каком другом месте.

Также очень важно грамотное содержание файла robots.txt, поэтому расскажу подробнее об этом моменте. Ошибки в содержании этого файла могут привести к тому, что сайт или отдельные его директории или файлы не будут проиндексированы.

Из чего состоит содержание файла robots.txt?


вопрос по раскрутке сайта

User-agent: *
Disallow: /adminka/
Disallow: /image/


Разберём содержание этого файла более подробно.
Первая строка «User-agent: *». Звёздочка в инструкции User-agent обозначает, что данная инструкция относится ко всем поисковым роботам. Если инструкция предназначена для конкретного поискового робота, то необходимо прописать его имя.
Вторая и третья строка запрещают индексацию директорий adminka и image. Обратите внимание, что каждая запрещённая к индексации директория прописана в отдельной строке. Совмещение их в одной строке является грубой ошибкой. Также нельзя переносить строки в пределах одной инструкции.


Для поискового робота Яндекса актуально также писать директиву Host. Эта директива указывает роботу на основное зеркало этого сайта. В этой директиве можно прописать адрес сайта либо с www, либо без www. Какая разница спросите вы? Да никакой. Можно указывать и так, и так. Всё зависит исключительно от вашего желания. Никаких ограничений и ущемлений для вашего сайта не будет. Правильно написать директиву Host нужно так:


User-agent: Yandex
Disallow: /adminka/
Host: www.site.ru

 


Примеры написания файла robots.txt для различных задач.


1. Запретить весь сайт к индексации всеми поисковыми роботами.


User-agent: *
Disallow: /


2. Не запрещать весь сайт к индексации всеми поисковыми роботами.


User-agent: *
Disallow:


3. Запретить весь сайт к индексации одним поисковым роботом (например, SeoBot).


User-agent: SeoBot
Disallow: /


4. Не запрещать весь сайт к индексации одному роботу (например, SeoBot) и запретить к индексации всем остальным поисковым роботам.


User-agent: SeoBot
Disallow:

User-agent: *
Disallow: /


5. Запретить несколько директорий к индексации всеми поисковыми роботами.


User-agent: *
Disallow: /directoria-1/
Disallow: /directoria-1/
Disallow: /hidedirectoria/


6. Запретить несколько файлов к индексации всеми поисковыми роботами.


User-agent: *
Disallow: /hide.php
Disallow: /secret.html

Правила написания содержимого файла robots.txt:


1. Писать содержимое файла нужно только в нижнем регистре.
2. В каждой инструкции Disallow указывать только одну директорию или один файл.
3. Не менять местами инструкцию Disallow и User-agent.
4. Не оставлять пустой строку User-agent. Если инструкция относится ко всем поисковым роботам, то писать звёздочку, а если к конкретному поисковому роботу, то писать его имя.
5. В директиве Host (для Яндекса) адрес писать нужно без протокола http:// и без закрывающего слеша /.
6. Не нужно использовать символы подстановки в инструкции Disallow в виде звёздочки и прочих символов.
7. Стараться не писать комментарии к инструкциям в одной строке с инструкциями.
8. Нельзя пропускать инструкцию Disallow. Если вы не собираетесь ничего запрещать к индексации, то оставьте эту инструкцию пустой.
9. При запрещении к индексации директорий обязательно прописывать слеши.
10. Самое главное правило – прежде чем залить файл robots.txt на сервер сайта нужно сто раз его проверить и перепроверить во избежание дальнейших недоразумений.


раскрутка сайтаДалее по теме раскрутка сайта:

Как бесплатно и самостоятельно раскрутить сайт?

site-pro-site.ru
Контакты

Меню Site-pro-Site.ru

 

Хитрости и технические моменты используемые при создании сайта. # 1
Хитрости и технические моменты используемые при создании сайта. # 2

 

Способы самостоятельного создания сайта

 

Способы самостоятельного создание блога

 

Создание мобильного сайта

 

Регистрация Домена и Выбор Хостинга

 

Самостоятельная раскрутка сайта. # 1
Самостоятельная раскрутка сайта. # 2
Программы для раскрутки сайта

 

Способы получения прибыли с сайта

 

Электронные платёжные системы

Партнеры

Полезные ссылки для WEB мастера

Полезно почитать

Как Легально Заработать в Интернете...

Как Создать...


Все Технические Моменты Онлайн Бизнеса в Видеоформате

Javascript+jQuery для начинающих в видеоформате

Как Создать Информационный Бестселлер на DVD или CD

PHP+MySQL для начинающих

Joomla - профессиональный сайт за один день

WordPress - профессиональный блог за один день

Технические секреты продуктивной работы в онлайн бизнесе

Весь Photoshop ...


Фотошоп уроки для повышения мастерства

Photoshop для фотографа

Photoshop CS5 от А до Я

Фотошоп с нуля в видеоформате

26 полезных статей для начинающих Фотошоп-мастеров

Самые Лучшие Бесплатные Браузерные Игры