Система Управления Контентом Сайта / Content Management System
edogs nuke based on php nuke compatible from nuke 6.5 to nuke 7.8
Навигация
· Главная
· Рекомендовать сайт
· Карта сайта и поиск по сайту
· Каталог ссылок
· Каталог файлов
· Обратная связь
· Наши опросы
· Наши пользователи
· Наши форумы
· Управление аккаунтом
· Фотогалерея
· Тематические разделы
· Добавить новость
· Доска объявлений
· Закладки
Последние объявления
Нет содержания для данного блока.
Информация

edogs-CMS 
 (php-nuke 7.3 based) 
 разработка модулей/блоков, 
 написание скриптов

Империя Догов 
 (клуб собак всех пород). 
 Чат, форум, объявления, 
 новости, информация
Немецкие доги, восточно-европейские овчарки (ВЕО) и другие породы
google test
edogsCMS (aka edogs-Nuke): Наши форумы

 FAQFAQ   ПоискПоиск   ГруппыГруппы   ПрофильПрофиль   Войти и проверить личные сообщенияВойти и проверить личные сообщения   ВходВход 

Управление индексацией модулей поисковым роботом

 
Начать новую тему   Ответить на тему    Список форумов www.edogs.ru -> Пожелания к последующим выпускам
Предыдущая тема :: Следующая тема  
Автор Сообщение
Nicolaev
Новичок
Новичок


Зарегистрирован: Sep 09, 2004
Сообщения: 97
Откуда: Минск, Беларусь

СообщениеДобавлено: 14-09-2004 11:32:00    Заголовок сообщения: Управление индексацией модулей поисковым роботом Ответить с цитатой

Часто возникает ситуация, когда хочется запретить роботам индексировать какие-либо модули, оставив для индексации несколько сот действительно содержательных страниц. Можно, конечно, извратнуться и прописать в robots.txt сотни запрещённых к индексации урлов, каждый день вручную добавляя новые. Smile Но это - экстэзи для мазохистов.

Выход, имхо, есть. Такое предложение для хака, которое edogs может использовать в edogs-nuke. Smile Идея заделана мной ещё зимой у себя на http://oblako-9.org для запрета индексации версий страниц для печати. Основание: если робот корректный и прислушивается к указаниям ему в роботс.тхт, то так же внимательно он относится и к указаниям в страничных мета-тегах. Если бот навязчивый и ему начхать на указания мета-тегов, то и роботс.тхт ему не указ. Наоборот, он с утроенной охотой будет индексировать запрещённые страницы и директории, стараясь найти там что-либо сокровенное. Поэтому управлять можно только поведением послушных роботов (Яндекс относится к таковым), и делать это очень удобно через динамичный мета-тег. Приводя алгоритм кода, буду записывать его в перловом виде, но желающие поймут суть и сделают это на PHP, в котором я слаб.

В админке, в свойствах каждого модуля нужно добавить несколько взаимоисключающих опций выбора режима индексации модуля:
0 - индексировать и следовать по ссылкам (по умолчанию)
1 - индекс., но не след. по ссылкам
2 - не индекс., но след. по ссылкам
3 - не индекс. и не след. по ссылкам

Код:
<input type="radio" id="botindex_value" name="botindex_value" value="0" checked> &nbsp; Индексировать и следовать по ссылкам<br>
<input type="radio" id="botindex_value" name="botindex_value" value="1"> &nbsp; Индексировать, но не следовать по ссылкам<br>
<input type="radio" id="botindex_value" name="botindex_value" value="2"> &nbsp; Не индексировать, но следовать по ссылкам<br>
<input type="radio" id="botindex_value" name="botindex_value" value="3"> &nbsp; Не индексировать и не следовать по ссылкам


Это значение сохраняется в базе, а потом, при создании страниц, присваивается строковой переменной $botindex_value Эта переменная впоследствии анализируется в файле includes/meta.php перед выводом мета-тегов. Алгоритм, аналогичный следующему (код на Perl):

Код:
my $botindex_string;
if ($botindex_value eq '3') {$botindex_string = 'noindex,nofollow';}   # Пробел после запятой в значении этого атрибута, по-моему, не ставится
elsif ($botindex_value eq '2') {$botindex_string = 'noindex,follow';}
elsif ($botindex_value eq '1') {$botindex_string = 'index,nofollow';}
else {$botindex_string = 'index,follow';}


Также можно проанализировать и другие параметры урла, например не индексировать версию для печати.

Дальше, в соответствующем месте, в зависимости от рез-та, выводятся разные значения мета-тега (код на РНР):

Код:
echo "<meta name=\"Robots\" content=\"$botindex_string\">\n";


Вот такое предложение. И ещё. Нужно аккуратней относиться к тегу <META NAME="REVISIT-AFTER" CONTENT="1 DAYS">. Если контент страницы относительно статичный, то робот, если и вернётся через день, то, обнаружив, что страница совсем не изменилась, может счесть это попыткой поискового спама и обидеться. Smile Может имеет смысл увеличить это значение до 3 или 7 дней? К тому же, основные русские и зарубежные поисковые боты вообще не реагируют на этот тег, а возвращаются на страницу по им известным алгоритмам.
Вернуться к началу
Посмотреть профиль Отправить личное сообщение Посетить сайт автора
Показать сообщения:   
Начать новую тему   Ответить на тему    Список форумов www.edogs.ru -> Пожелания к последующим выпускам Часовой пояс: GMT + 3
Страница 1 из 1

 
Перейти:  
Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах

Powered by phpBB © 2001, 2005 phpBB Group
Forums ©