Домены и PageRank

Домены, как это не странно для человека, поисковыми роботами воспринимаются по-разному. Для ботов domain.com и www.domain.com — не одно и то же. В данной статье я расскажу о том, как свести разногласия между человеческой логикой и логикой робота к минимуму.
Доменные имена и имена файлов
С точки зрения робота, www.domain.com/, domain.com/, www.domain.com/index.html и domain.com/index.html — это разные URL, и, следовательно, разные страницы.
Люди посещают домашнюю страницу сайта, не делая различий между URL-ами, но для роботов все по-другому. Этот фактор влияет на результаты расчетов PageRank.
Поэтому лучшим решением служит стандартизация обращения к URL-у, который вы используете для домашней страницы. Если же этого не сделать, то каждый URL будет обладать собственным PR вместо того чтобы укреплять ПэйджРанк одного-единственного URL-а.
Если вы задумаетесь над этим, как может робот знать имя файла страницы, которая выдается при подаче запроса в форме www.domain.com/? Да никак. Имя файла может быть index.html, index.htm, index.php, default.html, и так далее. Паук об этом не знает. Этим то и пользуются опытные веб-разработчики.
Если вы внутри сайта проставляете ссылку на index.html, паук может сравнить две страницы, но и то это вряд ли будет произведено. Итак, получается два URL-а, и каждый из них получает свой PR от входящих ссылок. Стандартизация обращения к URL-ам домашней страницы позволяет быть уверенным, что не происходит распыления PageRank между основным URL-ом и URL-ами-«призраками».
Практика
Представьте себе страницу, имеющую адрес www.domain.com/index.html. Индексная страница содержит ссылки на ряд относительных URL-ов, названных как products.html и details.html. Робот видит эти URL-ы как www.domain.com/products.html и www.domain.com/details.html.
А теперь давайте добавим на другую страницу URL не в относительном, а в абсолютном формате, но опустим префикс"www.": domain.com/anotherpage.html. Эта страница имеет ссылку назад на страницу index.html; таким образом, робот видит индексную страницу уже как domain.com/index.html.
Несмотря на то, что это та же самая индексная страница, для паука — это совсем другая страница, поскольку она расположена на другом домене. Теперь смотрите, что получается: каждый из относительных URL-ов на индексной странице также отличается, поскольку принадлежит к домену с именем domain.com/. В результате, ссылочная структура приводит к потере потенциального PageRank сайта из-за его распыления между страницами-«призраками».
Раскрутка, 30/03/2007
eck0
