Одна из задач любой поисковой системы состоит в том, чтобы пользователь как можно быстрее нашел то, что ему нужно. Результаты поиска по умолчанию всегда сортируются по релевантности, и ссылки на документы, более полно удовлетворяющие запросу, располагаются в начале списка. Но как быть в том случае, когда найдено несколько страниц с примерно одинаковой релевантностью? Желательно, например, чтобы ссылка на страницу веб-сайта hostinfo.ru с данной статьей оказалась в результатах поиска значительно ближе к началу, чем домашняя страница Василия Пупкина, где он расположил копию этой статьи в надежде слегка накрутить свой счетчик посещений.
Если анализировать веб-сайты отдельно друг от друга, то для поисковой системы не будет никакой разницы между hostinfo.ru и "Pupkin's Home Page". Хорошим решением данной проблемы явилась характеристика, которая уже давно успешно используется при оценке значимости научной литературы - индекс цитирования (ИЦ). В науке индекс цитирования для научного труда определяется как количество ссылок на этот труд в других изданиях (иногда вместо ссылок на конкретный труд считают упоминания фамилии автора). Индекс цитирования веб-страницы определяется аналогично, как количество ссылок на данную страницу с других веб-сайтов. Индекс цитирования веб-сайта определяется по индексам цитирования его страниц. Следует обратить внимание, что основное достоинство данной характеристики заключается в том, что "авторитетность" веб-ресурса зависит не от него самого, а от того, как его оценивают другие. Тем не менее каждый сайтовладелец - сам кузнец своего счастья, и количество ссылок на веб-ресурс напрямую зависит от того, насколько от интересен, полезен и известен пользователям Сети.
Однако простого подсчета количества ссылок недостаточно: одно дело, когда на научный труд ссылается солидный журнал, и совсем другое, когда он упоминается в небольшой брошюрке тиражом в несколько сотен экземпляров. В таких случаях используется несколько более сложный вариант индекса цитирования - взвешенный индекс цитирования (вИЦ). При подсчете вИЦ каждая ссылка имеет определенный "вес", в зависимости от того, в каком издании она помещается. Тот же алгоритм подходит и для веб-страниц, хотя в этом случае определить значимость веб-сайта, ссылающегося на данную веб-страницу, не так-то просто. Поисковые системы при определении "веса" ссылки обычно используют вИЦ веб-сайта, на котором расположена ссылка.
Индекс цитирования (ИЦ) - количественный показатель популярности веб-страницы или веб-сайта, определяется как количество ссылок на данную страницу или сайт с других веб-ресурсов Почти все поисковые системы при подсчете вИЦ (или собственной аналогичной характеристики) не учитывают ссылки, расположенные в немодерируемых форумах, веб-сайтах на бесплатном хостинге и других подобных веб-ресурсах, где содержимое формируется не непосредственным владельцем ресурса, а посторонними (и часто анонимными) лицами. В противном случае нечистоплотный на руку вебмастер мог бы без особых усилий получить огромное количество ссылок на свой веб-сайт, располагая их в подобных веб-ресурсах (причем это даже можно делать автоматически). Естественно, не учитываются и внутренние ссылки, то есть ссылки с других страниц того же веб-сайта - в пояснении это не нуждается.
Некоторые особо ретивые вебмастера пытаются обойти это препятствие при помощи псевдонастоящих веб-сайтов, но такие действия считаются спамом поисковой системы и при обнаружении караются удалением провинившегося веб-сайта из каталога или даже из базы данных поисковой системы. Спамом также считается и беспорядочный обмен ссылками в целях накрутки вИЦ со всеми вебмастерами, которые соглашаются на подобный обмен (данный вид спама называется непотизмом). Мнения относительно такого варианта обмена, как кольцо ссылок (webring), довольно противоречивы: с одной стороны, на данный момент поисковые системы не штрафуют за участие в кольцах ссылок, но, с другой стороны, вы не знаете, на кого ссылаются страницы вашего веб-сайта, так что в один прекрасный момент поисковые системы могут начать считать это спамом.
Взвешенный индекс цитирования (вИЦ) - вариант определения индекса цитирования, при котором каждая ссылка имеет "вес", зависящий от "авторитетности" веб-сайта, на котором она расположена. Еще один вариант индекса цитирования, используемый, в частности, поисковой системой "Яндекс", называется тематическим индексом цитирования (тИЦ). Он всегда подсчитывается для веб-сайта в целом. При его вычислении "веса" ссылок зависят еще и от того, насколько близки по тематике веб-сайт, для которого вычисляется тИЦ, и веб-сайт, на котором расположена ссылка. Тематика веб-сайтов определяется по каталогу веб-ресурсов, который есть практически в каждой поисковой системе, поэтому, если вас волнует рейтинг вашего веб-сайта в некой поисковой системе, не забудьте зарегистрировать его в каталоге этой системы. В поисковой системе "Яндекс" тИЦ используется только при сортировке веб-ресурсов в тематическом каталоге.
Естественно, что каждая поисковая система имеет свои особенности вычисления индексов цитирования, которые обычно содержатся в строгом секрете. Например, поисковая система Google использует в качестве базового алгоритм PageRank (PR), идея которого аналогична описанной выше.
Все эти характеристики используются не только поисковыми системами, но и для неофициального определения популярности веб-ресурсов, а также для оценки качества работы компаний по раскрутке веб-сайтов. Для этого обычно используются вИЦ или PR веб-сайта в целом и отдельно его первой страницы, а также тИЦ веб-сайта. Понятно, что абсолютные значения этих показателей мало что значат, поэтому обычно их сравнивают с такими же показателями других веб-сайтов (например, наиболее удачливых конкурентов).
И в заключение осталось сказать несколько слов о том, как можно повлиять на индекс цитирования вашего веб-сайта. Честный путь в данном случае только один - это официальный обмен ссылками с веб-ресурсами похожей тематики. Поиск веб-ресурсов для потенциального обмена - дело непростое, но выполнимое (например, можно пользоваться для этой цели тематическими каталогами поисковых систем). И если вас интересует тИЦ, всегда обращайте внимание на то, чтобы ваш веб-сайт и веб-сайт, который на вас ссылается, были зарегистрированы в каталоге одной и той же поисковой системы под одной и той же темой (либо под близкими по смыслу темами). Ну и, конечно же, не стоит забывать о том, чтобы ваш веб-сайт был интересным и полезным - в этом случае внешние ссылки на него будут появляться и без активных действий с вашей стороны.
Автор статьи: Вячеслав Замятин |