Посты для тега : ‘ссылок’

Простой подсчет ссылок

Простейший способ работы с внешними ссылками заключается в том, чтобы подсчитать, сколько их ведет на каждую страницу, и использовать результат в качестве метрики. Так обычно оцениваются научные работы; считается, что их значимость тем выше, чем чаще их цитируют. Представленная ниже функция ранжирования создает словарь счетчиков, делая запрос к таблице ссылок для каждого уникального идентификатора URL […]

Читать далее »

Алгоритм PageRank

был придуман основателями компании Google, и вариации этой идеи теперь применяются во всех крупных поисковых машинах. Этот алгоритм приписывает каждой странице ранг, оценивающий ее значимость. Значимость страницы вычисляется исходя из значимостей ссылающихся на нее страниц и общего количества ссылок, имеющихся на каждой из них.

Читать далее »

Построение рекомендателя ссылок с помощью API сайта del.icio.us

В этом разделе я покажу, как запрашивать данные с одного из наиболее популярных сайтов онлайновых закладок и как с их помощью находить похожих пользователей и рекомендовать ссылки, которых они раньше не видели. Сайт http://del.icio.us позволяет пользователю создать учетную запись и сохранять интересующие его ссылки. Зайдя на этот сайт, вы можете посмотреть, какие ссылки сохранили другие […]

Читать далее »

Использование текста ссылки

Еще один полезный способ ранжирования результатов – использование текста ссылок на страницу при определении степени ее релевантности запросу. Часто удается получить более качественную информацию из того, что сказано в ссылках, ведущих на страницу, чем из самой страницы, поскольку авторы сайтов обычно включают краткое описание того, на что ссылаются.

Читать далее »
 
Rambler's Top100