Посты для тега : ‘схожести’

Фильтрация по схожести образцов

Мы реализовали механизм рекомендования таким образом, что для создания набора данных необходимы оценки, выставленные каждым пользователем. Для нескольких тысяч людей или предметов это, возможно, и будет работать, но на таком большом сайте, как Amazon, миллионы пользователей и товаров, поэтому сравнение каждого пользователя со всеми другими, а затем сравнение товаров, которым каждый пользователь выставил оценки, займет […]

Читать далее »

Сравнение методов фильтрации по схожести пользователей и по схожести образцов

Фильтрация по схожести образцов выполняется гораздо быстрее, чем по схожести пользователей, когда нужно выработать список рекомендаций на большом наборе данных, но она требует дополнительных накладных расходов на хранение таблицы коэффициентов подобия образцов. И точность зависит от того, насколько «разрежен» набор данных. В примере с фильмами каждый критик оценил почти все фильмы, поэтому набор данных плотный […]

Читать далее »

Использование набора данных MovieLens

В последнем примере мы рассмотрим реальный набор данных с оценками фильмов, который называется MovieLens. Этот набор был подготовлен в ходе работы над проектом GroupLens в университете штата Миннесота. Загрузить его можно со страницы http://www.grouplens. org/node/12. Там есть два набора данных. Скачайте набор 100 000 в формате tar.gz или zip в зависимости от платформы, на которой […]

Читать далее »
 
Rambler's Top100