Посты для тега : ‘расстояние’

Основные принципы помехоустойчивого кодирования. – ЧАСТЬ 1

Коды, об­ладающие способностью к обнаружению и исправлению ошибок, называют по­мехоустойчивыми. Более узкой их категорией являются корректирующие коды, позволяющие исправлять ошибки. Основная идея обнаружения ошибок по своей сути тождественна принципу обнаружения орфографических ошибок в тексте естественного языка. Ошибка, имевшая место в некотором слове, устраняется, если замена символов или букв превратила это слово в запись, отсутствующую в […]

Читать далее »

Евклидово расстояние

определяет расстояние между двумя точками в многомерном пространстве. Это то расстояние, которое вы измеряете с помощью обычной линейки. Расстояние между точками с координатами (Pj, p2, p3, p4, ^) и (q^, q2, q3, q4, ^) выражается по формуле B.1.

Читать далее »

Категориальные свойства

Набор данных для подбора пар содержит как числовые, так и дискретные данные. Некоторые классификаторы, например деревья решений, справляются с данными обоих видов без предварительной обработки, но классификаторы, рассматриваемые далее в этой статье, умеют работать только с числовыми данными. Поэтому нужно каким-то образом преобразовать дискретные данные в числовые.

Читать далее »

Рисование сети

Нам понадобится библиотека Python Imaging Library. Если вы ее еще не установили, обратитесь к приложению А, где приведены инструкции по скачиванию и установке последней версии. Код рисования сети прямолинеен. Надо создать изображение, нарисовать отрезки между людьми, а потом – узлы, представляющие каждого человека. Имена людей наносятся во вторую очередь, чтобы линии их не перекрывали. Добавьте […]

Читать далее »

Многомерное шкалирование

Ранее к анализу блогов был применен также метод многомерного шкалирования. Как и кластеризация, это метод обучения без учителя. Он предназначен не для прогнозирования, а чтобы понять, как различные образцы связаны между собой. Алгоритм создает представление набора данных в пространстве меньшей размерности, стараясь по возможности сохранить исходные расстояния между элементами. Если речь идет о представлении на […]

Читать далее »

Взвешенные соседи

Один из способов компенсировать тот факт, что алгоритм может отбирать слишком далеких соседей, заключается в том, чтобы взвешивать их с учетом расстояния. Это напоминает метод когда предпочтения людей взвешивались с учетом того, насколько они схожи с предпочтениями человека, нуждающегося в рекомендации.

Читать далее »

Характеристики Web-pecypcoв. Временная локализация

Время между последовательными запросами одного и того же ресурса оказывает значительное влияние на Web-трафик. Популярность ресурса определяет частоту запросов без указания интервалов между ними, временная локализация характеризует вероятность того, что запрошенный ресурс будет запрашиваться снова в ближайшем будущем. Когда последовательность запросов выявляет высокую временную локализацию, то имеется высокая вероятность того, что запрашиваемый ресурс уже находится […]

Читать далее »
 
Rambler's Top100