Посты для тега : ‘каждого’

Фильтрация по схожести образцов

Мы реализовали механизм рекомендования таким образом, что для создания набора данных необходимы оценки, выставленные каждым пользователем. Для нескольких тысяч людей или предметов это, возможно, и будет работать, но на таком большом сайте, как Amazon, миллионы пользователей и товаров, поэтому сравнение каждого пользователя со всеми другими, а затем сравнение товаров, которым каждый пользователь выставил оценки, займет […]

Читать далее »

Тонкая настройка с помощью панели Группировка, сортировка и итоги

  Когда группировка задана, у вас появляются дополнительные возможности: §     можно вставить дополнительную сортировку в пределах каждой подгруппы; §     можно выполнить сводные вычисления для каждой группы;

Читать далее »

Выбор наилучшего разбиения

Сделанное нами неформальное наблюдение о том, что переменная выбрана не очень хорошо, может быть и верным, но для реализации программы нужен способ измерения неоднородности множества. Требуется найти такую переменную, чтобы множества как можно меньше пересекались. Первое, что нам понадобится, – это функция для вычисления того, сколько раз каждый результат представлен в множестве строк. Добавьте ее […]

Читать далее »

Метод опорных векторов

Рассмотрим снова задачу отыскания прямой, разделяющей два класса. На рис. 9.9 приведен пример. Показаны средние точки для каждого класса и соответствующий им разделитель. Обратите внимание, что разделяющая линия, вычисленная на основе средних, неправильно классифицирует две точки, потому что они оказались к ней гораздо ближе, чем большая часть данных. Проблема в том, что, поскольку почти все […]

Читать далее »

Рекурсивное построение дерева

Чтобы оценить, насколько хорош выбранный атрибут, алгоритм сначала вычисляет энтропию всей группы. Затем он пытается разбить группу по возможным значениям каждого атрибута и вычисляет энтропию двух новых групп. Для определения того, какой атрибут дает наилучшее разбиение, вычисляется информационный выигрыш, то есть разность между текущей энтропией и средневзвешенной энтропией двух новых групп. Он вычисляется для каждого […]

Читать далее »

Мониторинг пакетов НТТР-трафика. Подключение к каналу

Трассировка пакетов требует эффективного способа подключения к функционирующей IP-сети. Сложности, связанные с подключением, зависят от базовой технологии и конфигурации сети, а именно: •          Совместно используемая среда передачи данных. Многие локальные сети включают совместно используемую среду передачи данных, например, Ethernet, кольцо FDDI или беспроводную сеть. Каждая машина в сети видит каждый пакет, передаваемый другими компьютерами. Для […]

Читать далее »

Алгоритм 2-key Triple DES

Многократное шифрование по сравнению с какой-либо оптимизацией структуры алгоритма, несомненно, имеет серьезнейшее преимущество: подавляющее большинство реализаций алгоритма DES (как программных, так и аппаратных) может быть использовано для многократного шифрования данных — просто данные через шифратор нужно будет «прогонять» несколько раз.

Читать далее »

Построение списка всех сегментов баз данных, находящихся на всех устройствах сервера

Приведенный ниже командный файл помещает в базу данных sybsystemprocs хранимую процедуру p_servermap, которая выдает полный список всех сегментов различных баз данных, находящихся на дисковых устройствах сервера. Процедура p_servermap также играет существенную роль при выполнении командного файла dump_systables.

Читать далее »
 
Rambler's Top100