Посты для тега : ‘вычисления’

Транзакционные вычисления

Большая часть бизнес-приложений использует транзакционные вычисления, которые находятся в центре внимания данной книги. Транзакционная система — это система, в которой один или большее количество поступающих наборов данных обрабатываются совместно в рамках единой транзакции и устанавливают взаимосвязи с другими данными, уже введенными в систему. Основой транзакционной системы обычно является реляционная база данных, которая управляет взаимоотношениями между […]

Читать далее »

Группировка

  — неоценимое средство для придания смысла большим объемам данных счет упорядочивания их в группах меньшего размера. Затем можно выполнять вычисления в каждой отдельной группе. Рассмотрим список заказов в компании Boutique Fudge. В зависимости от того, как вы сгруппируете данные, можно посмотреть, лучше ли продается шоколадное молоко, чем шоколадное пиво, или сильнее ли клиенты из […]

Читать далее »

Вложенные функции

  В вычисляемом поле или условии отбора можно применять несколько функций. Этот прием известен как вложенные функции: специальный термин, обозначающий вставку одной функции внутрь другой. Например, в программе Access есть встроенная функция определения абсолютного значения числа Abs ( ), преобразующая отрицательные числа в положительные (и оставляющая положительные числа без изменения). Далее приведен пример деления одного […]

Читать далее »

Оценка по евклидову расстоянию- Отыскание похожих пользователей

Один из самых простых способов вычисления оценки подобия – это евклидово расстояние. В этом случае предметы, которые люди оценивали сообща, представляются в виде координатных осей. Теперь в этой системе координат можно расположить точки, соответствующие людям, и посмотреть, насколько они оказались близки (рис. 2.1).

Читать далее »

Коэффициент корреляции Пирсона – Отыскание похожих пользователей

Чуть более сложный способ определить степень схожести интересов людей дает коэффициент корреляции Пирсона. Коэффициент корреляции – это мера того, насколько хорошо два набора данных ложатся на прямую. Формула сложнее, чем для вычисления евклидова расстояния, но она дает лучшие результаты, когда данные плохо нормализованы, например если некоторый критик устойчиво выставляет фильмам более низкие оценки, чем в […]

Читать далее »

Метод Фишера

, названный по имени Р. А. Фишера (R. A. Fisher), – это альтернативный метод классификации, который дает очень точные результаты, особенно применительно к фильтрации спама. Он используется в подключаемом к программе Outlook фильтре SpamBayes, который написан на языке Python. В отличие от наивной байесовской фильтрации, когда для вычисления вероятности всего документа перемножаются вероятности отдельных признаков, […]

Читать далее »

Сравнение дельта-алгоритмов

Для вычисления разности между версиями ресурса существует множество алгоритмов. В традиционных файловых системах для создания разности между двумя текстовыми файлами используется команда UNIX diff. Разность может быть представлена пользователю способом, при котором выделяются различные виды разности: добавление, удаление и изменение. Использование опции -e команды diff дает возможность генерировать сценарий. Этот сценарий может использоваться про- граммой-редактором […]

Читать далее »
 
Rambler's Top100