Архив для категории: ‘AI’

Метод Фишера

, названный по имени Р. А. Фишера (R. A. Fisher), – это альтернативный метод классификации, который дает очень точные результаты, особенно применительно к фильтрации спама. Он используется в подключаемом к программе Outlook фильтре SpamBayes, который написан на языке Python. В отличие от наивной байесовской фильтрации, когда для вычисления вероятности всего документа перемножаются вероятности отдельных признаков, […]

Читать далее »

Групповые путешествия

Планирование путешествия группы людей (в данном примере семейства Глассов), которые, отправляясь из разных мест, должны прибыть в одно и то же место, всегда вызывало сложности и представляет собой интересную оптимизационную задачу. Для начала создайте новый файл optimization.py и вставьте в него такой код: import time import random import math

Читать далее »

Моделирование цен на недвижимость

У деревьев решений много потенциальных применений, но наиболее полезны они в тех случаях, когда есть несколько возможных переменных и вас интересует процесс рассуждения. Иногда результаты уже известны, а смысл моделирования заключается в том, чтобы понять, почему они получились именно такими. Одна из областей, где подобная постановка вопроса особенно интересна, – это анализ цен на товары, […]

Читать далее »

Просмотр данных на двумерной плоскости

Алгоритмы кластеризации, иллюстрировались с помощью визуализации данных на плоскости, а степень различия между предметами обозначалась расстоянием между ними на диаграмме. Но в большинстве реальных задач требуется кластеризовать более двух чисел, поэтому изобразить данные в двух измерениях не получится. Тем не менее, чтобы понять, как соотносятся различные предметы, было бы полезно видеть их на странице и […]

Читать далее »

В каких случаях применять метод k-ближайших соседей

У метода k-ближайших соседей есть несколько недостатков. Прогнозирование потребляет очень много вычислительных ресурсов, так как приходится вычислять расстояния до каждой точки. Кроме того, если в наборе данных много переменных, то трудно подобрать подходящие веса и определить, какие переменные несущественны. Оптимизация может помочь, но отыскание хорошего решения для большого набора данных отнимает много времени.

Читать далее »

Кластеризация столбцов

Часто бывает необходимо выполнить кластеризацию одновременно по строкам и столбцам. В маркетинговых исследованиях интересно сгруппировать людей с целью выявления общих демографических признаков или предпочитаемых товаров, а быть может, для того чтобы выяснить, на каких полках размещены товары, которые обычно покупают вместе. В наборе данных о блогах столбцы представляют слова, и можно поинтересоваться, какие слова часто […]

Читать далее »

Прогнозирование количества регистраций

Когда сайт с большим числом посетителей развертывает новое приложение, предлагая бесплатный доступ и подписку, оно может привлечь тысячи новых пользователей. Многие из них просто движимы любопытством и на самом деле в этом приложении не заинтересованы, поэтому вероятность того, что они станут платными клиентами, крайне мала. Из-за этого трудно выделить потенциальных клиентов, на которых стоит акцентировать […]

Читать далее »

Байесовская классификация

Напомним, что байесовская классификация – это метод обучения с учителем. Если вы собираетесь воспользоваться классификатором, то сначала должны сами классифицировать несколько новостей, чтобы его обучить. Затем классификатор сможет распределить остальные новости по заранее заданным категориям. Помимо очевидного недостатка – необходимости начального обучения – у этого подхода есть и еще одно ограничение – разработчик должен сам […]

Читать далее »

Алгоритм k-ближайших соседей

Простейший подход к решению задачи о ценах на вина не отличается от того, которым вы пользуетесь, рассчитывая цены вручную, – найти несколько похожих образцов и предположить, что цены будут примерно одинаковыми. Найдя множество образцов, похожих на тот, что вас интересует, алгоритм может усреднить их цены и предположить, какой будет цена на ваш образец. В этом […]

Читать далее »

Введение в коллективный разум

Компания Netflix занимается онлайновым прокатом DVD. Пользователь выбирает фильм и заказывает его доставку, а компания рекомендует другие фильмы на основе того, что заказывали другие пользователи. В конце 2006 года компания предложила приз в 1 млн долларов тому, кто улучшит точность системы рекомендования на 10%, причем сумму вознаграждения каждый год предполагалось увеличивать на 50 000 долларов. […]

Читать далее »
 
Rambler's Top100