Архив для категории: ‘AI’

Наивная классификация

Имея вероятности для слов, входящих в документ, вы должны выбрать какой-то способ комбинирования вероятностей отдельных слов для вычисления вероятности того, что документ в целом принадлежит данной категории. В этой статье мы рассмотрим два разных метода классификации. Оба работают в большинстве случаев, но несколько отличаются по качеству при решении конкретных задач. Предметом этого раздела будет наивный […]

Читать далее »

Оптимизация с учетом предпочтений

Мы рассмотрели пример одной задачи, которую можно решить методами оптимизации, но есть немало других задач, внешне непохожих, но решаемых с помощью тех же методов. Напомним, что для применения оптимизации должны выполняться два основных требования: наличие целевой функции и тот факт, что близкие параметры дают близкие решения. Не каждую задачу, удовлетворяющую этим требованиям, можно решить методами […]

Читать далее »

Рекомендование предметов

Найти подходящего критика – это, конечно, неплохо, но в действительности-то я хочу, чтобы мне порекомендовали фильм. И прямо сейчас. Можно было бы посмотреть, какие фильмы понравились человеку с похожими на мои вкусами, и выбрать из них те, что я еще не смотрел. Но при таком подходе можно было бы случайно наткнуться на критиков, ничего не […]

Читать далее »

Алгоритм имитации отжига

навеян физическими аналогиями. Отжигом называется процесс нагрева образца с последующим медленным охлаждением. Поскольку сначала атомы заставляют попрыгать, а затем постепенно «отпускают вожжи», то они переходят в новую низко- энергетичную конфигурацию.

Читать далее »

Более сложные способы классификации: ядерные методы и машины опорных векторов

В предыдущих статьях мы рассмотрели несколько классификаторов: деревья решений, байесовские классификаторы и нейронные сети. Сейчас мы ознакомимся с линейными классификаторами и ядерными методами, и это послужит прелюдией к одному из самых продвинутых методов классификации, который все еще является предметов активных исследований, – машинам опорных векторов (Support Vector Machines – SVM).

Читать далее »

Рекурсивное построение дерева

Чтобы оценить, насколько хорош выбранный атрибут, алгоритм сначала вычисляет энтропию всей группы. Затем он пытается разбить группу по возможным значениям каждого атрибута и вычисляет энтропию двух новых групп. Для определения того, какой атрибут дает наилучшее разбиение, вычисляется информационный выигрыш, то есть разность между текущей энтропией и средневзвешенной энтропией двух новых групп. Он вычисляется для каждого […]

Читать далее »

Моделирование степени привлекательности

Hot or Not – это сайт, на который пользователи могут загружать собственные фотографии. Первоначально идея состояла в том, чтобы одни пользователи могли оценивать внешность других. Собранные результаты обрабатывались, и каждому человеку выставлялась оценка от 1 до 10. С тех пор Hot or Not превратился в сайт знакомств и теперь предоставляет API, позволяющий получать демографическую информацию

Читать далее »

Графическое представление вероятностей

Чтобы не гадать, какие диапазоны апробировать, можно создать графическое представление плотности распределения вероятности. Для построения графиков существует отличная библиотека matplotlib, которую можно скачать с сайта http://matplotlib.sourceforge.net.

Читать далее »

В каких случаях применять деревья решений

Пожалуй, основное достоинство деревьев решений – это простота интерпретации обученной модели. Применив алгоритм к рассмотренной задаче, мы получили не только дерево, способное делать прогнозы о поведении новых пользователей, но и список вопросов, на которые нужно ответить для выработки решения. Например, видно, что люди, приходящие на данный сайт с сайта Slashdot, никогда не становятся платными подписчиками, […]

Читать далее »

Условная вероятность

Вероятность – это характеристика частоты возникновения некоторого события. Обычно ее записывают следующим образом: Pr(A) = x, где A – событие. Например, можно сказать, что сегодня вероятность дождя составляет 20%, и записать это в виде Pr(Дождь) = 0,2. Если бы, выглянув в окно, вы увидели, что небо в тучах, то могли бы заключить, что шансы на […]

Читать далее »
 
Rambler's Top100