Посты для тега : ‘вероятности’

Структура турбо декодера. – ЧАСТЬ 1

Итеративный декодер представляет со бой каскадное соединение компонентных декодеров, каждый из которых прин ~ мает решение о переданном символе на основе критерия максимальной апосте" риорной вероятности (рис. 2.36). Каждый декодер имеет два входа:

Читать далее »

Гауссова функция

описывает плотность распределения вероятности нормальной кривой. Она использовалась в книге как весовая функция во взвешенном методе k-ближайших соседей, поскольку ее начальное значение велико и быстро убывает, никогда не становясь равным 0. Формула гауссова распределения с дисперсией о показана ниже:

Читать далее »

Документы и слова

Классификатору, который мы построим, будут необходимы признаки для классификации различных образцов. Признаком можно считать любое свойство, относительно которого можно сказать, присутствует оно в образце или нет. Если классифицируются документы, то образцом считается документ, а признаками – встречающиеся в нем слова. Когда слова рассматриваются как признаки, мы предполагаем, что некоторые слова вероятнее встретить в спаме, чем […]

Читать далее »

Байесовский классификатор

Байесовские классификаторы рассматривались ранее. Мы показали, как построить систему классификации документов, например, для фильтрации спама или разбиения множества документов по категориям при наличии неоднозначных результатов поиска по ключевым словам.

Читать далее »

Наивная классификация

Имея вероятности для слов, входящих в документ, вы должны выбрать какой-то способ комбинирования вероятностей отдельных слов для вычисления вероятности того, что документ в целом принадлежит данной категории. В этой статье мы рассмотрим два разных метода классификации. Оба работают в большинстве случаев, но несколько отличаются по качеству при решении конкретных задач. Предметом этого раздела будет наивный […]

Читать далее »

Графическое представление вероятностей

Чтобы не гадать, какие диапазоны апробировать, можно создать графическое представление плотности распределения вероятности. Для построения графиков существует отличная библиотека matplotlib, которую можно скачать с сайта http://matplotlib.sourceforge.net.

Читать далее »

Условная вероятность

Вероятность – это характеристика частоты возникновения некоторого события. Обычно ее записывают следующим образом: Pr(A) = x, где A – событие. Например, можно сказать, что сегодня вероятность дождя составляет 20%, и записать это в виде Pr(Дождь) = 0,2. Если бы, выглянув в окно, вы увидели, что небо в тучах, то могли бы заключить, что шансы на […]

Читать далее »

Метод Фишера

, названный по имени Р. А. Фишера (R. A. Fisher), – это альтернативный метод классификации, который дает очень точные результаты, особенно применительно к фильтрации спама. Он используется в подключаемом к программе Outlook фильтре SpamBayes, который написан на языке Python. В отличие от наивной байесовской фильтрации, когда для вычисления вероятности всего документа перемножаются вероятности отдельных признаков, […]

Читать далее »
 
Rambler's Top100