Посты для тега : ‘категории’

Наивная классификация

Имея вероятности для слов, входящих в документ, вы должны выбрать какой-то способ комбинирования вероятностей отдельных слов для вычисления вероятности того, что документ в целом принадлежит данной категории. В этой статье мы рассмотрим два разных метода классификации. Оба работают в большинстве случаев, но несколько отличаются по качеству при решении конкретных задач. Предметом этого раздела будет наивный […]

Читать далее »

Краткое введение в теорему Байеса

Теорема Байеса описывает соотношение между условными вероятностями. Обычно она записывается в виде Pr(A | B) = Pr(B | A) x Pr(A) / Pr(B) В применении к нашему примеру эта формула принимает следующий вид: Pr(Категория | Документ) = Pr(Документ | Категория) x x Pr(Категория) / Pr(Документ) В предыдущем разделе мы показали, как вычислить Pr(Документ | Категория), […]

Читать далее »

Метод Фишера

, названный по имени Р. А. Фишера (R. A. Fisher), – это альтернативный метод классификации, который дает очень точные результаты, особенно применительно к фильтрации спама. Он используется в подключаемом к программе Outlook фильтре SpamBayes, который написан на языке Python. В отличие от наивной байесовской фильтрации, когда для вычисления вероятности всего документа перемножаются вероятности отдельных признаков, […]

Читать далее »

Выбор компонентов и категории среды передачи для неэкранированной витой пары

Из сказанного выше очевидно, что сетевые адаптеры для неэкранированной витой пары обеспечивают скорости передачи 10 Мбит/с, 100 Мбит/с и 1000 Мбит/с. Для 10 Мбит/с и 1000 Мбит/с выбор сравнительно невелик: lOBaseT и lOOOBaseT. Хотя для передачи на скорости 100 Мбит/с описаны три типа сетевых UTP- адаптеров, рынок сузил этот выбор до одного — 100BaseTX, который […]

Читать далее »
 
Rambler's Top100