Метод опорных векторов

Рассмотрим снова задачу отыскания прямой, разделяющей два класса. На рис. 9.9 приведен пример. Показаны средние точки для каждого класса и соответствующий им разделитель.

Обратите внимание, что разделяющая линия, вычисленная на основе средних, неправильно классифицирует две точки, потому что они оказались к ней гораздо ближе, чем большая часть данных. Проблема в том, что, поскольку почти все данные находятся далеко от разделителя, эти точки не учитывались при его построении.

Для создания классификаторов, решающих эту проблему, широко применяется метод опорных векторов. Смысл его в том, чтобы найти

Рис. 9.9. Линейный классификатор по средним неправильно классифицирует точки

линию, которая отстояла бы максимально далеко от каждого класса. Эта линия, называемая гиперплоскостью с максимальным отступом, изображена на рис. 9.10.

Разделитель выбран так, чтобы параллельные линии, задевающие точки из каждого класса, отстояли от него максимально далеко. Как и раньше, для классификации новой точки достаточно посмотреть, по какую сторону от разделителя она оказалась. Обратите внимание, что для вычисления положения разделителя нужны только точки, отстоящие от него на величину отступа; все остальные данные можно вообще отбросить, а положение разделителя от этого не изменится. Точки, лежащие близко к разделителю, называются опорными векторами. Алгоритм, который находит опорные векторы и по ним строит разделитель, называется машиной опорных векторов.

Вы уже видели, как линейный классификатор можно превратить в нелинейный с помощью перехода к ядру при условии, что сравнение выполняется с помощью скалярного произведения. Машины опорных векторов тоже пользуются скалярным произведением, поэтому могут применяться совместно с ядерными алгоритмами для нелинейной классификации.

Рис. 9.10. Нахождение наилучшего разделителя

Применения машин опорных векторов

Поскольку машины опорных векторов хорошо работают с многомерными наборами данных, то чаще всего они применяются при решении научных и других задач, требующих трудоемкой обработки очень сложных данных, например:

•  Классификация выражений лица.

•  Обнаружений вторжений на военные объекты.

•  Прогнозирование структуры белков по их последовательности.

•  Распознавание рукописных данных.

•  Определение потенциального ущерба от землетрясения.

Вы можете следить за любыми ответами на эту запись через RSS 2.0 ленту. Вы можете оставить ответ, или trackback с вашего собственного сайта.

Оставьте отзыв

XHTML: Вы можете использовать следующие теги: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

 
Rambler's Top100