В каких случаях применять метод k-ближайших соседей

У метода k-ближайших соседей есть несколько недостатков. Прогнозирование потребляет очень много вычислительных ресурсов, так как приходится вычислять расстояния до каждой точки. Кроме того, если в наборе данных много переменных, то трудно подобрать подходящие веса и определить, какие переменные несущественны. Оптимизация может помочь, но отыскание хорошего решения для большого набора данных отнимает много времени.

И все же, как вы могли убедиться, метод kNN обладает рядом преимуществ по сравнению с другими методами. Оборотной стороной вычислительной сложности прогнозирования является тот факт, что новые наблюдения можно добавлять без каких бы то ни было временных затрат. К тому же результаты легко поддаются интерпретации, так как вы знаете, что прогнозирование основано на вычислении средневзвешенных значений других наблюдений.

Хотя определение весов может оказаться сложным делом, но если они уже вычислены, то позволяют лучше понять характеристики набора данных. Наконец, если вы подозреваете, что в наборе не учтены какие- то существенные переменные, то можно построить график распределения вероятностей.

Вы можете следить за любыми ответами на эту запись через RSS 2.0 ленту. Вы можете оставить ответ, или trackback с вашего собственного сайта.

Оставьте отзыв

XHTML: Вы можете использовать следующие теги: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

 
Rambler's Top100