Построение ценовых моделей

Мы рассмотрели несколько классификаторов, большая часть которых хорошо приспособлена для прогнозирования того, к какой категории принадлежит новый образец. Однако байесовские классификаторы, деревья решений и машины опорных векторов   не оптимальны для выработки прогнозов о числовых данных на основе многих различных атрибутов, например цен. В этой статье мы рассмотрим алгоритмы, которые можно не только обучить делать числовые прогнозы, исходя из предъявленных им ранее образцов, но даже показывать распределение вероятностей прогноза, чтобы пользователю было проще интерпретировать цепочку рассуждений.

Применение этих алгоритмов мы рассмотрим на примере построения моделей прогнозирования цен. Экономисты считают, что цены, особенно аукционные, – хороший способ использования коллективного разума для определения реальной стоимости вещи; на большом рынке, где много продавцов и покупателей, цена обычно достигает оптимального для обоих участников сделки значения. Прогнозирование цен – это, ко всему прочему, неплохой тест для такого рода алгоритмов, поскольку на цену обычно влияет множество разнообразных факторов. Например, участвуя в торгах по ноутбуку, вы принимаете в расчет тактовую частоту процессора, объем памяти, емкость дисков, разрешение экрана и т. д.

Важной особенностью числового прогнозирования является определение того, какие переменные существенны и в каких сочетаниях. Так, в случае ноутбука есть несколько переменных, которые если и влияют на цену, то в минимальной степени, например бесплатные аксессуары или предустановленное программное обеспечение. Кроме того, разрешение экрана не так сильно сказывается на цене, как емкость жесткого диска. Для автоматического определения наилучших весов переменных мы воспользуемся методами оптимизации.

Вы можете следить за любыми ответами на эту запись через RSS 2.0 ленту. Вы можете оставить ответ, или trackback с вашего собственного сайта.

Оставьте отзыв

XHTML: Вы можете использовать следующие теги: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

 
Rambler's Top100