Опубликовано: 15 March 2011 ¬ 1:00h.Toma
eBay – это онлайновый аукцион, один из наиболее популярных сайтов в Интернете. Там выставлены миллионы товаров, и миллионы пользователей торгуются и совместно устанавливают цены. Поэтому этот сайт – отличный пример коллективного разума. eBay, ко всему прочему, предоставляет бесплатный API на основе XML, с помощью которого можно производить поиск, получать подробную информацию о товаре и даже […]
Читать далее »
Опубликовано: 14 March 2011 ¬ 12:27h.Toma
Beautiful Soup – это великолепная библиотека для разбора и построения структурированного представления веб-страницы. Она позволяет найти элемент страницы по типу, идентификатору или любому свойству и получить строковое представление его содержимого. Beautiful Soup очень терпимо относится к страницам с некорректной HTML- разметкой, что весьма полезно при генерации наборов данных с вебсайтов.
Читать далее »
Опубликовано: 14 March 2011 ¬ 6:51h.Toma
Для подобных задач необходимо определиться со способом представления потенциальных решений. Функции оптимизации, с которыми вы вскоре ознакомитесь, достаточно общие и применимы к различным задачам, поэтому так важно выбрать простое представление, которое не было бы привязано к конкретной задаче о групповом путешествии. Очень часто для этой цели выбирают список чисел. Каждое число обозначает рейс, которым решил […]
Читать далее »
Опубликовано: 13 March 2011 ¬ 22:37h.Toma
Мы рассмотрели несколько классификаторов, большая часть которых хорошо приспособлена для прогнозирования того, к какой категории принадлежит новый образец. Однако байесовские классификаторы, деревья решений и машины опорных векторов не оптимальны для выработки прогнозов о числовых данных на основе многих различных атрибутов, например цен. В этой статье мы рассмотрим алгоритмы, которые можно не только обучить делать числовые […]
Читать далее »
Опубликовано: 13 March 2011 ¬ 17:24h.Toma
– это разновидность среднего значения, при котором каждому усредняемому наблюдению приписывается определенный Формула B.3. Ниже приведена простая реализация этой формулы в виде функции, принимающей списки значений и весов:
Читать далее »
Опубликовано: 13 March 2011 ¬ 16:30h.Toma
Чтобы воспользоваться уже разработанными функциями оптимизации, нам необходимо представить решение в виде списка чисел. К счастью, для этой задачи найти такое представление совсем просто. У каждого узла есть координаты x и y, поэтому достаточно поместить координаты всех узлов в один длинный список:
Читать далее »
Опубликовано: 12 March 2011 ¬ 12:56h.Toma
Рассмотренные в предыдущих статьях методы оптимизации несколько отличаются от всех прочих; они не столько работают с набором данных, сколько пытаются найти значения, минимизирующие целевую функцию. Ранее были приведены примеры нескольких задач оптимизации: планирование группового путешествия (целевой функцией была комбинация цены билета и времени ожидания в аэропорту), распределение студентов по комнатам в общежитии и рисование графа […]
Читать далее »
Опубликовано: 11 March 2011 ¬ 23:24h.Toma
Описанные в этой книге методы не новы, и, хотя примеры в основном касаются задач коллективного разума, возникающих в Интернете, владение алгоритмами машинного обучения будет полезно и разработчикам программного обеспечения во многих других областях. Особенно это относится к тем отраслям знания, где требуется отыскивать интересные закономерности в больших наборах данных, например: Биотехнология
Читать далее »
Опубликовано: 10 March 2011 ¬ 22:26h.Toma
Теорема Байеса описывает соотношение между условными вероятностями. Обычно она записывается в виде Pr(A | B) = Pr(B | A) x Pr(A) / Pr(B) В применении к нашему примеру эта формула принимает следующий вид: Pr(Категория | Документ) = Pr(Документ | Категория) x x Pr(Категория) / Pr(Документ) В предыдущем разделе мы показали, как вычислить Pr(Документ | Категория), […]
Читать далее »
Опубликовано: 10 March 2011 ¬ 11:55h.Toma
Библиотека – это написанный на Python анализатор документов в форматах HTML и XML. Он спроектирован так, что способен работать с плохо написанными веб-страницами. В книге мы неоднократно применяли эту библиотеку для создания наборов данных с сайтов, не имеющих API, а также для выделения из страниц текста для индексирования. Домашняя страница библиотеки – http://www.crummy. com/software/BeautifulSoup.
Читать далее »