Что такое машинное обучение

Машинное обучение – это одна из дисциплин искусственного интеллекта (ИИ), имеющая дело с алгоритмами обучения компьютеров. В большинстве случаев это означает, что алгоритму подается на вход набор данных, а он выводит информацию о свойствах этих данных, причем так, что на основе выведенной информации способен делать предсказания о данных, которые может увидеть в будущем. Это возможно потому, что практически все неслучайные данные содержат какие-то закономерности (паттерны) и, выявив их, машина способна сделать обобщение. Чтобы наделить машину способностью к обобщению, ей надо задать модель, которая определяет, какие аспекты данных считать существенными.

Чтобы понять, как устроена модель, рассмотрим простой пример из довольно сложной области фильтрации почтового спама. Предположим, вы получаете кучу спама, содержащего слова online pharmacy. Вы – человек и от природы наделены способностью распознавать закономерности, поэтому сразу же понимаете, что любое сообщение, содержащее фразу online pharmacy, надлежит отправлять прямиком в Корзину. Это обобщение – вы фактически создали мысленную модель того, что такое спам. После того как вы несколько раз показали, что считаете такие сообщения спамом, алгоритм машинного обучения, предназначенный для фильтрации спама, должен быть способен сделать такое же обобщение.

Существует много алгоритмов машинного обучения, у каждого есть свои сильные и слабые стороны, каждый предназначен для решения определенного класса задач. Некоторые, например деревья решений, прозрачны, то есть наблюдатель понимает весь ход рассуждений машины. Другие, например нейронные сети, представляют собой «черный ящик», то есть выдают ответ, но воспроизвести ход рассуждений часто бывает очень сложно.

В основе многих алгоритмов машинного обучения лежит серьезная математика и статистика. Согласно данному мной ранее определению можно даже сказать, что простой корреляционный и регресионный анализ – тоже формы машинного обучения. В этой книге не предполагается, что читатель хорошо знаком с математической статистикой, поэтому я старался объяснять применяемые методы настолько просто, насколько возможно.

Вы можете следить за любыми ответами на эту запись через RSS 2.0 ленту. Вы можете оставить ответ, или trackback с вашего собственного сайта.

Оставьте отзыв

XHTML: Вы можете использовать следующие теги: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

 
Rambler's Top100