Посты для тега : ‘кластеризации’

Применение кластеризации баз данных в облачной среде

В целом, хорошая новость заключается в том, что облачная среда создает очень мало специфических проблем с кластеризацией баз данных. Плохая же новость состоит в том, что каждый конкретный движок базы данных использует свой механизм кластерной обработки (или даже несколько различных подходов к кластеризации), и по этой причине детальное рассмотрение кластеризации баз данных в облачной инфраструктуре […]

Читать далее »

Иерархическая кластеризация

Кластеризация применима к любому набору образцов, имеющих одно или несколько числовых свойств. В приведенном ранее примере свойствами блогов были счетчики слов, но, в принципе, для кластеризации подойдет любой набор чисел. Для демонстрации работы алгоритма кластеризации рассмотрим простую таблицу образцов (какие-то буквы алфавита) и некоторые числовые свойства (табл. 12.7).

Читать далее »

Кластеризация методом K-средних

Иерархическая кластеризация дает на выходе симпатичное дерево, но у этого метода есть два недостатка. Древовидное представление само по себе не разбивает данные на группы, для этого нужна дополнительная работа. Кроме того, алгоритм требует очень большого объема вычислений. Поскольку необходимо вычислять попарные соотношения, а затем вычислять их заново после объединения элементов, то на больших наборах данных […]

Читать далее »

Иерархическая кластеризация

Алгоритм иерархической кластеризации строит иерархию групп, объединяя на каждом шаге две самые похожие группы. В начале каждая группа состоит из одного элемента, в данном случае – одного блога. На каждой итерации вычисляются попарные расстояния между группами, и группы, оказавшиеся самыми близкими, объединяются в новую группу. Так повторяется до тех пор, пока не останется всего одна […]

Читать далее »

Кластеризация

Ранее мы видели еще один метод обучения без учителя – кластеризацию. Там данные были организованы в виде такой же матрицы, что и здесь. Если написанный тогда модуль еще сохранился, импортируйте его в сеансе работы с интерпретатором и примените к только что заданной матрице алгоритм кластеризации: >>> import clusters

Читать далее »

Кластеризация методом K-средних

Еще один метод кластеризации – это метод ^-средних. Если при иерархической кластеризации создается дерево образцов, то метод .^-средних разбивает данные на отдельные группы. Но перед началом работы алгоритма вы должны задать количество желаемых групп. На рис. 12.14 иллюстрируется кластеризация методом . -средних в действии. Здесь мы пытаемся найти два кластера в несколько ином наборе данных.

Читать далее »
 
Rambler's Top100