Дисперсия

измеряет степень разброса списка чисел относительно их среднего значения. Она часто используется в статистике для определения того, насколько велики различия между членами некоторого набора. Вычисляется она путем усреднения квадратов разностей между каждым числом и средним, как показано в формуле B.8.

Формула B.8.

Ниже приведена простая функция, реализующая эту формулу:

def variance(vals): mean=float(sum(vals))/len(vals) s=sum([(v-mean)**2 for v in vals]) return s/len(vals)

Ранее дисперсия использовалась при моделировании с помощью деревьев решений, чтобы определить, как лучше разбить множество, чтобы подмножества оказались более «кучными».

Вы можете следить за любыми ответами на эту запись через RSS 2.0 ленту. Вы можете оставить ответ, или trackback с вашего собственного сайта.

Оставьте отзыв

XHTML: Вы можете использовать следующие теги: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

 
Rambler's Top100