Коэффициент Танимото

измеряет степень схожести двух множеств. В этой книге он использовался для того, чтобы оценить подобие образцов, представленных списками свойств. Пусть есть два множества: A = [рубашка, туфли, брюки, носки] B = [рубашка, юбка, туфли] Их пересечение C равно [рубашка, туфли]. вычисляется по формуле B.4, в которой Na – количество элементов в A, Nb – количество элементов в B, Nc – количество элементов в пересечении C.

В данном случае коэффициент Танимото равен 2/(4 + 3 – 2) = 2/5 = 0,4.

Формула B.4.

Ниже приведена простая функция, которая принимает два списка и вычисляет для них коэффициент Танимото:

def tanimoto(a,b):

c=[v for v in a if v in b]

return float(len(c))/(len(a)+len(b)-len(c))

вес. Оно используется для прогнозирования числовых значений на основе оценок подобия. Взвешенное среднее вычисляется по формуле B.3, в которой Xj, ^, x^ – наблюдения, а w^, ^, wn – веса.

использовался ранее  для вычисления подобия между людьми в процессе кластеризации.

Вы можете следить за любыми ответами на эту запись через RSS 2.0 ленту. Вы можете оставить ответ, или trackback с вашего собственного сайта.

Оставьте отзыв

XHTML: Вы можете использовать следующие теги: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

 
Rambler's Top100