Посты для тега : ‘имеется’

Коэффициент Джини

измеряет неоднородность набора. Если имеется набор [A, A, B, B, B, С], то коэффициент Джини – это вероятность того, чтобы вы ошибетесь, выбрав какой-то элемент и попытавшись случайно угадать его метку. Если бы набор состоял только из элементов A, то вы всегда говорили бы A и никогда не ошибались, следовательно, набор полностью однороден.

Читать далее »

pydelicious

– библиотека для получения данных с сайта социальных закладок del.icio.us. Для этого сайта имеется официальный API, который мы использовали в некоторых вызовах, но добавляет кое-какие дополнительные возможности, задействованные нами ранее при построении механизма рекомендования. В настоящее время библиотека размещена на сайте Google Code; вы найдете ее по адресу http://code.google.com/p//source.

Читать далее »

Beautiful Soup

Библиотека – это написанный на Python анализатор документов в форматах HTML и XML. Он спроектирован так, что способен работать с плохо написанными веб-страницами. В книге мы неоднократно применяли эту библиотеку для создания наборов данных с сайтов, не имеющих API, а также для выделения из страниц текста для индексирования. Домашняя страница библиотеки – http://www.crummy. com/software/BeautifulSoup.

Читать далее »

Функции php – Длина строки, Чистка строк

На практике очень часто требуется узнать длину строки. Для этого в РНР имеется специальная функция strlen(), принимающая в качестве входных параметров строку и возвращающая ее длину виде целого числа. 1 2 3 4 5 6 7 8 9 10 11 12

Читать далее »
 
Rambler's Top100