Посты для тега : ‘crummy’

Beautiful Soup

Библиотека – это написанный на Python анализатор документов в форматах HTML и XML. Он спроектирован так, что способен работать с плохо написанными веб-страницами. В книге мы неоднократно применяли эту библиотеку для создания наборов данных с сайтов, не имеющих API, а также для выделения из страниц текста для индексирования. Домашняя страница библиотеки – http://www.crummy. com/software/BeautifulSoup.

Читать далее »
 
Rambler's Top100