Beautiful Soup
Библиотека – это написанный на Python анализатор документов в форматах HTML и XML. Он спроектирован так, что способен работать с плохо написанными веб-страницами. В книге мы неоднократно применяли эту библиотеку для создания наборов данных с сайтов, не имеющих API, а также для выделения из страниц текста для индексирования. Домашняя страница библиотеки – http://www.crummy. com/software/BeautifulSoup.
Читать далее »