Измерение Web-трафика

Измерение и Анализ Web-трафика играет важную роль в разработке Web-сай- тов, в администрировании Web- и прокси-серверов и в эксплуатации IР-сегей. Кроме того, регистрация передач данных является средством изучения ключевых характеристик трафика и испытания новых методов увеличения производительности Web. состоит из трех основных шагов: наблюдение за передачей данных в каком-либо узле, запись результатов измерений в некотором формате и предварительная обработка записей для последующего анализа. В этой главе мы представляем обзор способов измерения Web-трафика, начиная с мотивации проведения таких измерений. Загем мы рассмотрим пять основных способов наблюдения за Web-графиком: ведепие журнала на клиенте, сервере и прокси-сервере; мониторинг пакетов и активные измерения. Каждая технология имеет преимущества и ограничения, которые влияют на тин регистрируемой информации.

Хотя форматы записи результатов измерений Web-трафика не были стандартизированы, большинство реализаций прокси-серверов и Web-серверов следуют неформальным стандартам но форматам протоколирования. Мы представляем обзор стандартов де-факто ведения журналов Web-серверов и прокси-серверов: Common Log Format (CLF — Общий формат протоколирования) и Extended Common Log Format (ECLF — Расширенный общий формат протоколирования). Так как отсутствуют формальные стандарты регистрации трафика клиентов, мониторинга пакетов и активных измерений, форматы регистрации в различных реализациях отличаются. Далее мы рассмотрим, как размер и разнообразие результатов Web-измере- ний обусловливают проблемы при хранении и анализе данных. Предварительная обработка результатов измерений предоставляет возможность исключить ошибоч- иые записи, ненужные ноля и привести данные к форме, удобной для детального анализа. Выполнение эгих предварительных действий упрощает программы анализа и облегчает использование различных инструментов для храпения, анализа и отображения результатов измерений.

Перечисленные способы измерения трафика имеюг определенные ограничения, которые затрудняют оценку ряда основных характеристик сети. Часть информации может оказаться недоступной в журнале в зависимости от того, где собираются данные и в какие поля записываются. Мы оиишем различные способы косвенного получения отсутствующей информации на основе полей, которые были занисаны в журнал. Затем мы рассмотрим четыре исследовательских проекта, которые демонстрируют приложение методов измерения трафика и получения специфических метрик производительности. Эти четыре проекта изучают особенности рабочей нагрузки Web-серверов, изменчивость трафика, создаваемого Web-клиентами, преимущества кэширования Web-pecypcoB на прокси-серверах и частоту изменений Web-pecypcoB. Мы не будем подробно обсуждать результаты анализа наблюдений, сосредоточив внимание на методах сбора, записи, предварительной обработки и анализа измерений трафика.

Источник: Web-протоколы. Теория и практика. — M.: ЗАО «Издательство БИНОМ», 2002 г. – 592 c.: ил.

Вы можете следить за любыми ответами на эту запись через RSS 2.0 ленту. Вы можете оставить ответ, или trackback с вашего собственного сайта.

Оставьте отзыв

XHTML: Вы можете использовать следующие теги: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

 
Rambler's Top100