Перспективы исследований, связанных с измерениями

Сбор и анализ данных измерений играет важную роль в оцепке Web-прогоко- лов и программных компонентов. Исследователи часто берут за основу данные из журналов регистрации событий при определении характеристик Web-трафика и оценке новых идей по совершенствованию Web. В связи с этим в сообществе исследователей Web ведется интенсивная работа по поиску эффективных способов получения и обработки данных измерений параметров трафика. Проведение исследований, связанных с измерениями в Web, требует понимания принципов, заложенных в HTTP и других сетевых протоколах, поверх которых оп работает, а также способности разрабатывать эффективное и устойчивое программное обеспечение. В Web-измерениях обычно участвуют большие массивы данных. Подобно другим сетевым протоколам, HTTP не был предназначен для выполнения измерений. Несмотря на важность сбора данных измерений, генерирование точных и исчерпывающих записей измеренных данных не является главной задачей для большинства реализаций Web-серверов и прокси-серверов. В связи с этим подобные за- гшси могуг содержать ошибки и несоответствия, которые осложняют анализ данных. Выявление этих ошибок требует применения специальных программ, проверяющих синтаксис и семантику записей.

Эффективность Web зависит от взаимодействия между рядом протоколов. Время ожидания на стороне пользователя и производительность сервера при НТТР-иере- дачах зависит от транспортного уровня. Эффективность мультимедийных приложений зависит от взаимодействия нескольких протоколов для передачи управляющих сообщений, данных аудио и видео, данных о текущем состоянии сети. Чтобы охарактеризовать взаимодействие между протоколами, необходимо осуществлять детальную трассировку и следить за активностью каждого уровня в стеке протоколов. Традиционные прокси-серверы и Web-серверы не отражают эту информацию в своих журналах. Трассировка пакетов предлагает возможную альтернативу для изучения влияния сети на производительность прикладного уровня. Однако мониторы пакетов обычно собирают данные на сетевом и на транспортном уровнях, не предоставляя информации о протоколах прикладного уровня, такой как HTTP-заголовки, которые могут размещаться в нескольких IP-пакетах. Изучение взаимодействия между прикладным и транспортным уровнями требует наличия программного обеспечения, осуществляющего более сложный мониторинг пакетов, нежели простое извлечение информации о сообщениях прикладного уровня.

В этой главе мы рассмотрим следующие четыре вопроса:

• Мониторинг пакетов НТТР-трафика. Большинство исследований характери- стик Web-трафика основаны на данных из журналов регистрации прокси-сер- веров и Web-серверов. Однако эти журналы обычно не содержат подробной информации о запросах и ответах HTTP, а также о времеииых параметрах различных этапов Web-транзакций. Трассировка пакетов путем мониторинга сети может предоставить гораздо более подробные данные, как уже говорилось в главе 9 (раздел 9.2.4). В этой главе мы опишем проблемы, связанные с перехватом IP-пакетов в сети, восстановлением потока байтов для каждого ТСР-соедииения и восстаповлепием сообщений запросов и ответов HTTP.

•          Анализ журналов Web-серверов. Даниые журналов серверов используются в большинстве исследований. Однако анализ журналов серверов сопряжеи с различными практическими проблемами, обусловленными большим числом записей, часто встречающимися ошибками и различиями в форматах журналов. Предварительная обработка журналов может значительно уменьшить сложность программы анализа, как говорилось в главе 9 (раздел 9.4). В этой главе будут описаны программы синтаксического анализа, фильтрации, преобразования и анализа серверных журналов. В ходе обсуждения будут затронуты некоторые подводпые камни, встречающиеся при обработке серверных журналов, и описано, как воспользоваться имеющимися библиотечными процедурами для разработки иадежпого и эффективного программного обеспечения.

•          Общедоступные журналы и результаты трассировки. Важность измерений параметров Web-трафика для исследований способствовала усилиям по созданию ренозиториев общедоступных журналов и результатов трассировки. Данные измерений обычно являются доступными в Web. Мы представим краткий обзор существующих Web-сайтов, предоставляющих доступ к данным измерений. Большинство этих сайтов предоставляют доступ к данным в различных форматах по принципу «как есть». Консорциум World Wide Web Consortium (W3C) разработал официальное описание синтаксиса и семантики серверных журналов и предоставляет доступ к падежным, сертифицированным журналам в одинаковом формате.

•          Измерение параметров мультимедийных потоков. Хотя большинство работ по измерению в Web посвящены НТТР-трафику, нревращеиие мультимедийных нотоков в важное Web-приложение подвигло на ряд исследований по измерению параметров мультимедийного трафика. При измерениях, проводимых на потоках аудио и видео, берутся в расчет те же самые параметры рабочей нагрузки, что и для НТТР-трафика, однако учитываются и уникальные для мультимедийных данных характеристики. Измерение характеристик мультимедийного трафика порождает новые проблемы, вызванные наличием Группы различных протоколов для потоков аудио и видео, о чем говорилось ранее в главе 12 (раздел 12.3). Мы позиакомимся с четырьмя исследованиями, основанными на статическом анализе мультимедийных файлов в Web, анализе журиалов мультимедийных серверов, мониторинге пакетов аудиоиередач и методах мониторинга пакетов для сбора управляющих сообщений и пакетов данных.

На протяжении главы будет подчеркиваться важная роль программного обеспечения в сборе и анализе измерений трафика.

Источник: Web-протоколы. Теория и практика. — M.: ЗАО «Издательство БИНОМ», 2002 г. – 592 c.: ил.

Вы можете следить за любыми ответами на эту запись через RSS 2.0 ленту. Вы можете оставить ответ, или trackback с вашего собственного сайта.

Оставьте отзыв

XHTML: Вы можете использовать следующие теги: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

 
Rambler's Top100