Активные измерения

Журналы клиентов, Web-серверов и прокси-серверов, а гакже результаты мониторинга пакетов обычно не включают достаточной информации, чтобы оцепить производительность с гочки зрения пользователя. Рассмотрим проблему в определении задержки, возникающей при загрузке Web-страницы http://www.foo.com, включая все встроенные изображения. Если одно или более изображений находятся на другом сервере, журнал сервера http://www.foo.com не сможет предоставить информацию обо всех запросах. Даже если все запросы были бы записаны в один журнал на сервере или прокси-сервере, то там бы не было бы подробной временной информации о запросах и ответах. Кроме того, в журнале сервера или ripo- кси-сервера не записывается задержка, обусловленная запросом к DNS-серверу, чтобы преобразовать доменное имя http://www.foo.com в IP-адрес. Журнал клиента, если таковой имеется, запечатлел бы работу одного конкретного пользователя с конкретным набором Web страниц; эта работа будег отличаться от работы других пользователей. Мониторинг пакетов будет перехватывать трафик только одного сегмента сети, а трафик, вызванный одним запросом, может не полностью проходить по данному сегменту.

Использование журпалов клиентов, прокси-серверов и Web-серверов, а также результатов мониторинга пакетов для изучения производительности с точки зрения пользователя имеет два основных ограничения. Во-первых, эти методы измерения регистрируют передачу НТТР-данных в одной точке. Это затрудняет определение производительности «глазами пользователя», а также выявление отдельных составляющих задержки. Во-вторых, эти технологии пассивны в гом отношении, что они наблюдают за пересылкой НТТР-Данных «как есть», без всякого контроля над источниками и временем отправки запросов. Это затрудняет проведение систематических наблюдений за работой Web. Альтернативным подходом является контролируемая отправка запросов и наблюдение за их выполнением. Это называется активными измерениями, в отличие от пассивного анализа данных журналов или мониторинга пакетов. используют клиента для отправки запросов и записи ииформации о последующих ответах, включая время и НТТР-заго- ловки. На практике активные измерения могут проводиться с помощью упрощенного клиента, который не поддерживает всех возможностей браузера. Этот клиент обычно читает входной файл, содержащий список URI, которые падо запросить, и моменты времени, когда эти запросы должны быть отправлены.

Проведение эксиеримепта, основывающегося на активных измерениях, требует ответов на следующие вопросы:

•          Где разместить модифицированные клиенты. Результаты активных измерений очень чувствительны к расположению клиентов. Производительность у разпых пар клиент-сервер разная. Клиенты отличаются с точки зрения скорости доступа, близости к Web-серверу и наличия или отсутствия прокси-серве- ров. Ощущения у клиента с высокоскоростным доступом через локальную сеть будут существенно отличаться от ощущений клиента, подключенного к Internet с помощью низкоскоростного модема. Ощущения пользователя в Соединенных Штатах при запросе Web-страницы с сервера в Северной Америке существенно отличаются от ощущений пользователя в России при обращении к той же странице. Когда Web-сайты реплицируются на разные компьютеры, два клиента не обязательно получат HTTP-ответы от одного и того же компьютера. Один сервер, содержащий копию сайта, может быть силыю загружен, а другой в то же самое время может простаивать. Поэтому произвести активные измерения, результаты которых могли бы считаться репрезентативными, чрезвычайно сложно.

•          Какие запросы создавать. Web-сайты существенно различаются rio производительности. Web-серверы функционируют на различных аннаратных платформах, используют различное серверное программное обеспечение, подключены к различным каналам, популярность установленных на них Web-сайтов также существенно различается. Кроме того, две Web-страницы на одном и том же сайте могут отличаться по размеру, так и по числу и объему встроенных в них изображений. Один подход состоит в выборе репрезентативного па- бора запросов на основе популярности Web-страниц или Web-серверов. Например, список популярных URL может быть получен из предыдущих измерений трафика, например, мониторинга пакетов или протоколирования на прокси-сервере. Тогда модифицированный клиент может воспроизводить эти запросы, чтобы измерить качество доступа к этим страницам с точки зрения пользователя. В качестве альтернативы можно определить, какие сайты включить в эксперимент, rio списку наиболее популярных Web-сайтов. Понятие популярности сайтов и URL может зависеть от масштаба и места проведения эксперимента; например, пользователи в России обращаются к другим сайтам, нежели пользователи в Соединенных Штатах. Выбор Web-сайтов может определяться и другими критериями, например, желанием сравнить сайты, использующие разное серверное программное обеспечение.

•          Какие данные следует собирать. Вопрос о том, какие имеино данные будут собираться во время эксперимента, влияет на то, какие проблемы нроизводи- телыюсти Можно при этом исследовать. Модифицированные клиенты могут регистрировать самую разную информацию о запросах, такую как задержки, связанные с запросами к DNS-серверам, установкой ТСР-соедипепий, пересылкой НТТР-даииых и получением ответов. Но клиенты не могут точно определить источник задержки. Например, журнал не покажет, какие действия выполнил Локальный DNS-сервер, был ли таймаут TCP обусловлен утерей пакета, был ли HTTP-запрос удовлетворен исходным сервером или про- кси-сервером. Дополнительные измерения могут выявить источники задержек. Например, пакеты, перехваченные на клиенте, предоставят более детальную временную информацию, а журналы, собрапиые в других точках маршрута от клиента к серверу, помогут определить, какие Компоненты Web увеличили задержку.

— эффективная технология изучения производительности с точки зрепия пользователя. Тем не менее, многообразие ситуаций, возникающих в сети, затрудняет получение общих выводов из результатов измерений. Определение параметров работы Web требует широкомасштабных экспериментов в разное время, с различным расположением клиентов и с разными сайтами. Для этого необходима широкомасштабная измерительная инфраструктура. В течение нескольких последних лет несколько исследовательских групп разместили программное обеспечение во многих географических регионах с целью проведения активных измерений [BC99, KW00J. Мы более подробно рассмотрим одну из таких платформ измерений [KW00J в главе 15 (раздел 15.4). Компании, такие как Keynote Systems [KeyJ, применяют активные измерения, чтобы оценить производительность различных сайтов и провайдеров.

Источник: Web-протоколы. Теория и практика. — M.: ЗАО «Издательство БИНОМ», 2002 г. – 592 c.: ил.

Вы можете следить за любыми ответами на эту запись через RSS 2.0 ленту. Вы можете оставить ответ, или trackback с вашего собственного сайта.

Оставьте отзыв

XHTML: Вы можете использовать следующие теги: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

 
Rambler's Top100