Характеристики поведения пользователя

Характеристики рабочей нагрузки Web зависят от того, как пользователи загружают Web-страницы с различных сайтов. Заход пользователя на сайт, число страниц, которое оп загружает, и время ожидания между последовательными загрузками вносят свой вклад в трафик.

Сеанс и прибытие запроса

Рабочая пагрузка прокси-, Web-серверов и сети зависит от временных соотношений в последовательности HTTP-запросов, исходящих от клиентов. Нагрузка, обусловленная одним клиентом, может быть смоделирована на трех уровнях: сеансов, переходов между страницами и запросов. Хотя Web-серверы не имеют явных сеансов с пользователями, по серия запросов одного пользователя к одному серверу может рассматриваться как сеанс. Пользовательский сеанс начинается с первого запроса и заканчивается после последнего запроса, после которого следует период иеактивпости. В процессе одного сеанса пользователь выполняет несколько гипер- текстовъос переходов по Web-страницам сайта. Переход соответствует пользовательскому действию, например, щелчку мышью на гииерссылке, отправке формы или вводу URL в адресной строке браузера. Каждый переход инициирует отправку браузером HTTP-запроса на ресурс, за которым, возможно, следуют автоматически генерируемые запросы на встроенные ресурсы, гиперссылки на которые имеются на данной странице.

С точки зрения сервера, каждый сеанс осуществляется с новым пользователем. Некоторые действия, например, создание cookies, могут осуществляться на уровне сеанса. Каждый пользовательский переход инициирует поток НТТР-запросов к серверу. Клиент может установить повое TCP-соединение для обработки запроса или передать запрос но существующему соединению. Модель рабочей нагрузки должна учитывать характеристики прибытия запросов на уровнях сеанса, TCP и HTTP. Временные характеристики начал сеансов могут быть изучены путем измерения времени между началом одного сеанса пользователя и началом сеанса следующего пользователя. Исследования показали, что интервалы между началами сеансов подчиняются экспоненциальному распределению [LNJV99, Fel00bJ. Это одна из редких ситуаций моделирования рабочей нагрузки, которая описывается экспоненциальным распределением.

Однако экспоненциальное распределение не является достаточно точной моде- лыо для описания ТСР-соедипепий и HTTP-запросов, которые часто испытывают всплески из-за изменений пользовательского поведения и автоматической загрузки встроенных ресурсов. Для описания этих эффектов модель нагрузки должна учитывать последовательность переходов во время сеанса работы пользователя, время между последовательными переходами и число встроенных ресурсов на каждой из страниц. Каждый из этих параметров обусловливает всплески HTTP-запросов. Высокая изменчивость означает, что средпее число запросов не может описывать нагрузку сервера. Сервер может получать запросы со значительно большей частотой во время некоторых периодов времени. Эффективная обработка всплесков запросов требует дополпигельпых ресурсов от сервера и сети. Модель рабочей иагрузки, которая не учитывает всплески нагрузки, будег переоценивать потенциальные возможности Web-cepBepa.

Число переходов на сеанс

Число переходов, связанное с сеансом пользователя, оказывает существенное влиянне на рабочую нагрузку сервера. Если типичный пользователь загружает большое число страниц, то нагрузка, обусловленная каждым сеансом, будет складываться из разнообразных передач данных. С другой стороны, если большинство пользователей обращаются только к одной странице, то каждый сеапс будет включать передачу всего одной страницы и ее встроенных элементов. В этом случае серверу нет смысла поддерживать установленное долговременное ТСР-соединепие после пересылки страницы и встроенных изображений, поскольку мала вероятность получения дополнительных запросов от клиента. В дополнение к этому, число переходов на сеапс влияет на эффективность кэширования браузером. Рассмотрим Web-сайт, имеющий ряд изображений, которые одиовременио встроены в несколько страниц. Если пользователь посещает эти страницы, то изображения будут доступны из кэша браузера. Наоборот, если пользовательский сеапс включает в себя единственное обращение к Web-странице, то серверу придется передавать нолпый комплект встроенных изображений для этой страницы.

Пользователи существенно различаются по числу страниц, которые они просматривают на Web-сайте. Некоторые пользователи посещают только основную страницу Web-сайта и не обращаются к другим страницам. Другие могут провести час или более за просмотром различных страниц сайта. Большинство сеансов включает небольшое число переходов (от 4 до 10) [Mah97, LNJV99]. Однако результаты варьируются от сайта к сайту. Например, сайты электронной коммерции пытаются удержать пользователя, в то время как поисковые машины направляют пользователя к содержимому других сайтов. Кроме того, кэширование в браузерах и прокси-серве- pax приводит к уменьшению числа страниц, запрашиваемых с сайта. Число переходов описывается распределением Парето [LNJV99J, это подразумевает, что число переходов некоторых сеансов гораздо больше. чем остальных. В результате небольшая часть посетителей сайта ответственна за большую часть запросов. Когда эти пользователи посещают сайт, то большое число запросов, генерируемое ими, может существенно снизить производительность сервера, наблюдаемую другими пользователями. Следовательно, реалистичная модель рабочей нагрузки должна включать в себя всплески нагрузки на сервер и сеть от таких пользователей.

Временные интервалы между запросами

Время между двумя последовательными запросами пользователя тоже оказывает влияние на рабочую нагрузку сервера и сети. Обычно браузер выдает запросы на встроенные ресурсы в процессе получения и синтаксического анализа содержимого HTML-файла. Однако время между двумя переходами зависит от поведения пользователя. В некоторых случаях пользователь просматривает Web-страницы очень быстро, затрачивая совсем мало времени на изучение содержимого каждой из них. В других случаях пользователь может потратить но несколько минут на чтение страницы до того, как запросит следующую страницу. Время между моментом полпой загрузки страницы и моментом перехода пользователя на другую страницу называется временем обдумывания или бездействия. Характеристики времени бездействия пользователя влияют на эффективность политики закрытия долговременных соединений. Простая политика сервера заключается в разрыве ТСР-соедипеиия после некоторого времени простоя, в течение которого не приходит новых НТТР-запросов. Если время бездействия превышает этот период, то следующий НТТР-запрос потребует установления нового ТСР-соединения.

Типичное время между переходами варьируется от сайта к сайту, считается, что в большинстве случаев это время не превышает 60 секупд. В небольшой части случаев время бездействия является очень большим по сравнению со средним значением. Исследования показали, что время бездействия подчиняется распределению Парето с медленно спадающим хвостом и со зпачепием параметра распределения а около 1.5 [BC98J. Считается, что время бездействия не полностью определяется размером ответа, распределение которого имеет зпачепие параметра а в диапазоне от 1.0 до 1.5.

В общем и целом Web-трафик проявляет изменчивость в нескольких направлениях. Медленно спадающие хвосты распределений вероятностей описывают ряд свойств Web-трафика: размеры ресурсов, размеры ответов, количество встроенных ресурсов в Web-страницу, количество нереходов на сеапс, время между последовательными переходами. В результате сеапсы могут быть смоделированы, как последовательности активных и пассивных периодов, в каждом активпом периоде происходит загрузка страницы и встроенных элементов, а пассивный период соответствует времени бездействия пользователя. Продолжительность как активного, так и пассивного периодов имеют распределения с медленно спадающими хвостами.

Web-трафик состоит их суперпозиции множества последовательностей актив- пых и неактивных периодов, каждый из которых соответствует разным пользователям. В результате нагрузка Web-cepвepa и сети самоподобна, имеется несколько характерных времен существенного измепепия трафика от нескольких микросекунд до нескольких мипут [LTWW94, WTSW97, CB97]. Это свидетельствует о том, что зпачепие средней нагрузки не является хорошей оцеикой для требований к сети или к серверу. Типичный Web-сервер и сетевые компоненты должпы располагать дополнительными возможностями для работы в периоды повышенной нагрузки. Изменчивость Web-трафика также существенно влияет на выбор сервера и сетевых компонентов. Тесты, используемые для прокси-серверов и Web-серверов, должпы предусматривать присущую трафику изменчивость нагрузки. Аналогично оцепка сетевых протоколов, таких как TCP, должна учитывать изменчивость размеров передаваемых данных и нагрузки во времени.

Источник: Web-протоколы. Теория и практика. — M.: ЗАО «Издательство БИНОМ», 2002 г. – 592 c.: ил.

Вы можете следить за любыми ответами на эту запись через RSS 2.0 ленту. Вы можете оставить ответ, или trackback с вашего собственного сайта.

Оставьте отзыв

XHTML: Вы можете использовать следующие теги: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

 
Rambler's Top100