Характеристики рабочей нагрузки

Модель рабочей нагрузки состоит из набора параметров, определяющих ключевые особенности нагрузки, на которые влияют расположение ресурсов и производительность системы. В этом разделе будут обсуждепы побудительные мотивы для описания и онределепия параметров модели рабочей нагрузки Web.

Применение модели нагрузки

Модель нагрузки может использоваться в различных задачах оцепки производительности, например:

•          Выявление проблем с производительностью. У Web-сервера могут быть проблемы с производительностью, включая педоиустимо большое время ответа, пизкая пропускная способность в условиях, возникающих в определенное время су гок. Определение причип требует тестирования сервера при реалыюй пагрузке. Нахождение решения проблемы может потребовать многократного тестирования в условиях такой нагрузки.

•          Компоненты для тестирования производительности. Решение о приобретении прокси-сервера или Web-сервера зависит от цепы и производительности. Сравнение производительности различных конфигураций требует приложения одинаковых воспроизводимых пагрузок к каждой из пих. Нагрузка долж- на отражать основные свойства Web-трафика для того, чтобы результаты моделирования давали представление о том, как дапиая конфигурация будет работать на практике. Тесты производительности Можно также использовать для оцепки новых конфигураций еще до их развертывания.

•          Планирование производительности. Производительность зависит от пропускной способности сети, мощности процессора, объема дисковой подсистемы, имеющейся оперативной памяти ирокси- и Web-серверов. Например, перегруженный Web-сайт Можно реплицировать на песколько компьютеров. Решение о том, сколько компьютеров нужно для сай га, определяется компромиссом между ценой и производительностью. Оценка производительности конфигурации зависит от наличия точной модели ожидаемой нагрузки.

Модели нагрузки имеют ряд преимуществ и недостатков по сравнению с другими популярными методами определения производительности Web. Один из естественных подходов заключается в построении запросов, непосредственно исходя из имеющихся журналов Web-компонентов. Преимущество повторного использования журналов состоит в воспроизведении известной рабочей нагрузки, избегая промежуточных шагов анализа трафика. Этот подход особенно полезен для понимания специфичных ситуаций, вызвавших появление проблем с производительностью. Однако повторное использование журналов не обеспечивает достаточной гибкости, если необходимо изменять нагрузку. Кроме того, использование журналов не позволяет четко разделить факторы, обусловленные рабочей нагрузкой и производительностью системы. Записи в журналах зависят от текущей производительности системы. Использование этих данных при других конфигурациях системы может привести к неправильным выводам. Например, анализ данных, полученных на перегруженном сервере, может выявить длительные задержки между последовательными запросами и малое число обращений пользователей на сеанс работы с сервером. Однако эти свойства могу оказаться результатом исключительно низкой производительности сервера, а не факторов, определяющих рабочую нагрузку сервера.

Другой подход заключается в передаче запросов с максимальной частотой для испытания сервера в экстремальных условиях. Такое стрессовое тестирование является важной частью оценки повой системы. Однако производительность системы под такой нагрузкой может не дать представление о том, как система будет работать при реальной нагрузке. Генерация потоков запросов с помощью модели нагрузки исключает некоторые недостатки представленных выше подходов. В противовес па- грузке, сгенерированной по журпалу, синтезированная нагрузка создается на основе математической модели, которая может быть протестирована, проанализирована и критически рассмотрена. В противовес стрессовой нагрузке, синтезированная па- грузка имеет возможности для представления основных свойств реального Web-тра- фика. Что особенно важно, модели рабочей нагрузки представляют возможности для оценки производительности системы в контролируемом режиме с помощью изменения значений параметров распределений вероятностей. Эти эксперименты позволяют исследовать влияние отдельных параметров на производительность системы в целом, а также узнать, как меняется поведение системы при изменении рабочей нагрузки.

Выбор параметров рабочей нагрузки

Для того чтобы убедиться, что модель нагрузки отражает реальную нагрузку, параметры модели должны иметь определенные свойства:

•          Независимость от системы. Параметры модели не должпы зависеть от используемой системы, например, от реализация прокси-сервера или Web-cepвера. Модель нагрузки не должна включать такую информацию, как время реакции пользователя, производительность сервера, процент утерянных пакетов, т.к. эти параметры зависят от серверной платформы и нагрузки на сеть. Однако трафик, синтезированный с помощью модели нагрузки, может использоваться для оцепки этих параметров для отделыю взятой платформы.

•          Надлежащий уровень детализации. Для оцепки производительности системы параметры должпы представлять рабочую пагрузку на соответствующем уровне детализации. Например, модель рабочей нагрузки на сетевом уровне может включать параметры, связанные с размерами IP-пакетов и номерами пакетов. Модель рабочей нагрузки на прикладном уровне может включать время между успешными HTTP-запросами клиента и размер ответных НТТР-сообщений, по не внутреннее их содержимое.

•          Независимость от других параметров. Зависимость между параметрами нагрузки усложняет работу по получению простой модели нагрузки, которая достаточно точно представляет реальный Web-график. Однако выбрать достаточно малое число независимых параметров на практике очепь трудно. Например, размер ресурса обычно связан с типом содержания. В модель Можно ввести дополнительный параметр для отражения этой зависимости. Например, модель может включать такие параметры, как размеры HTML-докумеп- тов и размеры изображений.

Модели нагрузки меняются во времени вместе развитием систем. В таблице 10.1 приведен список параметров рабочей нагрузки, выбранных за несколько лет измерений Web-трафика. Первая категория охватывает основные характеристики НТТР-сообщений: методы запросов и коды ответов, что иллюстрирует, к^к протокол используется на практике. Вторая категория охватывает основные свойства Web-pecypcoB, включая тип содержания, размер и популярность. Третья категория включает поведение пользователя, посещающего Web-сайт, включая время между обращениями различных пользователей и число гипертекстовых переходов на ce- апс работы с Web-сайтом.

Таблица 10.1. Примеры параметров рабочей нагрузки Wcb

Категория

Параметр

Протокол

Метод запроса Код ответа

Ресурс

Тип содержания

Размер ресурса

Размер ответа

Популярность

Частота обновления

Временное местоположение

Количество встроенных ресурсов

Пользователи

Время между двумя сеансами

Число гипертекстовых переходов на сеанс

Время между запросами

Эти параметры определяют временные параметры запросов, поступающих на серверы. На практике различные параметры таблицы 10.1 не являются пезависи- мыми друг от друга. Например, время между двумя гипертекстовыми переходами пользователя зависит от размера ответа на запрос. Дальнейшее изучение может обеспечить более детальное понимание зависимостей между параметрами. После краткого введения в статистику и в распределения вероятностей будет изложено текущее понимание характеристик нагрузки Web.

Источник: Web-протоколы. Теория и практика. — M.: ЗАО «Издательство БИНОМ», 2002 г. – 592 c.: ил.

Вы можете следить за любыми ответами на эту запись через RSS 2.0 ленту. Вы можете оставить ответ, или trackback с вашего собственного сайта.

Оставьте отзыв

XHTML: Вы можете использовать следующие теги: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

 
Rambler's Top100