Исследование журналов прокси-серверов в Британской Колумбии

Исследователи Университета Британской Колумбии проводили исследование Web-кэширования на основе семи журиалов прокси-серверов, датированных 1996 и 1997 годами [DMF97]. Эти журналы предоставлены различными учреждениями, включая журналы университетов, комнаний и одного национального прокси-серве- pa. Все эти организации использовали ирокси-сервер Squid, описанный в главе 11 (раздел 11.10.1). Журналы отличались друг от друга по характеру содержащейся в них информации. Каждая журнальная занись включала IP-адрес клиента, время запроса, запрошенный URI и размер ответа. Чтобы защитить интересы пользователей, IP-адреса клиентов были замаскированы путем перевода их в другое представление. Два сервера меняли функцию преобразования каждый депь, что делало невозможным определить, посещал ли данпый пользователь тот же самый сервер в течепие последующих дней; другие пять серверов применяли одну и ту же функцию на протяжении всего периода нротоколировапия. Шесть журпалов были от кэ- ширующих прокси-серверов. Эти журналы включали дополнительное поле, показывающее, был ли запрос удовлетворен из кэша или пет. Записи в седьмом журнале не включали это ноле, по включали значения заголовков Last-Modified и Expires, когда они присутствовали в НТТР-ответе сервера.

В отличие от предыдущего проекта, данный проект не ставил цели статистически охарактеризовать результаты измерений. Вместо эгого журналы были использованы для оцепки эффекгивиости кэширования на прокси-серверах при помощи моделирования. Целью проекта были эксперименты с различными размерами кэша, частотой запросов и разными политиками управления кэшированием, используя модель про- кси-сервера, основанную на Squid. Моделирование являлось цепной альтернативой экспериментам на работающем прокси-сервере. Во-первых, перенастраивать работающие прокси-серверы во всех семи учреждениях не являлось возможным. Во-вторых, использование модели позволило экспериментировать с такими размерами кэшей и такими политиками кэширования, которые были бы педоступиы на работающем прокси-сервере. В-третьих, использование модели позволило повторять эксперимент на различных конфигурациях, используя один и тот же журпал.

Моделирование использовалось для оценки различных конфигураций кэша, вычислялись четыре основные метрики производительности. Производительность кэша оценивалась по отношению числа сообщений-ответов прокси-сервера и числа байтов в ответах, которые были взяты из кэша, а не из ответов сервера, которому был направлен запрос. Запрос удовлетворялся из кэша прокси-сервера, если моделируемый кэш имел актуальную копию запрошенного ресурса, идентифицируемого запрашиваемым URI. При моделировании гакже определялась вероятность того, что кэшируемый ответ не мог быть передан прокси-сервером из-за изменения ресурса на сервере. Кроме того, оценивалось преимущество, которое дает кэш про- кси-сервера в случае его совместного использования разными клиентами, а не одним клиентом при последовательных запросах. Эти метрики были изучены при разпых размерах кэша и разных частотах запросов. Изменение частоты запросов обеспечивалось выборкой запросов из журнала, отправленных случайным набором пользователей. Эго имитировало среду, в которой ирокси-сервер обслуживал небольшое число пользователей, пользовательские предпочтения которых были такими же, как у клиентов исходного журнала.

Отсутствие информации в данных измерений вызвало несколько проблем. Например, неоднозначная идентификация клиентов затрудпяла определение, как часто ресурсы из кэша прокси-сервера использовались совместно несколькими пользователями или последовательно одним и тем же пользователем. Чтобы связать запросы с пользователем требуется паличие уиикалыюго идентификатора запрашивающего клиента на протяжении всего журнала. В двух журналах идентификатор, связанный с IP-адресом, менялся каждый день. Эти два журнала не удалось использовать при изучении популярности ресурсов. В случае других пяти учреждений каждый клиент имел один (замаскированный) идентификатор. При изучении этих пяти журналов пришлось допустить, что имелось однозначное соответствие между клиентами и пользователями. Это не так, если несколько пользователей использовали один компьютер, или один пользователь использовал разные компьютеры для выхода в Internet.

Неполная информация о заголовках ответов серверов, связанных с кэшированием, затруднила определение актуальности ресурсов в кэше моделируемого прокси-сервера. В реальности ресурс мог быть со временем изменен. Но в журналах отсутствовала информация о том, что ресурс изменился, а также когда произошли эти изменения. Несмотря на это в некоторых случаях из журналов Можно было уз- пать, что ресурс оставался актуальным между двумя следующими друг за другом запросами. Журпал прокси-сервера сообщал, удовлетворил ли прокси-сервер запрос из кэша или нет. Если запрос был удовлетворен из кэша, то кэшированиый ответ был в тот момент актуальным. Тогда полученные сведения применялись к моделируемому прокси-серверу. Когда на моделируемый прокси-сервер приходил запрос этого ресурса, предполагалось, что ресурс актуальный и, следовательно, мог быть нередан из кэша.

Источник: Web-протоколы. Теория и практика. — M.: ЗАО «Издательство БИНОМ», 2002 г. – 592 c.: ил.

Вы можете следить за любыми ответами на эту запись через RSS 2.0 ленту. Вы можете оставить ответ, или trackback с вашего собственного сайта.

Оставьте отзыв

XHTML: Вы можете использовать следующие теги: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

 
Rambler's Top100