Характеристики Web-pecypcoв. Изменения ресурсов

Web-ресурсы изменяются со временем в результате модификации их содержания. Частота изменений и разница между последовательными версиями ресурсов оказывают существенное влияние на множество Web-ириложепий. Например, поисковые серверы зависят от спайдеров, индексирующих Web-страницы. Если Web-страиицы изменятся на исходном сервере, то поисковый сервер вернет пекор- ректный результат в ответ на запрос пользователя. Зпая частоту изменений ресурсов на сайге и значимость этих изменений Можно определить частоту индексирования Web-страииц спайдером. Точно так же изменение содержимого ресурсов влияет на производительность Web-кэширования. Зпая, что некоторые виды ресурсов изменяются чаще, чем другие, Можно сформулировать политику кэширования для браузеров и прокси-серверов. Например, ресурсу, который мепяегся менее часто, может быть отдано предпочтение при кэшировании, обновляя его с исходного сервера менее часто.

Характеристики трафика. Любой ресурс может изменяться между двумя последовательными запросами, а сценарии могут создавать динамически формируемые ответы любых тииов. На практике предполагается, что частота измепепий ресурса зависит от тина содержания. На большинстве Web-сайтов изображения меняются не слишком часто. Некоторые Web-сайты храпят встроенные изображения на отделыюм компьютере, предназначенном для статического содержания, как это будет детально рассмотрено в главе 11 (раздел 11.13). Например, HTML файл http://www.foo.com/in- dex.html может иметь встроенное изображение http://www.foo.com/pic.gif. Точно так же текстовые и HTML-ресурсы часто хранятся как статические файлы на исходном сервере. Эти ресурсы меняются только в случае модификации файлов. Од- нако текстовые и HTML-файлы меняются гораздо чаще, чем изображения. Иногда текстовые и HTML-файлы создаются сценариями в ответ на запросы пользователей. Например, пользователь может обратиться к поисковому серверу, который ищет информацию по ключевым словам. В ответ поисковый сервер возвращает HTML-файл с гиперссылками на найденные Web-страницы. Повторение запроса на следующий день может привести к созданию HTML-файла с другим списком гиперссылок.

Некоторые ресурсы изменяются регулярно, например, ежеминутно, каждые четверть часа, ежечасно или ежедневно [DFKM97, PQOOJ. Приведем примеры регулярно изменяемых Web-pecypcoB с прогнозами погоды или сведениями о котировках акций, обновляемыми через заданное время. Администратор сайта может использовать периодическую природу этих обновлений для сокращения нагрузки на сервер. Эффективное использование заголовков кэшированпых ответов в НТТР/1.1 может снизить частоту запросов для проверки актуальности кэшируемых копий ресурсов. Например, заголовок Expires может указывать время, когда ресурс должен быть обповлеп. Это позволяет уверенно вернуть в ответ на запрос кэшированный документ, будучи уверенным, что оп не будет измепеп на исходном сервере. После истечения времени, заданного в заголовке Expires, любой запрос- будет направляться исходному серверу для получения обновленной копии. Точное задание времени в ответных НТТР-сообтцепиях может уменьшить загрузку исходного сервера и сократить задержку, испытываемую пользователем.

В модели рабочей нагрузки необходимо учитывать частоту измепепий ресурсов. Для некоторых Web-приложений существенен и вид измепепий. Например, HTML-файл может включать счетчик, показывающий число обращений к Web- странице. Этот счетчик изменяется при каждом запросе. В некоторых случаях изменение не являются семантически важным. Пользователю не обязательно знать точное зпачепие счетчика. Как было сказано в главе 7 (раздел 7.3.3), в протокол НТТР/1.1 включепы слабые атрибуты содержимого для случаев, когда два варианта ресурса не являются семантически различными. Администратор сайта, зпая, что изменение ресурса несущественно, может использовать слабые атрибуты содержимого для увеличения эффективности кэширования браузерами и прокси-серверами. В других случаях изменения ресурса могут быть семантически значимыми, но касаться только нескольких байтов. Например, в некоторых текстовых п HTML-фан- лах изменения могут касаться небольшого фрагмента текста, например, номеров телефонов, или гиперссылок, например, на встроенные изображения. Это требует искать пути, позволяющие передавать в HTTP-ответе только изменения, а не весь ресурс. Эта проблема будет рассмотрена в главе 15 (раздел 15.2).

Влияние распространения новых технологий. Частота и виды модификаций ресурсов могут меняться на различных этапах жизпенного цикла Web-сайта. Более широкое использование динамического содержания, например, запросов к базам данных влияет на частоту модификации ресурсов. Если информация в базе данных изменяется со временем, то одинаковые запросы могут приводить к различным результатам. Подобно регулярному изменению цен акций на бирже, приложения мо- гут обусловить периодические измепепия ресурсов. Эволюция инструментальных средств разработки Web-содержания также влияет на частоту изменений ресурсов. Например, ипструмептальпое средство разработки может назначать повый URL для каждой повой версии файла и изымать старый URL, а не связывать один и тот же URL со всеми версиями. Это приведет к умепьшешпо вероятности того, что Web-ресурсы будут меняться со временем. Клиенты могут посылать серверу обновления ресурсов в теле HTTP-запроса. В копечпом счете, в дальнейшем могут возпикпуть новые типы содержания, которые будут меняться чаще или реже типов содержания, которые существуют в настоящее время. На изменяемость ресурсов будут воздействовать приложения, включая средства индексирования Web-co;iep- жапия и кэширования.

Источник: Web-протоколы. Теория и практика. — M.: ЗАО «Издательство БИНОМ», 2002 г. – 592 c.: ил.

Вы можете следить за любыми ответами на эту запись через RSS 2.0 ленту. Вы можете оставить ответ, или trackback с вашего собственного сайта.

Оставьте отзыв

XHTML: Вы можете использовать следующие теги: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

 
Rambler's Top100