Анализ данных с помощью перекрестных запросов и сводных таблиц

 

 

Программа Access приспособлена и нацелена на сохранение всех подробностей в вашей БД. Но иногда вам не нужно знать все детали — взамен вы хотите получить общее представление. Необходим способ получения необработанных данных, которые могут включать сотни и тысячи записей и подведения итогов каким-либо осмысленным образом.

Вы уже познакомились с одним методом анализа больших объемов информации с помощью итогового запроса (см. разд. "Итоговые данные" главы 7). Применяя итоговый запрос, можно взять огромную подборку строк и сократить ее для нескольких искусно сгруппированных промежуточных итогов. В этой главе вы познакомитесь с двумя более специализированными вариантами обработки чисел: перекрестными запросами и сводными таблицами.

Перекрестные запросы и сводные таблицы играют ту же роль, что и уже знакомые вам итоговые запросы. Но они представляют данные несколько иначе. В перекрестных запросах применяются дополнительные столбцы для размещения информации в крайне сжатой таблице. Сводные таблицы используют интерфейс перемещений, позволяющий реорганизовать ваши итоги на лету для выявления различных тенденций и связей. Оба эти средства интенсивно используются в наборе средств любого специалиста Access.

 

 

Примечание

Для опробования перекрестных запросов и сводных таблиц вам нужны данные — большой объем данных. В БД, используемых в качестве примеров в предыдущих главах, нет достаточного количества исходных данных. В примерах этой главы используются некоторые таблицы огромной БД AdventureWorks — примера, предлагаемого корпорацией Microsoft и содержащего каталог товаров и сведения о продажах вымышленного производителя велосипедов. Найдите Web-страницу "Missing CD" для данной книги (на сайте www.missingmanuals.com) для загрузки нужной вам информации.

 

 

О перекрестных запросах

Перекрестный запрос — это мощное средство подведения итогов, исследующее большие объемы данных и применяющее их для вычисления промежуточных итогов и средних значений. Это определение может показаться знакомым, поскольку вы уже именно для этой цели использовали итоговые запросы в главе 7.

Как и итоговые запросы, перекрестные применяют два основных компонента: группировку и функции подведения итога. Группировка применяется для объединения строк в

 

небольшие подмножества. Функция подведения итога используется для вычисления единого значения для каждой группы.

За кадром перекрестные и итоговые запросы функционируют почти одинаково. Принимают большие количества записей и сокращают их до итогов, средних, минимальных или максимальных значений и т. д. Но есть два важных отличия.

Первое отличие заключается в том, в перекрестных запросах всегда применяется двухуровневая группировка. Например, в типичных итоговых запросах можно сгруппировать записи по товарам и увидеть самые ходовые из них или размер приносимого ими дохода. В перекрестном запросе можно проанализировать данные о продажах в зависимости от страны и категории товара. С помощью такого анализа вы сможете быстро определить, какие категории товаров особенно популярны в конкретных странах.

Рис. 9.1. Вверху: в итоговом запросе каждая группа занимает отдельную строку, отображая объемы продаж отдельной категории товаров в одной стране. В общем получается 24 группы, и в результате формируется длинный узкий список. Внизу: в перекрестном запросе программа Access применяет первый уровень группировки (в данном случае страну) для разделения данных на строки и следующий уровень (категорию товара) для распределения каждой строки по столбцам. Числа, которые вы видите, те же самые, что и на верхнем рисунке, но теперь у вас всего 6 строк с четырьмя категориями товаров в каждой

 

Другое отличие перекрестных запросов от итоговых заключается в способе представления программой Access результатов. Итоговый запрос создает отдельную строку для каждой группы. Например, если вы анализируете продажи в разных странах различных категорий товаров, итоговый запрос выведет строку для каждой комбинации страны и категории товаров, как показано в верхней части рис. 9.1. Перекрестный запрос действует несколько иначе; он использует ту же информацию, но располагает ее в отдельных столбцах, создавая более сжатое представление (нижняя часть рис. 9.1).

На рис. 9.1 внизу показано, как выглядят данные с двумя уровнями группировки: страны и товары. Но если хотите, в перекрестных запросах можно применять и больше уровней. (Большее число уровней группировки полезно для выполнения более детального анализа — например, для определения, какие товары особенно популярны в конкретных странах, штатах и городах.) В этом случае последний уровень группировки используется для разделения строки на столбцы. Все остальные уровни применяются для разбиения результатов на большее число строк. Если создать перекрестный запрос, группирующий объемы продаж по категориям товаров, названиям товаров и странам, вы увидите результат, показанный на рис. 9.2.

Рис. 9.2. В данном примере записи сгруппированы в строки по категориям товаров и затем разделены на отдельные товары. Затем данные по каждому товару дополнительно делятся на столбцы в зависимости от страны

 

 

Примечание

Помните о том, что при использовании нескольких уровней группировки последний уровень (используемый для формирования столбцов) не должен быть связан с другими уровнями. В то

 

время как другие уровни группировки могут быть связаны между собой. Пример на рис. 9.2 работает, потому что следует этому правилу (группировка по категории, товару и затем стране). Если эти же данные сгруппировать иначе (например, по категории, стране и товару), результат будет далеко не так хорош.

 

 

Итоговый проигрыш; итоговый запрос против перекрестного

 

    Что лучше: итоговый или перекрестный запрос?

Все зависит от типа информации, которую вы хотите анализировать, и от способа ее структурирования. Далее приведены несколько рекомендаций, которые помогут решить, какой вариант больше подходит для ваших данных.

•    Если вы хотите сгруппировать в зависимости от одного поля (как показано, например, на верхнем рис. 9.1), используйте итоговый запрос. У перекрестных запросов всегда, по меньшей мере, два уровня группировки.

•    Если вы хотите выполнять несколько типов вычислений (например, находить среднее и итоги или минимальные и максимальные значения), применяйте итоговый запрос. Из-за своего компактного формата перекрестные запросы могут отображать только одно вычисляемое значение в каждой группе. Итоговые запросы выводят на экран столько вычисляемых значений, сколько вам нужно, поскольку каждое из них помещается в отдельный столбец.

•    Если вы хотите сравнить одну группу с другой, применяйте перекрестный запрос. В этом у перекрестных запросов нет равных. Они размещают подгруппы в одной строке, поэтому тенденции видны с первого взгляда. Примером может служить рис. 9.1. В перекрестном запросе легко установить, какие приспособления принесли меньше всего денег независимо от страны, на которую вы смотрите. В итоговом запросе для проведения такого же сравнения вашим глазам пришлось бы перебегать со строчки на строчку вверх и вниз.

•    Если ваши условия группировки в результате приводят к большому числу групп, подумайте о применении итогового запроса. Перекрестный запрос может читаться с трудом, если в него включено много столбцов. (Другая возможность — использование фильтрации для сокращения числа групп.)

•    Если применяются два независимых уровня группировки, используйте перекрестный запрос. Например, категория товаров и страна клиента — полностью независимые критерии отбора. Вы не можете узнать, любят ли в конкретных странах определенные категории, пока не пороетесь в числах. Для подобной организации информации очень подходит перекрестный запрос. С другой стороны, категория товаров и название изделия связаны друг с другом. Каждый товар попадает в заданную категорию и ни один не может оказаться в нескольких категориях. Если такой способ группировки применить в перекрестном запросе, пропадет много свободного пространства, как показано на рис. 9.3.

Во многих ситуациях можно попробовать оба подхода — создать и итоговый запрос, и перекрестный — а затем сравнить их, чтобы понять, какое представление информации вам больше нравится.

 

Рис. 9.3. Считайте это предостережением: не применяйте для группировки в перекрестном запросе связанные поля. В данном примере строки сгруппированы по названию товара, а столбцы по категории товаров. Проблема состоит в том, что каждый товар включен только в одну категорию, поэтому в каждой строке данные есть лишь в одном столбце — столбце с категорией данного товара. Для решения проблемы и формирования более наглядной сводки можно использовать три уровня группировки, как показано на рис. 9.2

 

 

Вы можете следить за любыми ответами на эту запись через RSS 2.0 ленту. Вы можете оставить ответ, или trackback с вашего собственного сайта.

Оставьте отзыв

XHTML: Вы можете использовать следующие теги: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

 
Rambler's Top100