Хранилища данных (ХД, или Data Warehouse, DW) - особые базы данных, которые используются для построения отчетности, а не для текущей работы информационных систем. ХД нужны для снижения нагрузки на текущие базы данных (БД для хранения текущих транзакций - OLTP), для хранения агрегированных данных за большие периоды времени, для совмещения в одной базе данных из разнородных источников. В ХД должны попадать однородные, очищенные от пропусков, "мусора" и дублей данные. Строить отчетность, OLAP-кубы на основе таких согласованных данных - одно удовольствие. В противном случае разработчик отчетов обречен при процессинге отчетов вначале потратить время на очистку данных, а затем уже на отладку отчетности.

Очень хорошо о причинах необходимости ХД сказано здесь: http://www.bipartner.ru/resources/7reasons.html

 

Половина успеха в формировании OLAP-куба - подготовка модели данных. Если модель выбрана неверно, то весь последующий труд напрасен. Важное правило: когда смотрим от меры к измерению, для каждой строки таблицы фактов должна существовать только 1 запись таблицы измерений. Связь должна быть однозначна. В противном случае, конкретное измерение не сможет "разрезать" меру и куб будет показывать одинаковые фактические значения для всех атрибутов измерений.