شنبه، 07 خرداد 90 - 07:35
Data warehouse

 

Data warehouse

Data warehouse

DWH یک سیستم کامپیوتری از اطلاعات است که به گونه ای مناسب برای انجام عملیات گزارش گیری و تحلیلی داده ها بر اساس زمان، طراحی شده است. این سیستم اغلب به صورت جداگانه ای از سیستم های عملیاتی روزانه قرار می گیرد. Bill Inmon که از او به عنوان پدر DWH یاد می شود و آن را به این ترتیب تعریف می کند:

  DWH متشکل از یک پایگاه داده و تعدادی جز (component) متصل است با ویژگی های زیر:

موضوع گرا (Subject Oriented): پایگاه داده به گونه ای سازماندهی شده است که تمامی اطلاعاتی که به یک موضوع یا موجودیت خاص مربوط هستند با یکدیگر مرتبط هستند.

متغیر با زمان: تغییرات ایجاد شده در پایگاه داده اولیه در آن اعمال می شوند.

Non-volatile: داده های اطلاعاتی هرگز حذف نشده، با داده های جدید جایگزین نمی شوند.

یکپارچه: اطلاعات موجود در پایگاه داده از سراسر سازمان جمع آوری شده اند و با هم سازگاری دارند .هدف اصلی DWH ایجاد بستری مناسب برای تولید اطلاعاتی است که به Knowledge worker های سازمان (مدیران، عوامل اجرایی و تحلیلگران) برای اتخاذ تصمیم های درست کمک می کند. برای این منظور از DWH در تهیه گزارش ها، اطلاعات تحلیلی، تعامل بلادرنگ با سیستم های عملیاتی وProfiling استفاده می شود.با DWH می توان در سازمان سیستم تصمیم یار (Decision support) ایجاد کرد. اطلاعاتی که در  DWH نگهداری می شود از آنچه در پایگاه های داده نگهداری میشود (که شامل اطلاعات جزیی و روزمره است) به مراتب مهم تر و ارزشمندتر است. در DWH تمامی اطلاعات موجود در سازمان از ابتدا تاکنون به صورت یکپارچه و سازماندهی شده نگهداری می شود. در این مخزن اطلاعاتی، اطلاعات از تمامی منابع اطلاعاتی و در یک بازه زمانی طولانی جمع آوری می شوند و به این دلیل حجم اطلاعات بسیار زیاد است.در DWH نیاز به سازماندهی مناسب اطلاعات و استفاده از روشهای مناسب دسترسی به اطلاعات وجود دارد. DWH با طراحی متفاوت خود به صورت چندبعدی(Multi dimensional) قادر است تمامی این موارد را در نظر بگیرد. برای مثال در اطلاعات نگهداری شده برای فروش، زمان فروش، ناحیه فروش، فروشنده و محصول به فروش رفته به عنوان ابعاد مختلف در نظر گرفته می شوند. اغلب این بعدها حالت سلسله مراتبی (Hierarchical) دارند. مثلا ممکن است زمان فروش شامل تاریخ و ساعت فروش محصول باشد. طراحی مدل داده چند بعدی با استفاده از تکنیک های مرسوم در محیط های OLTPمانند ERD و نرمال سازی مناسب نیست. زیرا آنچه در DWH مهم است ایجاد امکان پرس و جو و بارگذاری سریع اطلاعات است.در بیشتر DWH ازstar schema  برای ایجاد مدل داده چندبعدی استفاده می شود. در این مدل، پایگاه داده شامل یک جدول fact و تعدادی جدول مجزا برای ابعاد است. در جدول fact رکورد اطلاعاتی شامل تعدادی اشاره گر (کلید خارجی) به جداول ابعاد و مقادیر مربوط به معیارهای عددی است. Attribute ها به همراه کلیدها در جداول ابعاد قرار می گیرند.برخی از سازمان ها تمایل دارند DWH به صورت سراسری طراحی شود به طوریکه تمامی اطلاعات موجود در سازمان در آن قرار گیرند. طراحی و استفاده از DWH به این صورت کاری پیچیده و زمان بر است. به همین علت در بسیاری از سازمانها از Data Mart استفاده می شود.

محمد رضا نائب کارشناس ارشد هوش مصنوعی naeb2bn@gmail.com

محمد رضا نائب کارشناس ارشد هوش مصنوعی
naeb2bn@gmail.com

 محمدرضا نائب

کارشناس ارشد هوش مصنوعی

naeb2bn@gmail.com

logo-samandehi