انبار داده (Datawarehouse) چیست؟ مفاهیم، ویژگیها و مثالها
امروزه برای کسب و کارها داشتن گزارشها و تجزیه تحلیلهای قابل اعتماد از دادههای موجود ضروری است. کسب و کارها برای ادغام و یکپارچه سازی دادههای خود برای موارد مختلفی همچون خدمات مشتری، ادغام شرکا و تصمیمات عالی در مورد آینده خود نیاز دارند. این امر به کمک انبار داده (Datawarehouse) به راحتی در دسترس است; زیرا گزارش و تجزیه و تحلیل را آسان میکند.
در این مقاله، ما در مورد مفهوم انبار دادههای مختلف بحث خواهیم کرد. این مقاله با تعریف انبارداده شروع میشود. در ادامه به استفاده از انبارداده در صنایع مختلف، ویژگیهای انبار داده و انواع آن میپردازیم.
انبار داده یا Data Warehouse چیست؟
انبار داده (Data Warehouse یا به اختصار DWH) به عنوان مخزن دادههای ذخیره شده الکترونیکی یک سازمان که از سیستمهای عملیاتی و در دسترس استخراج شده اند برای پرس و جوهای موقت و گزارشهای برنامه ریزی شده تعریف میشود. سادگی در روند ذخیره سازی دادهها مستلزم ساخت و استفاده از انبار داده است. دادههای ذخیره شده در انبارداده با دادههای موجود در محیط عملیاتی متفاوت است; از این جهت که اطلاعات ذخیر شده در انبار داده به گونه ای سازماندهی میشوند که دادههای مورد نظر برای تسهیل گزارش دهی برای انجام عملیات روزمره و تجزیه و تحلیل در کنار هم قرار میگیرند. با بهره گیری از انبار داده در طول زمان روندهایی تعیین میشود و برنامههایی براساس اطلاعات موجود ایجاد میگردد.
منبع: DatawarehouseInfo
تفاوت بین انبار داده (Data Warehouse) و پایگاه داده (Darabase)
در اکثر مواقع انبار داده و پایگاه داده به دلیل شباهت زیادی که دارند با یکدیگر اشتباه گرفته میشوند. تفاوت اصلی بین انبار داده و پایگاه داده هنگامیآشکار میشود که یک شرکت نیاز به انجام تجزیه و تحلیل در یک مجموعه داده گسترده داشته باشد. انبارداده برای اداره یک مجموعه داده ای بزرگ مجهز است، اما یک پایگاه داده اینگونه نیست.
رویکردهای ترکیب و ادغام پایگاه دادههای ناهمگن
برای ادغام پایگاههای داده مختلف، دو رویکرد محبوب وجود دارد:
رویکرد مبتنی بر پرس و جو (Query-driven): رویکرد پرسش محور روشی سنتی بوده که برای ایجاد ادغام کنندهها و بسته بندی دادهها در بالای پایگاه دادههای مختلف غیر مشابه یا ناهمگن استفاده میشود.
رویکرد مبتنی بر به روزرسانی (Update-driven): رویکرد مبتنی بر به روزرسانی برای یکپارچه سازی پایگاه داده جایگزینی برای رویکرد پرسش محور است و امروزه بیشتر استفاده میشود. در این روش، دادههای منابع ناهمگن مختلف از قبل ترکیب یا یکپارچه شده و در انبار داده ذخیره میشوند. پس از آن میتوان برای پرس و جو و تجزیه و تحلیل به این دادهها دسترسی پیدا کرد.
معماری انبار داده
معماری انبار داده با استفاده از مدلهای بعُدی بهترین روش استخراج معنی دار اطلاعات از دادههای خام و ترجمه آنها به یک ساختار آسان را شناسایی میکند. با این وجود، سه نوع اصلی از معماری انبارداده وجود دارد که باید هنگام طراحی یک انبارداده در سطح کسب و کار مورد توجه قرار گیرد.
معماری تک لایه
معماری دو لایه
معماری سه لایه
ویژگیهای اصلی انبار داده عبارتند از:
موضوع گرا (subject oriented): یک انبار داده به جای فعالیتهای کل سازمان، اطلاعاتی را فراهم میکند که برای یک موضوع خاص تهیه شده باشد. به عنوان مثال میتوان به اطلاعات مربوط به محصول، اطلاعات فروش، جزئیات مشتری و تأمین کننده و غیره اشاره کرد.
یکپارچه (integrated) : یک انبار داده با ترکیب دادههای چندین منبع ناهمگن مانند فایلها و پایگاههای داده رابطه ای ایجاد میشود، که در نتیجه تجزیه و تحلیل دادهها را بهبود میبخشد.
متغیر با زمان (Time – Variant): دادههای موجود در یک انبار داده، اطلاعات مربوط به یک زمان خاص را ارائه میدهند بنابراین اطلاعات موجود در انبار دادهها با یک بازه زمانی خاص طبقه بندی میشوند.
غیر فرار(Non – volatile): دادههای غیر فرار به دادههای قبلی گفته میشود که با افزودن دادههای جدیدتر به آنها حذف نمیشوند. انبار داده جدا از پایگاهداده عملیاتی است. به این معنی که هرگونه تغییر منظم در پایگاه داده عملیاتی در انبار داده مشاهده نمیشود.
نمونههایی از ذخیره سازی دادهها در صنایع مختلف
بخش سرمایه گذاری و بیمه
در بخش سرمایه گذاری و بیمه، انبارهای داده در درجه اول برای تجزیه و تحلیل روند مشتری و بازار و سایر الگوهای داده مورد استفاده قرار میگیرند. فارکس و بازارهای سهام دو زیرمجموعه اصلی هستند که انبارهای داده در آنها نقشی اساسی دارند، زیرا یک اختلاف واحد میتواند منجر به ضررهای عظیم در کل شود. در این بخشها، انبارهای داده معمولاً به اشتراک گذاشته میشوند و بر پخش جریانی اطلاعات در زمان واقعی تمرکز دارند.
زنجیرههای خرده فروشی
در بخش خرده فروشی، از انبارهای داده به طور عمده برای توزیع و بازاریابی استفاده میشود تا امکان ردیابی محصولات، بررسی سیاستهای قیمت گذاری، پیگیری کمپینهای تبلیغاتی و تجزیه و تحلیل روند خرید مشتری را داشته باشند. زنجیرههای خرده فروشی معمولاً انبار دادههای سازمانی را برای هوشمندی کسب و کار (BI) و پیش بینی نیازها در بر میگیرند.
مراقبتهای بهداشتی
در بخش مراقبتهای بهداشتی، از یک انبارداده برای پیش بینی نتایج، تولید گزارشات درمانی، اشتراک دادهها با ارائه دهندگان بیمه، آزمایشگاههای تحقیقاتی و سایر واحدهای پزشکی استفاده میشود. انبار دادههای سازمانی ستون فقرات سیستمهای مراقبتهای بهداشتی هستند زیرا جدیدترین اطلاعات درمانی برای نجات جان افراد بسیار مهم است.
انواع انبار داده
سه نوع اصلی انبار داده (DWH) وجود دارد. هر کدام نقش ویژه خود را در عملیات مدیریت داده دارند.
1- انبار دادههای سازمانی
انبار دادههای سازمانی (Enterprise Data Warehouse یا به اخنصار EDW) به عنوان یک پایگاهداده مرکزی یا اصلی برای تسهیل تصمیم گیری در کل سازمان عمل میکند. از مهمترین مزایای داشتن EDW میتوان به دسترسی به اطلاعات بین سازمانی، توانایی اجرای پرسشهای پیچیده، ارائه بصیرت غنی، دور اندیشی برای تصمیم گیریهای مبتنی بر داده و ارزیابی زود هنگام ریسک اشاره کرد.
2- ODS (انبار داده عملیاتی)
در ODS، انبارداده در لحظه به روز میشود. بنابراین، از آن اغلب برای فعالیتهای معمول شرکت، مانند ذخیره سوابق کارمندان، استفاده میشود. ODS به عنوان یک منبع برای ارائه داده به انبار دادههای سازمانی (EDW) استفاده میشود.
3- Data Mart (بازار داده)
بازار داده یک زیر مجموعه از انبار داده است که برای پشتیبانی یک بخش، منطقه یا واحد تجاری خاص در نظر گرفته شده است. این را در نظر بگیرید: شما چندین بخش دارید از جمله فروش، بازاریابی، توسعه محصول و غیره. هر بخش مخزن مرکزی دارد که در آن دادهها را ذخیره میکند. این مخزن Data Mart (بازار داده) نامیده میشود. دادههای بازار داده به صورت روزانه / هفتگی (یا به صورت پیکربندی شده) در ODS ذخیره میشود. ODS به عنوان یک منطقه مرحله بندی برای ادغام دادهها عمل میکند. سپس دادهها را به EDW ارسال میکند. این دادهها ذخیره شده و برای اهداف هوشمندی کسب و کار (BI) استفاده میشوند.
چرا مشاغل به انبار داده احتیاج دارند؟
بسیاری از کاربران تجاری تعجب میکنند که چرا انبارداری اطلاعات مهم است؟ انبار کردن دادهها مزایای زیادی را به کاربران نهایی ارائه میدهد که شامل موارد زیر میباشد:
- بهبود دسترسی کاربر نهایی به طیف گسترده ای از دادههای سازمانی
- افزایش سازگاری دادهها
- کاهش هزینههای احتمالی محاسبات و افزایش بهره وری
- تهیه محیطی برای ترکیب دادههای مرتبط از منابع جداگانه
- ایجاد زیرساخت محاسباتی که میتواند از تغییرات سیستمهای رایانه ای و ساختارهای تجاری پشتیبانی کند
- توانمندیکاربران نهایی برای انجام پرس و جوهای موردی یا گزارشهای مورد نیاز بدون تأثیر بر عملکرد سیستمهای عملیاتی
حرف آخر
زیرساخت داده ای اکثر سازمانها مجموعه ای از سیستمهای ناهمگن است. به عنوان مثال، یک سازمان ممکن است سیستمیداشته باشد که بتواند روابط مشتری، منابع انسانی، فروش، تولید، امور مالی، شرکا و غیره را مدیریت کند. این سیستمها اغلب ضعیف هستند یا اصلاً یکپارچه نیستند و پاسخ به سوالات ساده بسیار دشوار است. حتی اگر اطلاعات “در جایی” در سیستمهای مختلف داده موجود باشد. دسترسی نهایی کاربران به ابزارهای انبار داده میتواند این مشکلات را با ایجاد یک پایگاهداده واحد از دادههای همگن حل کند که به راحتی بازیابی و دستکاری شود.
نیازی به گفتن نیست که ابزارهای نرم افزاری مورد استفاده برای استخراج و تبدیل دادهها به یک قالب همگن; که میتوانند در انبارداده بارگیری شوند نیز از اجزای اصلی سیستم انبارداده هستند.
علاقه مندان به مباحث انبار داده میتوانند در دوره آموزشی انبار داده مقدماتی و پیشرفته موسسه پژوهش و آموزش همکاران سیستم شرکت کنند.
گردآورنده: عرفان ستایشی
منبع: astera.com