انبار داده (Datawarehouse) چیست؟

انبار داده (Datawarehouse) چیست؟ مفاهیم، ویژگی‌ها و مثال‌ها

امروزه برای کسب و کارها داشتن گزارش‌ها و تجزیه تحلیل‌های قابل اعتماد از داده‌های موجود ضروری است. کسب و کارها برای ادغام و یکپارچه سازی داده‌های خود برای موارد مختلفی همچون خدمات مشتری، ادغام شرکا و تصمیمات عالی در مورد آینده خود نیاز دارند. این امر به کمک انبار داده (Datawarehouse) به راحتی در دسترس است; زیرا گزارش و تجزیه و تحلیل را آسان می‌کند.

 

در این مقاله، ما در مورد مفهوم انبار داده‌های مختلف بحث خواهیم کرد. این مقاله با تعریف انبارداده شروع می‌شود. در ادامه به استفاده از انبارداده در صنایع مختلف، ویژگی‌های انبار داده و انواع آن می‌پردازیم.

 

انبار داده یا Data Warehouse چیست؟

انبار داده (Data Warehouse یا به اختصار DWH) به عنوان مخزن داده‌های ذخیره شده الکترونیکی یک سازمان که از سیستم‌های عملیاتی و در دسترس استخراج شده اند برای پرس و جوهای موقت و گزارش‌های برنامه ریزی شده تعریف می‌شود. سادگی در روند ذخیره سازی داده‌ها مستلزم ساخت و استفاده از انبار داده است. داده‌های ذخیره شده در انبارداده با داده‌های موجود در محیط عملیاتی متفاوت است; از این جهت که اطلاعات ذخیر شده در انبار داده به گونه ای سازماندهی می‌شوند که داده‌های مورد نظر برای تسهیل گزارش دهی برای انجام عملیات روزمره و تجزیه و تحلیل در کنار هم قرار می‌گیرند. با بهره گیری از انبار داده در طول زمان روندهایی تعیین می‌شود و برنامه‌هایی براساس اطلاعات موجود ایجاد می‌گردد.

معماری انبار داده: انواع، مولفه‌ها و مفاهیم

منبع: DatawarehouseInfo

 

تفاوت بین انبار داده (Data Warehouse) و پایگاه داده (Darabase)

در اکثر مواقع  انبار داده و پایگاه داده به دلیل شباهت زیادی که دارند با یکدیگر اشتباه گرفته میشوند. تفاوت اصلی بین انبار داده و پایگاه داده هنگامی‌آشکار می‌شود که یک شرکت نیاز به انجام تجزیه و تحلیل در یک مجموعه داده گسترده داشته باشد. انبارداده برای اداره یک مجموعه داده ای بزرگ مجهز است، اما یک پایگاه داده اینگونه نیست.

 

رویکردهای ترکیب و ادغام پایگاه داده‌های ناهمگن

برای ادغام پایگاه‌های داده مختلف، دو رویکرد محبوب وجود دارد:

رویکرد مبتنی بر پرس و جو (Query-driven): رویکرد پرسش محور روشی سنتی بوده که برای ایجاد ادغام کننده‌ها و بسته بندی داده‌ها در بالای پایگاه داده‌های مختلف غیر مشابه یا ناهمگن استفاده می‌شود.

رویکرد مبتنی بر به روزرسانی (Update-driven): رویکرد مبتنی بر به روزرسانی برای یکپارچه سازی پایگاه داده جایگزینی برای رویکرد پرسش محور است و امروزه بیشتر استفاده می‌شود. در این روش، داده‌های منابع ناهمگن مختلف از قبل ترکیب یا یکپارچه شده و در انبار داده ذخیره می‌شوند. پس از آن می‌توان برای پرس و جو و تجزیه و تحلیل به این داده‌ها دسترسی پیدا کرد.

معماری انبار داده

معماری انبار داده با استفاده از مدل‌های بعُدی بهترین روش استخراج معنی دار اطلاعات از داده‌های خام و ترجمه آنها به یک ساختار آسان را شناسایی می‌کند. با این وجود، سه نوع اصلی از معماری انبارداده وجود دارد که باید هنگام طراحی یک انبارداده در سطح کسب و کار مورد توجه قرار گیرد.

معماری تک لایه

معماری دو لایه

معماری سه لایه

 

ویژگی‌های اصلی انبار داده عبارتند از:

موضوع گرا (subject oriented): یک انبار داده به جای فعالیت‌های کل سازمان، اطلاعاتی را فراهم می‌کند که برای یک موضوع خاص تهیه شده باشد. به عنوان مثال می‌توان به اطلاعات مربوط به محصول، اطلاعات فروش، جزئیات مشتری و تأمین کننده و غیره اشاره کرد.

یکپارچه (integrated) : یک انبار داده با ترکیب داده‌های چندین منبع ناهمگن مانند فایل‌ها و پایگاه‌های داده رابطه ای ایجاد می‌شود، که در نتیجه تجزیه و تحلیل داده‌ها را بهبود می‌بخشد.

متغیر با زمان (Time – Variant): داده‌های موجود در یک انبار داده، اطلاعات مربوط به یک زمان خاص را ارائه می‌دهند بنابراین اطلاعات موجود در انبار داده‌ها با یک بازه زمانی خاص طبقه بندی می‌شوند.

غیر فرار(Non – volatile): داده‌های غیر فرار به داده‌های قبلی گفته می‌شود که با افزودن داده‌های جدیدتر به آنها حذف نمی‌شوند. انبار داده جدا از پایگاه‌داده عملیاتی است. به این معنی که هرگونه تغییر منظم در پایگاه داده عملیاتی در انبار داده مشاهده نمی‌شود.

نمونه‌هایی از ذخیره سازی داده‌ها در صنایع مختلف

بخش سرمایه گذاری و بیمه

در بخش سرمایه گذاری و بیمه، انبارهای داده در درجه اول برای تجزیه و تحلیل روند مشتری و بازار و سایر الگوهای داده مورد استفاده قرار می‌گیرند. فارکس و بازارهای سهام دو زیرمجموعه اصلی هستند که انبارهای داده در آنها نقشی اساسی دارند، زیرا یک اختلاف واحد می‌تواند منجر به ضررهای عظیم در کل شود. در این بخشها، انبارهای داده معمولاً به اشتراک گذاشته می‌شوند و بر پخش جریانی اطلاعات در زمان واقعی تمرکز دارند.

زنجیره‌های خرده فروشی

در بخش خرده فروشی، از انبارهای داده به طور عمده برای توزیع و بازاریابی استفاده می‌شود تا امکان ردیابی محصولات، بررسی سیاست‌های قیمت گذاری، پیگیری کمپین‌های تبلیغاتی و تجزیه و تحلیل روند خرید مشتری را داشته باشند. زنجیره‌های خرده فروشی معمولاً انبار داده‌های سازمانی را برای هوشمندی کسب و کار (BI) و پیش بینی نیازها در بر می‌گیرند.

مراقبت‌های بهداشتی

در بخش مراقبت‌های بهداشتی، از یک انبارداده برای پیش بینی نتایج، تولید گزارشات درمانی، اشتراک داده‌ها با ارائه دهندگان بیمه، آزمایشگاه‌های تحقیقاتی و سایر واحدهای پزشکی استفاده می‌شود. انبار داده‌های سازمانی ستون فقرات سیستم‌های مراقبت‌های بهداشتی هستند زیرا جدیدترین اطلاعات درمانی برای نجات جان افراد بسیار مهم است.

 

انواع انبار داده

سه نوع اصلی انبار داده (DWH) وجود دارد. هر کدام نقش ویژه خود را در عملیات مدیریت داده دارند.

1- انبار داده‌های سازمانی

انبار داده‌های سازمانی (Enterprise Data Warehouse یا به اخنصار EDW) به عنوان یک پایگاه‌داده مرکزی یا اصلی برای تسهیل تصمیم گیری در کل سازمان عمل می‌کند. از مهمترین مزایای داشتن EDW می‌توان به دسترسی به اطلاعات بین سازمانی، توانایی اجرای پرسش‌های پیچیده، ارائه بصیرت غنی، دور اندیشی برای تصمیم گیری‌های مبتنی بر داده و ارزیابی زود هنگام ریسک اشاره کرد.

2- ODS (انبار داده عملیاتی)

در ODS، انبارداده در لحظه به روز می‌شود. بنابراین، از آن اغلب برای فعالیتهای معمول شرکت، مانند ذخیره سوابق کارمندان، استفاده می‌شود. ODS به عنوان یک منبع برای ارائه داده به انبار داده‌های سازمانی (EDW) استفاده می‌شود.

3- Data Mart (بازار داده)

بازار داده یک زیر مجموعه از انبار داده است که برای پشتیبانی یک بخش، منطقه یا واحد تجاری خاص در نظر گرفته شده است. این را در نظر بگیرید: شما چندین بخش دارید از جمله فروش، بازاریابی، توسعه محصول و غیره. هر بخش مخزن مرکزی دارد که در آن داده‌ها را ذخیره می‌کند. این مخزن Data Mart (بازار داده) نامیده می‌شود. داده‌های بازار داده به صورت روزانه / هفتگی (یا به صورت پیکربندی شده) در ODS ذخیره می‌شود. ODS به عنوان یک منطقه مرحله بندی برای ادغام داده‌ها عمل می‌کند. سپس داده‌ها را به EDW ارسال می‌کند. این داده‌ها ذخیره شده و برای اهداف هوشمندی کسب و کار (BI) استفاده می‌شوند.

 

چرا مشاغل به انبار داده احتیاج دارند؟

بسیاری از کاربران تجاری تعجب می‌کنند که چرا انبارداری اطلاعات مهم است؟ انبار کردن داده‌ها مزایای زیادی را به کاربران نهایی ارائه می‌دهد که شامل موارد زیر می‌باشد:

  • بهبود دسترسی کاربر نهایی به طیف گسترده ای از داده‌های سازمانی
  • افزایش سازگاری داده‌ها
  • کاهش هزینه‌های احتمالی محاسبات و افزایش بهره وری
  • تهیه محیطی برای ترکیب داده‌های مرتبط از منابع جداگانه
  • ایجاد زیرساخت محاسباتی که می‌تواند از تغییرات سیستم‌های رایانه ای و ساختارهای تجاری پشتیبانی کند
  • توانمندیکاربران نهایی برای انجام پرس و جوهای موردی یا گزارش‌های مورد نیاز بدون تأثیر بر عملکرد سیستم‌های عملیاتی

 

حرف آخر

زیرساخت داده ای اکثر سازمانها مجموعه ای از سیستمهای ناهمگن است. به عنوان مثال، یک سازمان ممکن است سیستمی‌داشته باشد که بتواند روابط مشتری، منابع انسانی، فروش، تولید، امور مالی، شرکا و غیره را مدیریت کند. این سیستم‌ها اغلب ضعیف هستند یا اصلاً یکپارچه نیستند و پاسخ به سوالات ساده بسیار دشوار است. حتی اگر اطلاعات “در جایی” در سیستم‌های مختلف داده موجود باشد. دسترسی نهایی کاربران به ابزارهای انبار داده می‌تواند این مشکلات را با ایجاد یک پایگاه‌داده واحد از داده‌های همگن حل کند که به راحتی بازیابی و دستکاری شود.

 

نیازی به گفتن نیست که ابزارهای نرم افزاری مورد استفاده برای استخراج و تبدیل داده‌ها به یک قالب همگن; که می‌توانند در انبارداده بارگیری شوند نیز از اجزای اصلی سیستم انبارداده هستند.

علاقه مندان به مباحث انبار داده می‌توانند در دوره‌ آموزشی انبار داده مقدماتی و پیشرفته موسسه پژوهش و آموزش همکاران سیستم شرکت کنند.

 

گردآورنده: عرفان ستایشی

منبع: astera.com

دیدگاه خود را ثبت کنید

نشانی ایمیل شما منتشر نخواهد شد.