مکانیسم نقطه وارسی انتخابی برای طرحهای پرس وجو در سیستم پایگاه داده موازی
چکیده
اکثر سیستمهای پایگاه داده موازی در هنگام شکست پرس وجوهای تمام نشده را رها کرده و همه را از ابتدا شروع میکنند. این امر تحمل خطا را ممکن میسازد، ولی برای اجرای طولانی پرس وجوهای بارهای کاری OLAP ناکارآمد است. برای حل این مسئله، این مقاله، مکانیسم نقطه وارسی انتخابی ارائه میکند که خروجیهای برخی عملگرهای موردنیاز را خودکار ساخته و در صورت شکست، ادامه دادن پرس وجو را از اواسط اجرا ممکن میسازد. هرپرس وجو با DAG عملگرهای رابطه ای نمایش داده میشود که در آن، معمولا دادهها بین عملگرها خط لوله میشوند. هدف این مکانیسم یافتن مجموعه عملگرهایی است که خروجی آنها ارزش نقطه وارسی شدن دارند تا زمان اجرای مورد انتظار کل پرس وجو حداقل شود. در ابتدا، مدل هزینه برای تخمین زمان اجرای مورد انتظار کل طرح پرس وجو تحت احتمال شکست برای هرعملگر معرفی میشود. سپس الگوریتم تقسیم و غلبه ای پیشنهاد میشود تا راه حل نزدیک به بهینه ای برای مسئله پیدا کند. این الگوریتم طرح پرس وجو را به زیرطرحهایی با فضای جستجوی کوچکتر تقسیم میکند. برای طرج پرس وجویی با n عملگر، الگوریتم دارای پیچیدگی زمانی O(n) است. این مکانیسم در سیستم پایگاه داده موازی بدون اشتراکی با نام ParaLite پیاده سازی میشود که برای به هم چسباندن نمونههای SQLite زیادی و موازی سازی پرس وجوهای SQL در آنها، یک لایه هماهنگ سازی فراهم میکند. نتایج آزمایشات نشان میدهد که استراتژیهای تحمل خطای مختلف زمان اجرای کلی پرس وجوها را تحت تاثیر قرار میدهد. مکانیسم نقطه وارسی انتخابی ما میتواند عملگرها را منطقی انتخاب کند تا نقطه وارسی شده و کارآیی بیشتری نسبت به استراتژیهای تحمل خطای دیگر نشان دهد. به علاوه، الگوریتم تقسیم و غلبه مورد استفاده مکانیسم سربار کمتری نسبت به روش brute-force داشته و در عین حال کارآیی مشابهی نشان میدهد.
A selective checkpointing mechanism for query plans in a parallel database system
Abstract:
لینک مقاله لاتین: http://ieeexplore.ieee.org/document/6691580/
لطفاً براي ارسال دیدگاه، ابتدا وارد حساب كاربري خود بشويد