راهکار ارائه پیشنهاد تطبیقی بر اساس یادگیری-Q در حراجهای ترکیبی
چکیده
در سالهای اخیر، حراجهای ترکیبی، که در آن پیشنهاد دهندگان اجازه دارند پیشنهادات خویش را در مورد دسته ای از اقلام ارائه کنند، مورد تحقیق بسیاری قرار گرفته اند. حراجهای ترکیبی هنگامی که پیشنهاددهندگان دارای اقلام مکمل و قابل جایگزینی دارند، می توانندبه کارایی های بهتر اجتماعی دست یابند. با اینکه بسیاری از کارها بر روی حراجهای ترکیبی صورت گرفته است، بسیاری از آنها بر مسئله تعیین برنده و طرح حراج متمرکز هستند. بخش عمده پژوهش نشده در زمینه حراجههای ترکیبی راهکارهای ارائه پیشنهاد است. ما در این مقاله، یک راهکار ارائه پیشنهاد تطبیقی مبتنی بر Q- یادگیری برای حراجهای ترکیبی در این بازارهای ایستا پیشنهاد می کنیم. پیشنهاد دهنده با بکارگیری این راهکار می تواند از وضعیت های مختلف عبور کرده و به تدریج با وضعیت مطلوب همگرایی نموده و منفعت زیادی را در دراز مدت کسب کند. نتایج آزمایشی نشان می دهند که راهکار تطبیقی مبتنی بر Q- یادگیری در مقایسه با راهکار مطلوب نسبتا خوب عمل کرده و راهکار تصادفی و راهکار تطبیقی قبلی ما را در محیط های مختلف بازار، حتی بدون هیچ دانش قبلی، اجرا می کند.
کلیدواژه ها: راهکار ارائه پیشنهاد، تطبیقی، Q- یادگیری، حراجهای ترکیبی
مقدمه
در سالهای اخیر، با افزایش تقاضای منابع محاسباتی برای مسائل محاسباتی علمی پیچیده، مثل محاسبه نجومی و محاسبه بیولوژیکی، سودمندی قدرت محاسبه که با زیرساخاتهای توزیعی و متمرکز فراهم شده، از سوی دانشمندان و محققان علم کامپیوتر مورد توجه بیش از پیش قرار گرفته است. اینترنت نمونه ای موردی از زیرساخت مذکور است که کاربران متفاوتی در آن می توانند از منابع محاسباتی فراهم شده برای انجام وظایف خویش بهره بگیرند. این نوع مسئله تخصیص منبع، یعنی نحوه تخصیص این منابع در بین گروهی از کاربران، تبدیل به موضوع مهمی شده است. در مقایسه با سایر روشهای تخصیص منبع، حراج اینترنتی مزیت عمده ای دارد که منابع را به پیشنهاددهندگانی اختصاص می دهد که به آنها ارزش بسیار زیادی قائل شده و از نظر علم اقتصاد تخصیص کافی را بدست می آورند. در بین تمامی انواع حراج، حراجهای ترکیبی، که پیشنهاد دهندگان می توانند در مورد ترکیب اقلام پیشنهاد دهند، یعنی “بسته بندیها”، تا اقلام جداگانه، از سوی محققان در حوزه علوم کامپیوتر و اقتصاد مورد توجه بسیاری قرار گرفته است. حراجهای ترکیبی هنگامی که پیشنهاد دهندگان دارای اقلام مکمل و قابل جایگزین بین کالاها باشند، می توانند به تخصیص های بیشتر اقتصادی منابع دست یابند تا حراجهای سنتی یک – قلم کالا. این میزان تاکید کنندگی باعث افزایش کارایی می گردد که در بسیاری از کاربردها به اثبات رسیده است.
در دهه گذشته، کارهای زیادی در زمینه حراجهای ترکیبی انجام شده است. دو مسئله ای که بیش از همه در سطح گسترده انجام گرفته است، تعیین برنده و طرح حراج است. مسئله تعیین برنده برای محاسبه تخصیص منابع در بین پیشنهاددهندگان است و اثبات شده است که دارای NP- مشکل می باشد. برای حل این مسئله کارهای بسیاری اعم از یافتن راه حلهای مطلوب و راه حلهای تقریبی انجام شده است. طرح حراج شامل طراحی پروتکلهای مختلف برای حراجهای ترکیبی مثل تک – دور در مقابل چند – دور، پیشنهاد- مهر و موم شده در مقابل پیشنهاد باز و اثبات- نام – غلط می باشد. به علاوه، طرح مکانیسم محاسباتی برای حراجهای ترکیبی که برای طراحی محاسباتی ممکن است ضمن مکانیسم موثری برای حراجهای ترکیبی، حوزه پژوهشی در حال تغییری می باشد.
حوزه دیگر پژوهش در زمینه حراجهای ترکیبی طرح راهکارهای ارائه پیشنهاد می باشد. همانطور که حراجهای ترکیبی در بسیاری از کاربردهای پروتکل حراج پیشنهاد- مهرو موم شده قیمت- اول تلفیق می شوند، ما توجه ویژه ای به راهکارهای ارائه پیشنهاد در این نوع حراج داریم. برخلاف حراج ویکری، که ارائه پیشنهاد مفید راهکار غالبی می باشد، هیچ راهکار غالب و برجسته ای در حراجهای ترکیبی پیشنهاد- مهر و موم شده قیمت اول وجود ندارد که طرح راهکارهای ارائه پیشنهاد را به یک مسئله غیرمهم تبدیل کند. با اینکه کارهای قبلی بر این مسئله تاکید دارند، راهکارهای پیشنهادی تطبیقی نیستند، به این معنا که نتایج بر اساس تحلیل بعدی ایجاد شده و به شرایط خاص بسیار محدود می باشند.
بر اساس اصول یادگیری- Q، ما در این مقاله یک راهکار ارائه پیشنهاد تطبیقی مبتنی بر یادگیری- Q پیشنهاد می کنیم. پیشنهاد کننده با اتخاذ این راهکار می تواند از بین وضعیت های مختلف بر اساس سابقه ارائه پیشنهاد عبور کرده و در نتیجه نسبت به بازار پاسخ دهنده باشد. پیشنهاد دهنده نیازی به دانش قبلی در مورد بازارها نداشته و بازارها به انواع معینی محدود می گردند. به عبارتی دیگر، راهکار ما به خوبی تعمیم می یابد. به علاوه، راهکار تطبیقی پیشنهادی بر اساس یادگیری- Q به حراجهای ترکیبی محدود نمی شود. در واقع، چنین راهکاری می تواند در هر حراج تکراری به کار رود، که در بخش نتیجه گیری مورد بحث بیشتری قرار خواهد گرفت. ما توسط شبیه سازی ها نشان می دهیم که راهکار تطبیقی مبتنی بر یادگیری – Q به خوبی عمل می کند و در بازارهای مختلف در مقایسه با راهکار تصادفی و راهکار تطبیقی قبلی ما سودمندی های بسیاری ایجاد می کند. همچنین عملکرد های راهکار ارائه پیشنهاد تطبیقی مبتنی بر یادگیری – Q و راهکار تطبیقی قبلی را به تفصیل مقایسه می کنیم. به علاوه، می دانیم که پیشنهاد دهنده با استفاده ا زاین راهکار میتواند به سرعت با وضعیت بهینه در بازارهای مختلف همگرایی نموده و در نتیجه قادر به یادگیری و تطبیق، حتی بدون هیچ دانش قبلی می باشد.
لطفاً براي ارسال دیدگاه، ابتدا وارد حساب كاربري خود بشويد