15000 تومان
افزودن به سبد خرید
0 فروش 259 بازدید
جزئیات محصول
تعداد قسمت: 1
پسوند فایل: zip
حجم فایل: 1MB
فایل راهنما: ندارد
بسته نصبی: ندارد
امکانات: شامل فایل pdf مقاله لاتین و فایل word ترجمه فارسی (26 صفحه)
تاریخ انتشار: 24 دسامبر 2018
دسته بندی: ,,

تبلیغات

الگوریتم PSO چند هدفه برای استخراج قوانین انجمنی عددی بدون گسسته‌سازی اولیه

در حوزه کشف استخراج قوانین انجمنی (ARM)، قوانین برای ویژگی‌های عددی هنوز یک مسئله بحث برانگیز است. بیشتر روش‌های محبوب برای ARM عددی نیاز به یک گسسته‌سازی داده ای اولیه برای رسیدگی به ویژگی‌های عددی دارد. علاوه بر این در فرآیند کشف روابط بین داده‌ها اغلب بیشتر از یک هدف ( اندازه‌گیری کیفیت ) مورد نیاز می‌باشد و در اکثر موارد این اهداف شامل اندازه‌گیری‌های متضاد می‌شود. در چنین شرایطی توصیه برای بدست آوردن تعادل بهینه بین اهداف می‌شود. این مقاله به مسئله ی   ARM عددی با استفاده از یک دیدگاده چند هدفه با پیشنهاد یک الگوریتم بهینه‌سازی ازدحام ذرات چند هدفه (به عنوان مثال MOPAR) برای ARM عددی که قوانین انجمنی عددی (ARs) را در فقط یک مرحله منفرد کشف می‌کند می‌پردازد. برای شناسایی ARs کارآمد‌تر چندین هدف در رویکرد بهینه‌سازی چند هدفه پیشنهاد شده تعریف می‌شوند. شامل اعتماد به نفس، قابلیت درک و جالب توجه بودن. در نهایت با استفاده از بهینه‌سازی Pareto بهترین ARs‌ها استخراج می‌شوند. برای مقابله با ویژگی‌های عددی ما مقادیر ناهمگون شامل کران‌های بالاتر و پائین‌تر را برای نشان دادن باز ه‌های ویژگی‌ها، استفاده می‌کنیم. در بخش تجربی از مقاله ما اثر اپراتورهای استفاده شده در این مقاله را تجزیه و تحلیل می‌کنیم برای مقایسه روش مان با محبوب ترین پیشنهادات بر مبنای تکاملی برای ARM راو یک تجزیه و تحلیل از ARs استخراج شده را نشان می‌دهیم. نتایج نشان می‌دهد که MOPAR مقادیر قابل اعتمادی ) با مقادیر مطمئن نزدیک ۹۵%(،  قابل درک و جالب توجهی از ARs عددی را استخراج می‌کند بهنگام رسیدن به تعادل بهینه بین اعتماد به نفس، قابل درک بودن و جالب توجه بودن.

معرفی

داده‏کاوی مجموعه ای از تکنیک‌ها برای کشف دانش می‌باشد که شامل استخراج با دقت بالا، به طور بالقوه مفید ، قابل درک بودن و دانش قابل درک از مجموعه داده‌های بزرگ می‌باشد. (۲۰۰۶,pia Kamber,han) یک مسئله ای تحقیق مهم در زمینه‌ی تحقیق داده کاوی استخراج قوانین انجمن ARM می‌باشد که در آن هدف، از همبستگی چند ویژگی میان پایگاه هاي داده مشتق می‌شود. از آنجاییکه الگوریتم‌های استخراج متعارف معمولاً تعداد زیادی از قوانین را می‌دهد که رسیدگی به آنها مشکل می‌باشد، ARM هنوز یک مسئله‌ی در حال بررسی می‌باشد.

یک علامت گذاری از B → A یک قانون انجمنی (AR) نامیده می‌شود که در آن A و B هر دو مجموعه‌هایی از اقلام (itemsets) می‌باشند. طرف چپ این اصطلاح مقدمه نامیده می‌شود در حالیکه طرف راست نتیجه می‌باشد. به منظور بررسی اثر بخشی قوانین تعدادی اندازه‌گیری‌های آماری خاص مثل حمایت یا اعتماد به نفس ( در میان دیگران) استفاده می‌شود. ARs شامل فقط ویژگی‌های دسته‌بندی (به عنوان مثال نام تجاری،  شامل ماشین، جنس) به عنوان ARs دسته‌بندی شناخته می‌شوند، در حالیکه در ویژگی‌های ARs عددی (کمّی) می‌توان هر دو دسته‌بندی و کمی بودن را داشت ( به عنوان مثال حرارت،  سن،  درآمد). اکثریت محققان برروی پایگاه داده‌های شامل ویژگی‌های دسته‌بندی متمرکز شده اند با این حال هر دو ویژگی دسته‌بندی و کمی اغلب در پایگاه داده‌ی دنیای واقعی وجود دارند. علاوه بر این بسیاری از ابزارهای برخورد با مسائل ARM عددی فقط ویژگی‌های کمی با استفاده از یک استراتژی خاص را گسسته می‌کند و پس از آن آنها با آنها به عنوان ویژگی‌های دسته‌بندی رفتار می‌کنند (Mata Vazquez & pachm Alvarez 2012). ARs عددی از شکل c2  c1 → بیان می‌شود،  در هر دو c2  و c1  به عنوان قسمتهایی مقدمه و نتیجه از قانون ویژگی‌هایی از مجموعه‌ها هستند در فرم‌هایی A= {v1,v2,………..,vn} ( اگر A یک ویژگی دسته‌بندی باشد) یا Aϵ [v1,v2] ( اگر A یک ویژگی کمی باشد). با توجه به چالش‌های زیر ARs  کمی کمتر مورد مطالعه قرار گرفته است .(۱) ویژگی‌های کمی معمولاً طیف گسترده ای از مقادیر پیوسته دارد که نیاز به یک فرآیند پیچیده برای گسسته‌سازی تمام ویژگی‌ها دارد که یک روند مستمر برای خطا محسوب می‌شود؛ (۲) ARs کمی یک گستره‌ی ساده از ARs ‌های دسته‌بندی نمی‌باشند در عوض آنها یک قسمت از یک فرآیند پیچیده‌تر را تشکیل می‌دهند : (۳) مشکل بررسی کردن مقادیر زیادی از داده ها. بنابراین در این مقاله ما برروی استخراج ARs ‌های عددی متمرکز می‌شویم. اکثریت الگوریتم‌های مرسوم نماینده برای ARM الگوریتم Aprior می‌باشد.

Multi-objective PSO algorithm for mining numerical association rules without a priori discretization

Abstract

In the domain of association rules mining (ARM) discovering the rules for numerical attributes is still a challenging issue. Most of the popular approaches for numerical ARM require a priori data discretization to handle the numerical attributes. Moreover, in the process of discovering relations among data, often more than one objective (quality measure) is required, and in most cases, such objectives include conflicting measures. In such a situation, it is recommended to obtain the optimal trade-off between objectives. This paper deals with the numerical ARM problem using a multi-objective perspective by proposing a multi-objective particle swarm optimization algorithm (i.e., MOPAR) for numerical ARM that discovers numerical association rules (ARs) in only one single step. To identify more efficient ARs, several objectives are defined in the proposed multi-objective optimization approach, including confidence, comprehensibility, and interestingness. Finally, by using the Pareto optimality the best ARs are extracted. To deal with numerical attributes, we use rough values containing lower and upper bounds to show the intervals of attributes. In the experimental section of the paper, we analyze the effect of operators used in this study, compare our method to the most popular evolutionary-based proposals for ARM and present an analysis of the mined ARs. The results show that MOPAR extracts reliable (with confidence values close to 95%), comprehensible, and interesting numerical ARs when attaining the optimal trade-off between confidence, comprehensibility and interestingness.

لینک مقاله اصلی:

https://www.sciencedirect.com/science/article/pii/S0957417414000025

افزودن به سبد خرید

لطفاً براي ارسال دیدگاه، ابتدا وارد حساب كاربري خود بشويد

محصولات پر فروش

پر فروش ترین محصولات فروشگاه روکساوب