15000 تومان
افزودن به سبد خرید
0 فروش 205 بازدید
جزئیات محصول
تعداد قسمت: 1
پسوند فایل: zip
حجم فایل: 1MB
فایل راهنما: ندارد
بسته نصبی: ندارد
امکانات: شامل فایل pdf مقاله لاتین و فایل word ترجمه فارسی (21 صفحه)
تاریخ انتشار: 04 ژانویه 2019
دسته بندی: ,

تبلیغات

طبقه بند (دسته بندی کننده) جدید مبتنی بر کوتاه ترین پاره خط ویژگی(شاخص)

چکیده

در این مقاله رویکردی جدید با عنوان کوتاه ترین پاره خط ویژگی (SFLS) به منظور پیاده سازی و دسته بندی کننده الگو مطرح شده است، که علاوه بر حفظ نتایج روش نزدیکترین خط ویژگی (NFL) در زمان یکسان می تواند با مشکلات روش NFL مقابله کند.  روش SFLS مطرح شده از ویژگی طول مناسب از قسمتی از خط با توجه به رابطه هندسی با نقطه جستجو به جای فاصله عمودی تعریف شده در NFL استفاده می کند.  روش SFLS، بطور اساسی، پایه ی تئوری هندسی واضحی داشته و ساده است.  نتایج آزمایش روی برخی از مجموعه داده های مصنوعی و واقعی و مقایسه ی بین روش مطرح شده SFLS و دیگر روش های طبقه بندی مبتنی بر همسایگی، شامل نزدیکترین همسایه (NN)، K-NN، NFL  و برخی روش های NFL تعریف شده دیگر در نظر گرفته شده است.  می توان نتیجه گیری کرد که روش SFLS در عین سادگی در طبقه بندی نیز به صورت موثری مطرح است.

مقدمه

با توسعه طبقه بندی الگو، روش های طبقه بندی (دسته بندی کننده) گوناگونی مطرح شده اند.  روش نزدیکترین همسایه NN یک روش طبقه بندی غیر پارامتری و مبتنی بر همسایگی است که ساده بوده و همچنان نیزکارآمد است.  روش نزدیکترین همسایه NN دارای حداکثر دوبرابر نرخ خطای تقریبی نسبت به نرخ خطای BAYES (بیز) است.  روش NN همچنین ایرادات خاص خود را دارد، به عنوان مثال ظرفیت در نظر گرفته شده مجموعه داده و نرخ خطای طبقه بندی با تکیه بر چگونگی انتخاب نمونه های آموزش جهت محاسبه تغییرات احتمالی و همچنین چگونگی دردسترس بودن آنها است.  کارایی روش NN همچنین به تعریف اندازه فاصله  استفاده شده نیز بستگی دارد.  تعداد کثیری از روش های بهبود یافته، نظیر
K-NN ,SN(Surrounding Neighbor) (-NN,SN(surrounding neighborد یافته نظیر   دردسترس بودن آنها است.کارایی روش  داده و نرخ خطای طبقه بندی با تکیه بر چگونگی انتخاب   Gn(Graphic Neighbor) ,، NFL(Nearest Feature Line) به منظور غلبه بر ایرادات روش NN مطرح شده اند.  در روش های اشاره شده مبتنی بر همسایگی، روش NFL یک دسته بندی کننده غیر پارامتریک است که در جهت بهبود ظرفیت باز نمودی یک مجموعه از نمونه ها با اندازه ی محدود شده تلاش می کند و با استفاده از خطوط مستقیمی که از هر جفت نمونه با کلاس یکسان عبور می کنند عمل می نمایند.

روش NFL با قابلیت افزودن اطلاعات مازاد به مجموعه نمونه های اولیه در بسیاری از موارد کاربردی نظیر تشخیص چهره، طبقه بندی تصاویر، تشخیص صدا، شناسایی سخنگو و غیره کارایی شگفت انگیزی را از خود نشان می دهد. با وجود موفقیت در بهبود کارایی طبقه بندی، روش NFL هنوز هم دارای اشکالاتی واضح و در عین حال فاحشی می باشد. دو نوع خطای اطلاعاتی می توانند خطای برون یابی و درون یابی باشند. به علاوه روش NFL دارای پیچیدگی محاسباتی بالایی است. به طوریکه CHEN,DU در سال ۲۰۰۷ عنوان کردند که : اطلاعات اضافی مثل یک شمشیر دولبه است.

برای مقابله با ایرادات وارد بر روش NFL، روش هایی در جهت تصحیح NFL پدیدار شدند. روش نزدیکترین همسایه مبتنی بر مرکز (CNN) به منطور کاهش حجم محاسباتی روش NFL مطرح شد و این کار به واسطه تعریف نوع دیگری از خط، که خط مبتنی بر مرکز (CL) نامیده می شد، صورت می گرفت. روشCL  یک نقطه نمونه آموزشی را به مرکز کلاس مرتبط با نمونه، متصل می کند، به جای اینکه دو نقطه ی نمونه آموزشی را تشکیل بدهد (روش FL,NFL)

در ادامه محققین خطاهایی را که پیشتر از آن با خطای برون یابی یاد کردیم،  مورد بررسی قرار داده و با روشی تحت عنوان خط نزدیکترین همسایه (NNL) برای آن راه حلی را پیشنهاد کردند. روش  NNL همچنین به طور قابل توجهی هزینه محاسباتی را نیز کاهش می دهد. در ادامه، روش نزدیکترین همسایه موزون (خوش آهنگ) (TNN) به منظور بهبود کارایی NFL مطرح شد.  روش نزدیکترین ویژگی نقطه میانی (NFM) برای تصحیح کردن روش NFL با استفاده از تشریح فاصله ی متریک به عنوان حداقل فاصله اقلیدسی بین نقطه جستجو و نقاط میانی دونقطه نمونه تشکیل دهنده روش FL مطرح شد. پیچیدگی محاسباتی روش NFM به طور قابل توجهی از روشNFL  کمتر است.  تمامی روش های تصحیحی نتوانستند با خطای درون یابی مقابله کنند. روشی با عنوان نزدیکترین پاره خط ویژگی اصلاح شده (RNFLS) مطرح شده و نویسندگان آن اعلام کردند که هردو مورد خطای مطرح شده در بالا توسط این روش مرتفع گردیده است. بدین ترتیب این روش می توانست کارایی دسته بندی را بیش از پیش بهبود ببخشد. باید گفت که روش RNFLS نیز نقایص خودش را دارد. اکثریت بر این باورند که پیاده سازی روش RNFLS  پیچیده بوده و فرآیند پیش انتخاب داده های نمونه را دارد. روش های دیگری نیز در جهت اصلاح روش NFL ارایه شده اند. روش کرنل و تجزیه و تحلیل زیر فضا به منظور توسعه نزدیکترین ویژگی به نزدیکترین ویژگی غیر خطی زیر فضای خطی معرفی می شود. زیر فضا ها توسط نزدیکترین فاصله ی خط ویژگی کلاس درونی به منظور دستیابی به قابلیت متمایز کننده ی مورد انتظار ایجاد می شوند. در این مقاله ما رویکردی جدید را برای طبقه بندی با استفاده از روش NFL اصلاح شده با نام کوتاه ترین پاره خط ویژگی (SFLS) مطرح می کنیم. رویکرد مطرح شده توسط ما، پایه نظری – هندسی واضحی داشته و نتایج ارزشمند و مزایای روش NFL را حفظ می کند. مثلا از یک مدل خطی  جفت های نقاط نمونه داخل کلاس یکسان استفاده می کند. به جای محاسبه فاصله بین نقطه مورد جستجو و خط ویژگی (خط شاخص) روش SFLS تلاش می کند تا کوتاه ترین پاره خط ویژگی (پاره خط شاخص) را بدست آورد که رابطه هندسی داده شده به همراه نقطه مورد جستجو را در کنار هم ارضا کند.  SFLS دارای قابلیت طبقه بندی شگفت انگیزی بوده و می تواند به هر دو خطای درون یابی و برون یابی فائق آید.

پیاده سازی روش SFLS نسبتا ساده بوده و هیچ گونه فرآیند پیش پردازشی در این روش وجود ندارد.   آزمایشات صورت گرفته بر اساس مجموعه داده های حقیقی و مصنوعی صورت پذیرفته اند و مقایسه نتایج آزمایش های مرتبط نیز نشان می دهند که روش SFLS در قیاس با دیگر روش های طبقه بندی مبتنی بر همسایگی مانند  NN ,K-NN ,NFL و برخی از روش های NFL اصلاح شده، دارای کارایی شگفت انگیزی است. کار صورت گرفته در حال حاضر بر اساس کار قبلی ما در سال ۲۰۰۹ می باشد.

معرفی کوتاهی از روش نزدیکترین خط ویژگی (خط شاخص)NFL

رویکرد نزدیکترین خط ویژگی NFL این است که از اطلاعات فراهم شده توسط هر جفت نقطه در کلاس یکسان و با استفاده از برخی از فضا های خط ویژگی FL استفاده می کند. فاصله ای را که در روش NFL در نظر می گیریم  فاصله اقلیدسی از نقطه جستجو به خط ویژگی FL  است. به طور مثال، فاصله ی بین نقطه جستجو و تصویر آن به خط ویژگی Fl در شکل ۱ به تصویر کشیده شده است. زمانیکه اندازه ی مجموعه نمونه به طور نسبی کوچک بوده و بردار ویژگی داده های نمونه دارای بعد بزرگی باشد، روش NFL همواره از روش NN که از تعاریف فاصله مرسوم و متداول استفاده می کند برتری دارد.

A novel classifier based on shortest feature line segment

Abstract

A new approach called shortest feature line segment (SFLS) is proposed to implement pattern classification in this paper, which can retain the ideas and advantages of nearest feature line (NFL) and at the same time can counteract the drawbacks of NFL. The proposed SFLS uses the length of the feature line segment satisfying given geometric relation with query point instead of the perpendicular distance defined in NFL. SFLS has clear geometric–theoretic foundation and is relatively simple. Experimental results on some artificial datasets and real-world datasets are provided, together with the comparisons between SFLS and other neighborhood-based classification methods, including nearest neighbor (NN), k-NN, NFL and some refined NFL methods, etc. It can be concluded that SFLS is a simple yet effective classification approach.

لینک مقاله اصلی:

https://www.sciencedirect.com/science/article/pii/S0167865510003661

افزودن به سبد خرید

لطفاً براي ارسال دیدگاه، ابتدا وارد حساب كاربري خود بشويد

محصولات پر فروش

پر فروش ترین محصولات فروشگاه روکساوب