عنوان پروپوزال : ارائه روش کاهش ویژگیAutoencoder مبتنی بر خمینه
مقدمه:
امروزه در بسياری کاربردها، دادههای ورودی به شبکه های عصبی، پيچيدهتر وحجيمتر شده و دارای ويژگيهای بيشتری ميباشند. در اين ميان بسياری از ويژگيها غيرمرتبط و مازاد بوده و بيانگر ساختار اصلی دادهها نميباشد. از اين رو مرحله تبديل/کاهش ويژگی می تواند تاثير بسزايی در کارايی شبکه های عصبی داشته باشد. کاهش ويژگی نوعی از تبديل ويژگی می باشد که می تواند ويژگی هايی نامرتبط از داده ها را حذف کرده و منجر به افزايش سرعت بدون از دست رفتن دقت بازشناس شود. ويژگی های استخراج شده می بايست به گونه اي باشند که ساختار و ابعاد اصلی دادهها را نشان دهند. روش تبديل / کاهش ويژگی می تواند بر اساس معيارهای مختلفی از جمله جداسازی کلاسی، استقلال ويژگی ها، اطلاعات متقابل بين ويژگی ها و کلاسها و حفظ ساختار اصلی و ارتباط بين ویژگيها انجام بگيرد. کاهش بعد با تبدیل ویژگی ارتباط نزدیکی دارد.[۱]
روش های کاهش بعد گوناگونی برای کشف ساختارهای مورد اعتماد از داده ها مورد استفاده قرار می گیرد
دادههای دارای ابعاد بالا٬ یعنی دادههایی که نیاز به بیش از ۲ یا ۳ بعد برای نمایش داده شدن دارند٬ دشوار است. یک راه برای سادهسازی این است که فرض کنیم دادهها روی یک خمینه غیرخطی نهفته در فضای مورد نظر قرار دارند. اگر بعد خمینه به مقدار کافی کم باشد٬ دادهها را میتوان در این فضای با ابعاد پایینتر نشان داد.
الگوریتم اتوانکدر یک روش کاهش بعد با استفاده از شبکه عصبی می باشد اخیرا شکل توسعه یافته الگوریتم اتوانکدر یک روش مورد اعتماد برای یادگیری ویژگی های مفید از دادها می باشد اما الگوریتم اتوانکدر سنتی تنها به ساخت دادهای ورودی در خروجی می پردازد و ارتباط بین داده ها را در نظر نمی گیرد.
هدف ما ارائه یک روش برای کاهش بعد بر اساس یادگیری منفیلد می باشد این روش اتوانکدر سنتی را به این صورت توسعه می دهد که اتوانکدر سنتی مکررا ارتباط بین داده ها را به دست آورده و یک خمینه ی مناسب برای کاهش بعد ایجاد می کند به عبارت دیگر اتوانکدر سنتی با اتوانکدر توسعه داده شده توسط ما در دو مورد تفاوت دارد: شبکه اتوانکدر توسعه داده شده از نمونه ی xi استفاده کرده و نمایش فشرده ی yi را یاد می گیرد و ارتباط بین نمونه ی xi با سایر نمونه های موجود در مجموعه ی {xj,xk,xm,…} را بوسیله ی استفاده از yi ایجاد کرده و بر خلاف اتوانکدر سنتی تنها نمونه ی xi را ایجاد نمی کند. همچنین اتوانکدر توسعه یافته میزان وزن ارتباط را بوسیله ی خطای بازسازی sij بیان می کند. ما از این اتوانکدر توسعه یافته استفاده می کنیم تا یک چارچوب کلی برای کاهش بعد بوسیله ی مجموعه ای از نمونه های بازسازی شده و اختلاف وزن ها استفاده کنیم.[۹]
اهداف اصلی
هدف ما ارائه یک الگوریتم برای کاهش بعد داده ها بر اساس یادگیری خمینه می باشد . در این الگوریتم که بهبودی بر روش اتوانکدر سنتی می باشد ابتدا به منظور مقدار دهی اولیه ما مجموعه ای از ارتباط ها بین داده را بر اساس شباهت یا فاصله ی جفت داده ها در ابعاد بالای واقعیشان را محاسبه می کنیم سپس بر اساس این مقادیر اولیه به دست آمده یک مجموعه ی ارتباط یا شباهت را برای هر نمونه ی ورودی اتوانکدر محاسبه می کنیم به عنوان مثال برای ورودی xi بر اساس الگوریتم k-nearest مجموعه ای از نزدیکترین همسایگانش که ارتباط قوی با این ورودی را دارند ساخته می شود. سپس فضای خمینه ی اطراف هر نمونه ی ورودی بوسیله ی اتوانکدر توسعه داده ی ما ساخته می شود. همانطور که گفته شد اتوانکدر سنتی تنها نمونه ی ورودی را در خروجی باز سازی می کند اما هدف ما از این الگوریتم توسعه ی اتوانکدر سنتی می باشد که تنها نمونه ی ورودی را در خروجی ایجاد نمی کند و به منظور استفاده از یادگیری خمینه برای کاهش بعد نه تنها ورودی را ساخته بلکه ارتباط این ورودی با دیگر اعضای مجموعه ی ارتباط را نیز بازسازی می کند. و این معیار ارتباط بین داده ها در یک فرایند اتوانکدر بوسیله ی معیار شباهت در یک فرایند تکراری به روز می شود به یک ساختار خمینه ی دقیق برسیم.[۳]
لطفاً براي ارسال دیدگاه، ابتدا وارد حساب كاربري خود بشويد