یک سیستم تشخیص نفوذ مبتنی بر داده KDD-99 با استفاده از انتخاب ویژگی و تکنیک های داده کاوی
چکیده
اینترنت و کاربران اینترنت روز به روز درحال افزایش هستند. همچنین به علت توسعه سریع تکنولوژی اینترنت، امنیت موضوع بزرگتری می شود. مزاحمان شبکه های کامپیوتری را برای حملات به طور مداوم نظارت می کنند. یک فایروال پیچیده با سیستم تشخیص نفوذ کارآمد (IDS) برای جلوگیری شبکه های کامپیوتر از حملات مورد نیاز است. یک مطالعه جامع از نوشتجات ثابت کرده که تکنیک های داده کاوی قوی ترین تکنیک ها برای توسعه IDS به عنوان طبقه بندی کننده هستند. عملکرد طبقه بندی کننده یک موضوع بسیار سخت در شرایط کارآمدی آن است، همچنین تعداد ویژگی اسکن شده با IDS باید بهینه سازی شود. در این مقاله دو تکنیک C5.0 و شبکه های عصبی مصنوعی (ANN) با انتخاب ویژگی مورد استفاده قرار گرفته است. تکنیک های انتخاب ویژگی برخی از ویژگی های نامربوط را دور خواهند ریخت در حالی که C5.0 و ANN به عنوان یک طبقه بندی کننده برای طبقه بندی داده در هر دو نوع عادی یا یکی از ۵ نوع حملات عمل میکنند. مجوعه داده KDD-99 برای تست و آموزش مدل استفاده میشود ، مدل C5.0 با تعداد ویژگی ها نتایج بهتر با بیشترین دقت۱۰۰% تولید می کند. عملکردها همچنین در شرایط اندازه تقسیم بندی داده تایید شده است.
کلمات کیدی: درخت تصمیم گیری، انتخاب ویژگی، سیستم تشخیص نفوذ، اندازه پارتیشن، اندازه گیری های کارایی.
مقدمه
امنیت شبکه یا اطلاعات یک موضوع مهم برای هر سازمان برای حفاظت داده و اطلاعات در شبکه کامپیوتر خودشان در برابر انواع مختلفی از حملات با کمک یک سیستم تشخیص نفوذ (IDS)قوی و کارآمد شده است. IDS می تواند با استفاده از تکنیک های مختلف یادگیری ماشین توسعه یابد. IDS به عنوان یک طبقه بندی کننده عمل می کنند که داده را به صورت عادی یا حمله طبقه بندی میکند. طیقه بندی یک فرایند قراردادن دسته های مختلف از داده با همدیگر است. طبقه بندی یکی از معمول ترین کاربردهای داده کاوی است که نوع مشابهی از نمونه ها با همدیگر در روش نظارت شده گروه بندی میشوند. Su-Yu Wua و همکاران [۱] از SVM و درخت طبقه بندی برای مقایسه دقت ، تشخیص نرخ ها و نرخ هشدار نادرست استفاده کردند. این نتیجه نشان می دهد که C4.5 در تشخیص و دقت بالاتر از SVM است اما در نرخ هشدار نادرست SVM بهتر است. Wang Gang و همکاران[۲] یک رویکرد تشخیص نفوذ جدید FC-ANN را با استفاده از طبقه بندی فازی و شبکه عصبی پیشنهاد کردند . این مدل نتایج موثری برای R2L و U2R در شرایط دقت می دهد. V. Balon Canedo و همکاران [۳] یک روش برنده KDD جدید شامل تجزیه ها، فیلترها، و طبقه بندی های مختلف مانند نیوی بیز (NB) و C4.5 برای توسعه IDS قوی است. طبقه بندی کننده پیشنهادی دقت بالایی مثلا ۹۹٫۴۵% در مقایسه با بقیه می دهد.
Reda M Elbasiony . و همکاران [۴] یک تکنیک ترکیبی را با ترکیب الگوریتم k-mean و جنگل تصادفی پیشنهاد کرده اند. این چارچوب ترکیبی نرخ های تشخیص و نرخ های مثبت نادرست را بهتر از تکنیک های دیگر به دست می آورد. Zubair A Baig و همکاران [۵] شبکه عصبی نظارت شده را استفاده کردند و مدل تشخیص نفوذ شبکه GMDH با بازده تشخیص حمله بالا نزدیک به ۹۸% پیشنهاد کردند. Bin Luo و همکاران [۶] ، FASVFG را مبتنی بر طبقه بندی کننده پیشنهاد کردند که یک دقت تعمیم بالا ی۹۴٫۳۵۵ در آزمایشات اعتبار به دست میآورد و میانگین Mathews ضریب همبستگی به ۰٫۸۸۵۸ می رسد. در این مطالعه یک تکنیک درخت تصمیم گیری :C5.0 و شبکه عصبی مصنوعی ( ANN) مبتنی بر تکنیک ها در شرایط سایز پارتیشن و انتخاب ویژگی کشف شدند. C5.0 به طور قابل مقایسه ای یک تکنیک درخت تصمیم گیری جدید پیشنهاد شده توسط Quinlan است. کارایی این تکنیک بهتر از تکنیک های قبلی آن مانند ID3 و C4.5 پیشنهاد شده توسط Quinlan برای تعداد زیادی از کاربردها است. این تکنیک ها توسط محققان زیادی در دامنه مسائل مختلف برای طبقه بندی داده استفاده شدند و دقت خیلی بالایی به دست آوردند. از طرف دیگر ANN یک طبقه بندی کننده خوب است ، که داده را با ارائه جفت ورودی –خروجی طبقه بندی می کنند. EBPN به طور گسترده تر از ANN استفاده شده است.
لطفاً براي ارسال دیدگاه، ابتدا وارد حساب كاربري خود بشويد