کارت، جست وجو در سطل زباله، کارتهای جعلی (پـاک کـردن نـوار مغناطیسـی1، ایجـاد کـارتتقلبی، ضبط کردن2، کارت سـفید )، سـرقت پسـتی، افشـای اطلاعـات در محـل کـار یـا منـزل،شبکه هـای اجتمـاعی، تقلـب ورشکسـتگی3، تقلـب در دسـتگاه هـای خـودپرداز ( حلقـه لبنـانی4، دست خوانی5) و غصبکردن6 (دلامیر، عبـدو و پوینتـون، 2009؛ پـاش، 2008؛ پاتیـدار و شـارما،2011؛ ساخارووا، 2012) است. بهطور مسلم روش های تقلب به موارد اشارهشده محدود نمیشـودو متخلفان از روش های دیگری نیز استفاده می کننـد . هرچـه تمهیـدات امنیتـی بانـک هـا بـرایجلوگیری از تقلب افزایش می یابد، متقلبان روش های جدیدتری به کار میبرند. نکته مثبت اینکـهتقلب معمولاً با الگوهای مشخصی صورت می پذیرد که امکان شناسایی این الگوها و تقلـب هـایمربوط به آن الگوها وجود دارد.
پیشینه تجربی
هرچند شناسایی تقلب آسان نیست، روش های گوناگونی برای شناسایی تقلب کارت هـای بـانکی بهکار گرفته می شود. اغلب روش های استفاده شده در ادبیات موضوع، مبتنی بر داده کـاوی اسـت.
روش های داده کاوی به عنوان یکی از اصلی ترین ابزارهای شناسایی تقلب در کـارت هـای بـانکیاستفاده می شـود (بـولتن و هنـد، 2002). داده کـاوی، فراینـد کشـف روابـط ناشـناخته و الگـویدرون داده هاست، درواقع فعالیتی است که به طور اساسی با آمار و تحلیل دقیق داده ها انطباق دارد (آذر، احمدی و سبط، 1389). هرچه حجم داده ها بیشـتر و روابـط میـان آنهـا پیچیـدهتـر باشـد،دسترسی به اطلاعات نهفته در داده ها مشکل تر می شود، لذا نقـش داده کـاوی بـه مثابـه یکـی ازروش های کشف دانش، روشن تر می شود (شهرابی، 1392).
راهبردهای کلان مسائل شناسایی تقلب در حوزه کارت های بانکی را نیز می توان منطبـق بـا راهبردهای داده کاوی دانست. دو راهبرد کلان برای فراینـد داده کـاوی وجـود دار د: 1. یـادگیرینظارت شده7 و 2. یادگیری نظارت نشده8. روش های نظارت شده، از یک پایگاه داده شـامل مـواردمتقلبانه و غیرمتقلبانه ساختاریافته استفاده می کنند و در موارد جدید مشـکوک بـه تقلـب بـه کـارمی روند. یادگیری نظارت شده از داده های گذشته یاد می گیرد و دانـش آموختـه شـده را در مـوارد
ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
Erasing the magnetic Stripe
Skimming
Bankruptcy Fraud
Lebanese Loop
Shoulder Surfing
Imposters
Supervised Learning
Unsupervised Learning
بعدی به کار می برد. این فرایند تلاش می کنـد الگوهـای از پـیش تعریـف شـده معـین از فعالیـتتراکنش هایی را شناسایی کند که برای مطابقت دادن با فعالیت های متقلبانه به کار می روند.
در روش نظارت نشده، سیستم بدون در اختیارداشتن داده های خروجی و بدون کمک خارجی، درستی یا نادرستی سیگنال های خروجی خود را مشخص می کند (پاش، 2008: 25). بلتن و هنـددر سال 2002 روش ها و مدل های استفاده شده برای کشف تقلب را بررسی کردند. آنها مدل های کشف تقلب در حوزه کارت های اعتباری را با دو رویکرد نظارت شده و نظـارتنشـده طبقـه بنـدیکردند و برای کشف تقلب در کارت های بانکی، روش خوشه بندی را بهکار بردند. بـه کمـک ایـنروش، حساب هایی که در یک بازه زمانی مشخص الگوی رفتاری متفاوتی از خود نشان می دهند، شناسایی می شوند (بولتن و هند، 2002).
درخت های تصمیم گیری، یکی از روش های داده کاوی با قابلیت فهم زیاد و سـرعت مناسـبدر یادگیری الگو است (البرزی، محمدپورزرندی و خان بابایی، 1389). فان و همکارانش به منظـوربنا کردن یک سیستم شناسایی سرزده برای انواع تقلب، روی درخت های تصمیم به ویـژه درخـتتصمیم استقرایی1 کار کردند (فنَ، میلر، استولفو، لی و چان، 2004). همچنین شـن و همکـارانش علاوهبر سایر چارچوب های ارائهشده، درخت تصمیم را نیز آزمودند و بـا سـایر مطالعـات مقایسـهکردند (شن، تنُگ و دنگ، 2007). درخت تصمیم یکی از روشهای طبقه بندی است. هر تراکنش دارای مجموعه مشخصاتی است که بر اساس مقادیر آنها، تراکنش به یک طبقه تعلق مـی گیـرد،پس هدف از طبقه بندی، ساختن تابعی است که هر تراکنش را بر اساس مقادیر مشخصـاتش بـهیکی از چندین گروه از پیش تعیین شده، نگاشت کند. در پـژوهش دیگـری کـه روی پورتفولیـویبزرگ بانکی و به منظور تعیین تقلب در کارت های اعتباری ایتالیـا صـورت گرفتـه، از روش هـایآماری استفاده شده است (پولینا و پابا، 2010). روش های آماری برمبنای این فـرض اساسـی بنـا شدهاند که »احتمال رخداد داده های نمونه نرمال در یک مدل تصادفی، بیشـتر از احتمـال رخـداد دادههای نمونه غیر نرمال است«. بیشتر روش های آماری شناسـایی تقلـب، یـک مـدل احتمـال توزیع داده ای میسازند و آن را برای هر تراکنش ارزیابی مـی کننـد. درنتیجـه تـراکنشهـای بـااحتمال کم غیر نرمال هستند (نصیری و مینایی، 1389). پژوهشی دیگر، مدل مارکف مخفـی 2 را بهکار برده است که در آن تراکنش های کارت اعتباری با استفاده از این مدل آزمون شـده اسـت؛ بهطوری که اگر با احتمال زیاد پذیرفته نشود، تقلب محسوب میشود (سریواستاوا، کنُدو و سورال، 2008). لئونارد از سیستم خبره مبتنی بر قوانین، برای شناسایی تقلب کارت اعتباری استفاده کرده
ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
Induction
Hidden Markov Model
است (لئونارد، 1995). پژوهشی دیگر، دو نظریه داده کـاوی پیشـرفته ماشـین بـردار پشـتیبان1 و جنگل های تصادفی2 را با استفاده از رگرسیون لجستیک3 ارزیابی کرده است. پـژوهش مزبـور بـراساس داده های واقعی تراکنش های بین المللی کارت اعتباری انجـام گرفتـه اسـت (باتاچاریـا، ژا،ثاراکونل و وستلند، 2011). در سال 2011 مدلی مبتنی بـر قـوانین بـرای شناسـایی و مقابلـه بـاتراکنش های متقلبانه (برای تقلب های بدون استفاده از کارت) در سیستمهای پرداخت الکترونیکی ارائه شده است. در این روش، با تعریف الگـوریتم یـادگیری مبتنـی بـر قـوانین، بـه طبقـهبنـدیتراکنش ها به تراکنشهای »سالم« و »متقلبانه« پرداخته شده است (الخطیب، 2011).
استفاده از شبکه های عصبی مصنوعی برای طبقه بندی در بسیاری از زمینه ها، کاربرد فراوانی دارد که یکی از ویژگی های آنها، خاصیت یادگیری نظارت نشـده اسـت (قاسـمی و اصـغری زاده، 1393). شبکه های عصبی مصنوعی نیز یکی از روش هایی اسـت کـه بـرای شناسـایی تقلـب درکارت های بانکی استفاده می شود. برتری شبکه های عصبی نسبت به روش های دیگر ایـن اسـتکه می تواند از تراکنش های گذشته بیاموزد و بـا گذشـت زمـان نتـایج را بهبـود دهـد. همچنـین میتواند قوانین را استخراج کند و رفتار آینده را براساس وضعیت فعلی پیش بینی کند (نصـیری ومینایی، 1389). آگوئلکا برنامه شبکه عصبی مصنوعی کاربردی ای برای خوشه بندی طراحی کرد، این برنامه میتواند از حجم بزرگی از دادههای تراکنشها استفاده کند. در پژوهش مزبور از چهـارخوشه با ریسک زیاد، متوسط، پایین و کم ریسک شده است استفاده شده است، به این شکل کـهتراکنش های پردازش شده در یکی از این خوشهها قرار خواهد گرفت، چنانچه تـراکنش مشـکوکباشد به پایگاه داده بر می گردد (آگوئلکا، 2011). در پژوهشـی دیگـر، از شـبک ه عصـبیP-RCE به منظ ور شناس ایی تقل ب در ک ارت ه ای اعتب اری اس تفاده ش ده اس ت. P-RCE یک ی از زیرمجموعه های شبکه های توابع پایه شعاعی4 است، شبکه پس انتشار5 سه لایه دارد و بـهمنظـورشناسایی الگوها بهکار میرود. هدف این محققان، رسیدن به شبکه آموزش دیده ای بود که بتوانـد ب ه تقلب ها امتیاز دهد و تراکنش های کارت اعتباری را رتبـه بنـدی کنـد (قـوش و رایلـی، 1994:
623). پاتیدار و شارما نیز مطالعات خود را در زمینه شناسایی تراکنش های متقلبانه کارت اعتباری با استفاده از شبکههای عصبی و الگوریتم ژنتیک انجام دادند (پاتیدار و شارما، 2011).

ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
Support Vector Machine
Random Forests
Logistic Regression
Radial Basis FunctionNetworks
Feed Forward Network
تمام روش های شناسایی تقلب در کارتهای اعتباری منحصر به روش های داده کاوی نیسـتو روشهای ابتکاری دیگری نیز در نوشتارهای علمی برای شناسایی تقلب در کارت های اعتباری استفاده شده است. برای مثال، بنتلی و همکاران نیز از دو روش الگوریتم ژنتیک و منطـق فـازیاستفاده کردند. هدف آنها ایجاد قوانین منطقی مناسب بـرای طبقـه بنـدی تـراکنش هـای کـارتاعتباری به طبقه های مشکوک و غیرمشکوک با استفاده از روش فازی داروینی بوده است. اساساً این روش فرایند امتیازدهی را دنبال میکند. در آزمایش شرح داده شده در ایـن پـژوهش ، پایگـاهداده از 4000 تراکنش با 62 فیلد ساخته شده است و انواع مختلـف قـوانین بـه وسـیله فیلـدهایمتفاوتی آزمایش شده اند. آنها معتقد بودند بهترین قانون، قانونی است که بالاترین پـیش بینـی راانجام دهد (بنِتلی، کـیم، جوانـگ و چـوی، 2000). همچنـین چـان و همکـارانش الگـوریتمی رابه منظور پیش بینی رفتار مشکوک ایجاد کردند. در حالیکه مطالعـات دیگـر از ارزیـابی مبتنـی بـر درصد پیش بینی، درصد مثبت درست و درصد منفی نادرست استفاده می کنند، اساس این پژوهش ارزیابی بـ ه کمـک مـدل هزینـه اسـت (چـان، فـَن، پرودرومیـدیس و اسـتولفو، 1999). گـادی وهمکارانش از جست وجوی جامع و الگوریتم ژنتیک برای انتخاب مجموعه پارامترهـای بهینـه ای استفاده کردند که هزینه تقلب برای پایگاه داده کارت اعتباری توسط صادرکنندگان کارت برزیلی را کمینه کند (گادی، وانگ، پِرِیرا و لاگو، 2008). نوبرزاد نیز در پایاننامه کارشناسی ارشد خود، از روش جستوجوی پراکنده و الگوریتم ژنتیک برای شناسایی تقلب در کارت های بـانکی اسـتفادهکرد (نوبرزاد، 1391).
روش های دیگری نیز برای شناسایی تقلب کارت اعتباری استفاده شده است، از جمله نظریـهدمپستر ـ شفر، نظریه یادگیری بیزین1 (پانیگراهی، کنُدو، سورال و مجومدار، 2009) و پیونـدزنی2 (کنُدو، پانیگراهی، سورال و مجومدار، 2009؛ هوانگ، توفیق و نگَـَر، 2010؛ کریفکـو، 2010). در مطالعه دیگری محقر و همکارانش، روش های کشف تقلب در بانکـداری را بـه دو دسـته اصـلیِ»روش های آماری« و »روش های هوش مصنوعی« تقسیم کردند و به بررسی امکان اسـتفاده ازروش مبتنی بر هوش کسب و کار پرداختند (محقر، لوکس، حسینی و منشی، 1387). در دسته بندی این روش ها، مرزبندی چندان دقیقی وجود ندارد؛ چرا که هریک از این روش هـا فقـط شـکلی ازیک روش علمی است و برخی از آن ها میتوانند بـه یکـدیگر تبـدیل شـوند. یـادآوری مـیشـود ، هیچ یک از این روش ها به تنهایی نمیتوانند تقلب را حذف کنند، درواقع هـر روش توانـایی یـکسیستم را در شناسایی تقلب افزایش می دهد.
ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
Bayesian Learning
Hybridization
مدل مفهومی
مدل مفهومی، توصیف غیرنرم افزاری خاصی از مدل اسـت کـه اهـداف، ورودی هـا، خروجـی هـا،محتوی و فرضیه های مدل را تشریح می کند (رابینسون، 2004: 63-74). به طور خلاصه پـس ازتعیین هدف اصلی پژوهش با عنوان ایجاد مدلی با قابلیت اطمینان مناسـب بـه منظـور شناسـاییتقلب در کارت های بانکی، نحوه جمع آوری، پردازش و آمـاده سـازی داده هـا بـرای ایجـاد مـدل،تشریح می شود و داده های تقلب (تراکنش های متقلبانه یا مشکوک به تقلب) که به کمـک دانـشخبرگان و ادبیات موضوع شبیه سازی شده اسـت، بـرای مـدلسـازی آمـاده خواهـد شـد . سـپسمتغیرهای مستقل و وابسته مدل تعیین می شوند و در مدل شـبک ه عصـبی پرسـپترون چندلایـه، به منزله مدل اصلی پژوهش برای طبقه بندی تراکنش ها به »سالم« و »متقلبانه یـا مشـکوک بـهتقلب« وارد خواهند شد.
با استفاده از درصدی از داده ها به صورت تصادفی، مدل شـبک ه عصـبی پرسـپترون چندلایـهآموزش داده شد و مشخصات شبکه عصبی شناسایی تقلب در کارت های بـانکی بـه دسـت آمـد.
شکل 1، مدل مفهومی پژوهش حاضر را در قالب نمودار جریان منطقی نمایش می دهد.

شکل 1. مدل مفهومی پژوهش
روش شناسی پژوهش
در این بخش به چگونگی جمع آوری اطلاعات پژوهش، تشریح و بررسی کیفیـت داده هـا، نحـوه انتخاب داده ها برای تدوین چارچوب و پاکسازی داده ها پرداخته می شود و پس از ایجاد داده هـایمتقلبانه (مشکوک به تقلب) ، به طراحی چارچوبی برای شناسایی تقلب در کارتهای بانکی اقـدامخواهد شد.
جمعآوری و آمادهسازی دادهها
داده های اصلی پژوهش از تراکنش هـای ثبـت شـده کـارت هـای بـانکی در پایگـاه داده یکـ ی از بانک های غیردولتی داخلی با رعایت ملاحظات اخلاقی و با اخذ مجوز از آن بانک، به دست آمد و از آن برای طراحی چارچوب شناسایی تقلب در کارتهای بانکی بهره جویی شد. لذا تراکنش هـایحدود 120 هزار کارت در بازه زمانی تقریبی دو سال از تاریخ افتتاح بانک یادشده با حدود بیش از 10 میلیون تراکنش استخراج شده است. با توجه به تعدد فیلـدهای اطلاعـاتی و کـاربردی نبـودنبرخی از آنها برای این پژوهش، پس از تحلیل آنها ب هکمک خبرگان و در نظرگـرفتن تقلـبهـایصورت گرفته و شناسایی فیلدهای تحت تأثیر تقلب های مختلـف، پارامترهـای مـؤثر در طراحـیچارچوب پژوهش استخراج شد و فیلدهای ناکارا از پایگاه اطلاعاتی کنار گذاشته شد.
بهدلیل حجم زیاد داده های ذخیرهشده در پایگاه اطلاعاتی بانک (حدود 10 میلیون تـراکنش ) و محدودیت نرم افزارها در پردازش حجم زیاد داده ها، تعدادی از مجموعه تراکنش های ذکرشـده،نماینده هایی از کل تراکنش های موجود در نظر گرفته شـدند . بـدین ترتیـب درنهایـت 111,349 تعداد تراکنش مختص به 641 دارنده کارت برای ادامه پژوهش در نظر گرفتـه شـد. گـروه هـایهدف یا کارت هایی که در معرض ریسک بیشتری قرار دارند و پتانسیل سوء استفاده از آنهـا زیـاداست، متشکل از سه گروه تراکنش زیر است:
گ روه 1: ب ه ت راکنشه ای 120 ک ارتی اختص اص دارد ک ه از لح اظ حج م ت راکنش،پرتراکنش ترین کارت ها هستند. در مجمـوع 78,313 رکـورد در گـروه اول جـای گرفـت. دلیـلانتخاب این گروه قرار داشتن در معرض ریسک بیشتر بوده است.
گروه 2: به تراکنش های 371 کارتی اختصاص دارد کـه از لحـاظ حجـم تـراکنش در گـروهکم تراکنش ترین کارت ها قرار دارند. در مجموع 6012 رکورد در گروه دوم جای گرفت که اغلـبآنها مختص به کارت های صادر شده بـرای افـراد مسـن و سـالخورده اسـت کـه تـراکنش هـایمحدودی انجام میدهند.
گروه 3: تراکنش های مربوط به 150 کارتی است که بهصـورت تصـادفی انتخـاب شـدند. در مجموع برای گروه سوم 27,024 رکورد بـا اسـتفاده از توزیـع برنـولی بـا احتمـال 3/0 درصـد از تراکنشهایی که در گروههای قبلی جای ندارند، به دست آمده است.
همان طور که اشاره شد، گروه های اول و دوم، گروه هایی هستند که متقلبان بیشـتر بـه آنهـاتوجه می کنند و گروه سوم، بخشی تصادفی از سایر کا رتهای موجود است.
از آنجاکه برای این پژوهش داده های متقلبانه وجود ندارد، با بهره گیری از دو منبع مصاحبه و ادبیات موضوع، اقدام به ایجاد داده های متقلبانه برای استفاده در مدل سازی شد. فوا و همکارانش اعتقاد دارند که داده های مصنوعی می توانند یک سیستم را آموزش دهند. انواع مختلف تقلبهای شناختهشده و جدید را می توان به صورت مصنوعی ایجاد کرد (فوا، لی، اسمیت و گایلر، 2005). از این رو سازوکار تهیه تراکنش های مشکوک به تقلب در این پژوهش، از طریـق اعمـال تغییـرات معنا دار روی داده های گردآوری شده از طریق پرونده های موجود درخصوص تراکنش های متقلبانه یا موارد مشکوک گزارش شده، مصاحبه با کارشناسان، خبرگان و صاحبنظران، ادبیات موضوع در خصوص تقلب های ممکن در کارت های بانکی و همچنین تحلیل و شبیه سـازی اطلاعـات بـودهاست. درمجموع حدود 2/0 درصد (212 تراکنش) از کل داده های استفادهشده در این پـژوهش را داده های تقلب تشکیل داده است.
متغیرهای مدل
متغیرهای ورودی شبکه عصبی شامل 15 متغیر مستقلی است که در تعیین رفتـار دارنـده کـارتنقش دارند. برای متغیر خروجی در سیستم نیز یک پارامتر تعیین شده است. 15 متغیـر ورودی را فیلدهای اطلاعاتی منتخب از میان تمامی فیلدهای مربوط به تراکنش های ثبت شـده در سیسـتمبانکی تشکیل می دهند. این فیلدها از انواع مختلفی مانند عددی، رشته ای، تـاریخ، زمـان و غیـرههستند که برای تبدیل به متغیرهای قابل استفاده در مدل سازی باید به نوع عددی تبدیل شـوند .
لذا برای هر یک از متغیرها، روشی لحاظ شد تا به نوع عددی تبدیل شود.
متغیر وابسته مدل (Fraud-Detector)، به شکل یـک متغیـر طبقـه ای تعریـف شـده اسـت؛ به صورتی که این متغیر با پردازش متغیرهـای مسـتقل، یکـی از مقـادیر »سـالم « یـا »متقلبانـه(مشکوک به تقلب)« را به خود می گیرد. از آنجا که برای ایجاد مدل های پژوهش حاضـر مقـادیرعددی استفاده می شود، برای تراکنش های سالم مقدار متغیر وابسته صفر ( طبقـه منفـی ) و بـرایتراکنش های متقلبانه (یا مشکوک به تقلب)، مقدار یک (طبقه مثبـت ) لحـاظ شـده اسـت ؛ بـدینترتیب مقادیر رشته ای ذکرشده به عدد تبدیل شدند.
ایجاد مدل شبکه عصبی پرسپترون چندلایه
اغلب محققان شبکه های عصبی چندلایه پیشخور، بـه ویـژه شـبکه هـای پرسـپترون چندلایـه را تقریب زننده های جهانی معرفی می کنند و معتقدند این شبکه هـا در صـورت وجـود لایـه و تعـدادنورون کافی در لایه های خود، می توانند هر نگاشت غیر خطی را با هر تقریب دلخواه برآورد کنند.
شبکه های زیادی برای استفاده در طبقه بندی و پیش بینی پیشنهاد شده اسـت ، ولـی ایـن شـبکهیکی از موفق ترین شبکههای طبقهبندی و پیشبینی است (نوریگا، 2005). لذا در این پژوهش از این نوع شبکه عصبی مصنوعی برای طبقه بندی تراکنش ها به طبقات سـالم و متقلبانـه اسـتفادهشده است. شبکه پرسپترون از قاعده »پس انتشار خطا1« استفاده میکند که الگوریتم تعمیم یافتـه »حداقل مربعات خطا« است. شبکه های پرسپترون به دو نوع تکلایه و چندلایه تقسیم میشوند. در نوع چندلایه که تعمیم نوع تک لایه است، هر نورون در هر لایه به تمام نورون های لایه قبل، متصل است.
برای ایجاد شبکه عصبی پرسپترون چندلایه به منظور شناسایی تقلب در کـارت هـای بـانکی،پس از آزمایش حالت های مختلف ایجادشده برای شبکه عصبی (تعداد لایه های مختلـف، تعـدادگره های مختلف در هر لایه و توابع تبدیل مختلف) ، بهترین حالت انتخاب شده است. این کار بـامقایسه میانگین مربعات خطا (MSE)2 در هریـک از حـالات و در نظـر گـرفتن اصـل امسـاک3 به کمک نرم افزار انجام گرفته است. شبکه مد نظر باید بتواند متغیرهای مستقل را دریافت کنـد و پس از پردازش آنها با استفاده از قابلیت بازشناسی الگـو 4، مقـدار متغیـر وابسـته (مقـدار یکـی ازطبقات) را برآورد کند. در طراحی شبکه عصبی، از متغیرهای مستقل و وابسته پیش گفته اسـتفادهشده است؛ به این معنا که متغیرهای مستقل، واحدهای (نورون ها) مربوط به لایه ورودی شبکه و متغیر وابسته، واحد(های) مربوط به لایه خروجی شبکه را تشکیل میدهند.
از آنجا که شبکه عصبی می تواند تأثیرات متقابل متغیرها (روابـط بـین متغیرهـا) را شناسـاییکند، از واردکردن عبارت های مربوط به تأثیرات متقابل خودداری شده است. در ضمن با توجه بـهقابلیت یادشده، به تعریف متغیرهایی که تلفیق شده اند یا منتج از متغیرهای دیگرند، نیازی نیست.
برای ایجاد مدل شناسایی تقلب در کارت های بانکی، یک متغیر افراز5 ایجـاد شـد تـا بتـوانداده ها را به دو بخش آموزش و اعتبارسنجی تقسیم بندی کرد. اسـتفاده از داده هـای آزمـایش درایجاد مدل الزامی نیست؛ زیرا اگر داده ای برای آزمایش در نظر گرفته نشود، از داده های آمـوزشبرای پیگیری خطاها استفاده می شود. این موضوع تنها زمان آموزش شبکه را افزایش میدهد. در این پژوهش، بهدلیل محدودبودن تعداد داده های تقلب و استفاده از حداکثر این داده هـا در فراینـدآموزش شبکه، از تخصیص داده های آزمایش خودداری شده است. به واسطه تعریف متغیر افـراز وانتخاب داده هایی که برای آموزش و اعتبارسنجی استفاده خواهند شد، از مجموع 111,349 داده، 66,648 داده (60 درصد) برای آموزش و ایجاد مدل اختصاص یافت و 44,698 داده (40 درصـد )
ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
Error back propagation
Mean Square Error
Parsimony
Pattern recognition
Partition variable
برای اعتبارسنجی مدل به صورت تصادفی تخصیص داده شد. برای تخصیص تصادفی داده ها بـهمجموعه های یادشده، از توزیع برنولی با احتمال 60 درصد برای متغیر افراز استفاده شده است.
تابع تبدیل انتخاب و استفاده شده برای تمامی نورون هـای لایـه هـای پنهـان، تـابع تانژانـتهیپربولیک1 است. رابطه 1 ، تابع تبدیل یادشده را نشان می دهد. این تابع، مقادیر حقیقی را پس از دریافت به مقداری در بازه (1,1) تبدیل می کند.

( ) = tanh( ) =

(1 رابطه
+
تابع تبدیل Softmax برای واحدهای لایه خروجی انتخـاب شـده اسـت . ایـن تـابع تبـدیل،برداری از المان هایی با مقدار حقیقی را دریافت می کند و به برداری که هر یک از المان هایش در بازه (1,0) قرار می گیرد و مجموع المان هایش برابر یک می شـود ، تبـدیل مـی کنـد . تـابع تبـدیلSoftmax به صورت رابطه 2 است. تابع Softmax زمانی برای نورون های لایه خروجی اسـت فاده می شود که تمامی متغیرهای وابسته از نوع طبقه ای باشند. به همین دلیـل در ایـن پـژوهش کـهمتغیر وابسته از نوع طبقه ای است، تابع Softmax، تابع تبدیل واحدهای لایـ ه خروجـی انتخـاب شده است.
() = Softmax

(2 رابطه
در این پژوهش با توجه به اینکه تعداد داده های متقلبانه (متغیر وابسته با مقدار یـک) محـدوداست، تلاش بر این بوده است که هیچ یک از دادههای متقلبانه از فرایند آموزش حذف نشـود. بـههمین منظور از روش گروهی2 برای آموزش شبکه بهره جویی شده است. الگوریتم بهینـه سـازی3 برای برآورد وزن های سیناپسی استفاده می شود. الگوریتم بهینه سازی از نوع »گرادیـان همجـوارمقیاس بندی شده«4 انتخاب شده است که گونه ای از الگوریتم پس انتشار خطـا شـمرده مـی شـود .
همان طور که پیش از این هم اشاره شد، الگوریتم پـس انتشـار خطـا، نـوعی از الگـوریتم حـداقلمربعات خطا است. این روش برای نوع آموزش گروهی مناسب است و برای آموزش لحظـه ای و نیمه گروهی مناسب نیست. قواعد اختتام آموزش، به ترتیب »یک مرحله بدون کاهش در خطـا « و
ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
Hyperbolic tangent
Batch training
Optimization algorithm
Scaled Conjugate Gradient (SCG)
»حداکثر 500 دوره1 آموزش (عبور داده ها)« انتخاب شده است. این قواعـد مـیتواننـ د از مسـئلهانطباق بیش از حد2 جلوگیری کنند.
خروجی یک مدل طبقه بندی می تواند یک مقدار حقیقی باشد. سیستم طبقه بندی، این مقادیر حقیقی (شبه احتمال) را برای هر مورد با آستانه افتراق3 (مقـدار بـرش)4 مـی سـنجد و در صـورتبزرگتر بودن از مقدار برش، آن مورد را در طبقه مثبت قرار می دهد.
توضیح اینکه برای هر طبقه متغیر(های) وابسته طبقه ای با تابع تبـدیلSoftmax و خطـای Cross-Entropy، مقداری توسط شبکه محاسبه می شود که این مقدار، احتمال ایـن اسـت کـهیک رکورد به یک طبقه تعلق دارد یا خیر.
همانطور که پیش از این نیز اشاره شد، هدف از ایجاد شـبکه عصـبی پرسـپترون چندلایـه،طبقه بندی تراکنش های کارت های بانکی به دو طبقه سالم و متقلبانـه اسـت کـه ایـن کـار را بـامحاسبه یک شبه احتمال برای هر طبقه در هر تراکنش انجام می دهد. مقدار پیش فرض برای حد آستانه 5/0 فرض شده است که می توان این حد آستانه را تغییر داد. بنابراین مقادیر شـب هاحتمـالبزرگتر از 5/0، متعلـق بـه طبقـه مربوطـه اسـت. از ایـن رو بهتـرین شـبکه عصـبی پرسـپترون انتخابشده برای این پژوهش، شبکه ای با دو لایه پنهـان اسـت. لایـه ورودی ( لایـه اول) ایـنشبکه، 61 گره یا نورون (بدون در نظر گرفتن بایاس5) دارد که از 15 متغیر مستقل بهدست آمـدهاست. شبکه، هریک از طبقه های متغیرهای طبقه ای را یک نورون در نظر مـی گیـرد . بـه همـیندلیل تعداد نورون های لایه ورودی به جای 15 واحد، 61 واحد است.
شبکه منتخب دارای 12 گره (نورون) و یک بایاس در لایه پنهان اول (لایه دوم شـبکه) و 9 گره (نورون) و یک بایاس در لایه پنهان دوم (لایه سوم شبکه) است. لایه آخر (خروجی شـبکه)، دو گره دارد (دو طبقه مربوط به متغیر وابسته) که پس از تـأثیر تـابع تبـدیلSoftmax ، بـرداریشامل مؤلفه هایی با مقدار شبهاحتمال هر طبقه برآورد می کند. با توجه به توضیحاتی که بیان شد، شبکه حاصل را می توان به صورت 61-12-9-2MLP بیان کرد. توضیح اینکه تمامی گـره هـای هـرلایه به تمامی گرههای لایههای قبل متصل است. این اتصال ها به منزله وزن هر یـک از عناصـرشبکه است (شکل 2).

ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
Epoch
Over fitting

در این سایت فقط تکه هایی از این مطلب با شماره بندی انتهای صفحه درج می شود که ممکن است هنگام انتقال از فایل ورد به داخل سایت کلمات به هم بریزد یا شکل ها درج نشود

شما می توانید تکه های دیگری از این مطلب را با جستجو در همین سایت بخوانید

ولی برای دانلود فایل اصلی با فرمت ورد حاوی تمامی قسمت ها با منابع کامل

اینجا کلیک کنید

Discrimination threshold
Cutoff Value
Bias

شکل 2. شبکه عصبی پرسپترون چندلایه برای شناسایی تقلب در کارت های بانکی
یافته های پژوهش
از آنجا که مدل های ارائه شده این پژوهش به منظور طبقه بندی طراحی شده اند، باید با معیارهـایخاص طبقه بندی ارزیابی شوند. برای ارزیابی عملکرد مدل شبکه عصبی پرسپترون چندلایه، باید طبقه بندی واقعی تراکنش های کار ت های بانکی را با طبقه بندی انجام شده شبکه عصبی مقایسـهکرد و توانایی مدل را در شناسایی تراکنش های متقلبانه (یا مشکوک به تقلب) آزمـود . معیارهـایمندرج در جدول 1 برای ارزیابی عملکرد سیستم طبقه بندی استفاده شده است (برادرسـن، اُنـگ،استفان و بوهمان، 2010). در روابط جدول 1، TP تعداد مثبت های درست؛ FP تعداد مثبت هـاینادرست؛ TN تعداد منفی های درست و FN تعداد منفیهای نادرست است.
زمانی که تعداد منفیها بسیار بیشتر از تعداد مثبت هاست (مانند پژوهش حاضر)، ممکن است که معیار دقت طبقه بندی، معیار مناسبی برای ارزیابی عملکرد نباشد. بنابراین معیارهـای دیگـریمانند میانگین هـای هندسـی (g-mean)1 (تانـگ، ژانـگ، چـاولا و کـراس، 2002) و همچنـینمعیارهای F و Fβ (پاورز، 2011 و تانگ و همکـاران، 2002) را بـرای ارزیـابی عملکـرد سیسـتمطبقه بندی می توان در نظر گرفت که با اضافه کردن TP بـه معـادلات، محاسـبه مـی شـوند . در محاسبه Fβ، مؤلفه β مقداری بین صفر و بینهایت دارد و برای کنترل وزن تخصـیص داده شـده
ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
1. Geometric Mean
به TP و P استفاده می شود؛ بدین ترتیب که هرچه β بزرگتـر باشـد، بـه همـان نسـبت اهمیـتبیشتری برای TPR (حساسیت) قائل شده ایم تا P (صحت).
جدول 1. معیارهای ارزیابی عملکرد طبقه بندی
نام معیار نام جایگزین توضیح فرمول محاسبه
852297-415123

نسبت درست1 مثبت حساسیتفراخوانی2 3یا طبقه نسبت بندی موارد شده اند.مثبتی است که به درستی +=

+ نس بت م وارد منف ی اس ت ک ه ب هنادرست، مثبت طبقه بندی شده اند. خطای نوع اول نسبت مثبت
نادرست4
=

+ نسبت موارد منفی است که به درستی طبقه بندی شده اند. ویژگی6 نسبت منفی
درست5
=

+ نس بت م وارد مثبت ی اس ت ک ه ب ه نادرست منفی طبقه بندی شده اند. خطای نوع دوم نسبت منفی
نادرست
+
AC =

+++ نسبت نتایج درست (هم مثبت درست و هم منفی درست) به کل جامعه — دقت7 طبقه بندی
P =

+ نسبت تعداد مثبت های درست به کـلنتایج مثبت (هم مثبت هـای درسـت وهم مثبت های نادرست) صحت8
طبقه بندی

√× – – g-mean1 میانگین
هندسی یک

√× – – g-mean2 میانگین
هندسی دو
=

F – –
ــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــــ
True Positive Ratio
Sensitivity
Recall
False Positive Ratio
True Negative Ratio
Specificity
Accuracy
Precision
با توجه به هدف اصلی پژوهش که شناسایی بهتر تراکنش های متقلبانه از میـان تـراکنشهـا
است، چهار معیار g-mean2 ،FNR ،TPR و Fβ از میان معیارهای موجود برای معیارهای اصـلیسنجش عملکرد مدل های شبکه عصبی پرسپترون چندلایه انتخاب شـدند . در ادامـه بـه تحلیـلمعیارهای عملکرد مدل های ایجاد شده پرداخته خواهد شد.
پس از ارزیابی مدل با استفاده از معیارهای اشاره شده در جدول 1، نتایج نشـان دادنـد کـه بـاانتخاب مقدار برش معادل 5/0، شبکه عصبی پرسـپترون بـا دقـت 9/99 درصـد توانسـته اسـتتراکنش ها را به دو دسته سالم و متقلبانه طبقه بندی کند؛ این در حالی است که این شبکه با دقت تقریباً 100 درصد، تراکنش های سالم و با دقت 4/70 درصد، تراکنش های متقلبانه را بـه درسـتیطبقه بندی کرده است. مقادیر مربوط به معیارهای اصـلی 2g-mean و Fβ بـه ترتیـب برابـر 9/83 درصد و 8/70 درصد محاسبه شده است (توضیح اینکه با توجـه بـه هـدف اصـلی پـژوهش کـه عملکرد مناسب مدل در شناسایی تراکنش های متقلبانه است، برای محاسبه Fβ، مقدار β برابر بـا 5 در نظر گرفته شده است). با توجه به نمودار پیش بینی ـ واقعی (شکل 3) میتوان دریافـت کـهبا انتخاب مقدار برش 3/0، می توان با کمترین هزینه در شناسایی تراکنش های سـالم، شناسـاییتراکنش های متقلبانه را بهبود بخشید. در این حالت با دقت 95/99 درصد تراکنش های سالم و با دقت 3/75 درصد تراکنش هـای متقلبانـه شناسـایی شـدند و مقـادیر معیارهـای 2g-mean و Fβ به ترتیب برابر 8/86 درصد و 2/75 درصد به دست آمد.


پاسخ دهید