مشکلات سیستمهای تشخیص ناهنجاری و تقلب
تشخیص ناهنجاری در واقع یافتن الگوهای مورد نظر (غیرطبیعی، استثناها، ویژگی ها، و غیره) است که از رفتار مورد انتظار در مجموعه دادهها منحرف شدهاند. با توجه به این تعریف، تشخیص ناهنجاری، بسیار شبیه به حذف نویز و تشخیص موارد غیرمعمول است.
سیستمهای تشخیص ناهنجاری نیز ممکن است دچار مشکلاتی شوند که تشخیص و رفع آنها در تشخیص صحیح موارد و بهبود سیستم بسیار مهم است.
در این مقاله مواردی از این دست مشکلات و راه حل آنها به صورت مختصر ارائه شده است.
راه حلهایی برای مشکلات سیستمهای تشخیص ناهنجاری
منفی/مثبت کاذب بیش از حد:
منفیهای کاذب میتوانند مضر باشند، اما از سوی دیگر، سیستمی که بسیاری از موارد مثبت کاذب را به عنوان ناهنجاری شناسایی میکند تقریباً هیچ فایدهای ندارد. در یک سیستم بلادرنگ، در صورتی که سیستم نویز بیش از حد تولید کند، جایی برای بازبینی مجدد هر گونه ناهنجاری احتمالی وجود ندارد. و در بسیاری از موارد استفاده، مثبت کاذب در تشخیص ناهنجاری میتواند اعتماد کاربران را به یک سازمان را از بین ببرد (به عنوان مثال، به این حس بد فکر کنید که بانک شما دائماً وجوه شما را به دلیل تشخیص کلاهبرداری مثبت کاذب مسدود می کند!).
راهحل: صرف زمان اولیه برای مهندسی ویژگیها، برای اطمینان از اینکه نکات منفی یا مثبت کاذب زیادی وجود ندارد و ادامه دادن به تکرار، اصلاح و بهبود آن حتی پس از تولید مدل بسیار مهم هستند.
دادههای گمشده یا ناقص:
تنها دلیل مثبت کاذب ، قدرتمند نبودن سیستم نیست. یکی دیگر از موارد میتواند فقدان دادههای واضح باشد، که متأسفانه، یک مشکل دائمی است، زیرا مدلهای تشخیص ناهنجاری بسیار تشنهی داده هستند.
راه حل: روی جمع آوری و تجزیه و تحلیل خودکار دادهها از منابع متعارف (مانند دادههای تراکنش) و غیر متعارف (مانند رسانههای اجتماعی) سرمایه گذاری کنید. زیرا هر چقدر هم که مدل شما خوب باشد، اگر به دادههای کافی برای پایه گذاری تصویر کامل دسترسی نداشته باشد، عملکرد خوبی نخواهد داشت.
عدم چابکی برای مدیریت تغییرات در قواعد:
در دنیای امروز، تغییر تنها ثابت است! انسان در طول زمان تغییر میکند، بنابراین ایده رفتار عادی در زمینه تشخیص ناهنجاری همچنان تغییر خواهد کرد. علاوه بر این، سیستمها نیز در طول زمان تغییر میکنند، اما تغییر تدریجی همیشه معادل رفتار غیرعادی نیست.
راهحل: هر سیستم تشخیص ناهنجاریای که میسازید، صرف نظر از اینکه در چه موردی استفاده میکنید، باید به اندازه کافی چابک باشد تا با تغییر هنجارها تغییر کند. به طور مشابه، باید برنامهای برای نظارت و بازبینی مستمر سیستم وجود داشته باشد تا اطمینان حاصل شود که در طول زمان همچنان طبق انتظار عمل میکند. سیستمها همچنین باید تغییرات فصلی یا الگوهای دیگر را در نظر بگیرند – به عنوان مثال، مشتری در یک بانک معمولاً ممکن است در روزهای تعطیل خریدهای بزرگتر از حد معمول انجام دهد، اما لزوماً نباید آنها را به عنوان ناهنجاری معرفی کرد.
موارد حایز اهمیت در بهرهگیری از سیستم تشخیص ناهنجاری
در هنگام کار با سیستم تشخیص ناهنجاری چندین ویژگی وجود دارد که باید در نظر گرفت، سه مورد از آنها عبارتند از:
درک و انتخاب مورد استفاده
اولین گام در تشخیص موفقیت آمیز ناهنجاری این است که واقعاً درک کنید که خط کسب و کار به چه نوع سیستمی نیاز دارد و یک چارچوب برای الزامات و اهداف قبل از شروع تنظیم کنید. اینها بحثهای اولیه مهمی هستند زیرا همه کارهای کشف ناهنجاری یا تقلب یکسان نیستند. دقیقاً آنچه که به عنوان یک ناهنجاری واجد شرایط میشود و فرآیندهای بعدی که توسط تشخیص ناهنجاری آغاز میشود به طور گستردهای بر اساس موارد استفاده متفاوت است.
به شکل قابل توجهی، ماهیت دادهها، مشکل مورد بررسی، و اهداف پروژه در تکنیکهای به کار گرفته شده برای تشخیص ناهنجاری تأثیر مستقیم دارند. حتی در صنعت مالی، پروژههای مختلف تعاریف متفاوتی از آنچه که یک مورد داده را به یک ناهنجاری تبدیل می کند، خواهند داشت. به عنوان مثال، نوسانات بسیار کوچک در سیستمی که قیمت سهام را ردیابی میکند، میتواند ناهنجاری در نظر گرفته شود، در حالی که سیستمهای دیگر مانند محل شارژ کارت میتوانند دامنه بسیار وسیعتری از ورودیها را تحمل کنند. بنابراین به کارگیری یک رویکرد واحد برای تمامی سایر انواع پروژههای داده منطقی نیست.
برای اطمینان از موفقیت یک پروژه کشف تقلب یا سایر پروژههای تشخیص ناهنجاری، گردآوری پروفایلهای فنی انجام کار (اعم از دانشمندان علوم داده، کمیتها یا آکچوئرها) با طرف تجاری (تیم ریسک، تحلیلگران) بسیار مهم است تا:
- آنچه را که یک ناهنجاری است، تعریف و به طور مداوم اصلاح کنید. زیرا ناهنجاری ممکن است دائماً تغییر کند، که این به معنای نیاز به ارزیابی مجدد و مداوم است.
- اهداف و پارامترهای پروژه را به طور کلی تعریف کنید. به عنوان مثال، هدف نهایی احتمالاً فقط شناسایی ناهنجاریها نیست، بلکه چیزی بزرگتر است که بر تجارت تأثیر میگذارد، مانند مسدود کردن هزینههای جعلی. داشتن اهداف بزرگتر به شما این امکان را میدهد که محدوده پروژه و خروجی مورد انتظار را بهتر تعریف کنید.
- به محض اینکه یک ناهنجاری شناسایی شد، مشخص کنید که سیستم در مرحله بعدی چه کاری انجام خواهد داد. به عنوان مثال، ناهنجاریها برای تجزیه و تحلیل و بررسی بیشتر به تیم دیگری ارسال میشوند.
- برنامهای برای نظارت و ارزیابی موفقیت سیستم در آینده ایجاد کنید.
- شناسایی کنید که کدام فرکانس تشخیص ناهنجاری (بلادرنگ[1] در مقابل دسته ای[2]) برای مورد استفاده حاضر مناسب است.
دریافت دادهها
داشتن هر چه بیشتر اطلاعات، امکان مدلسازی دقیقتر برای تشخیص ناهنجاری را میدهد ، زیرا هرگز نمیدانیم کدام ویژگیها ممکن است نشاندهنده یک ناهنجاری باشند. استفاده از انواع و منابع دادههای متعدد چیزی است که به بانکها اجازه میدهد تا فراتر از ناهنجاریهای نقطهای حرکت کنند و ناهنجاریهای بافتی یا جمعی پیچیدهتر را شناسایی کنند. به عبارت دیگر، تنوع، یک عامل کلیدی است.
به عنوان مثال، این امکان وجود دارد که دادههای تراکنش در نگاه اول غیرعادی نباشند زیرا کلاهبردار در محدوده “عادی” عادات کاربر واقعی باقی مانده است. اما دادههای استفاده از ATM یا وبلاگهای حساب ممکن است ناهنجاریهایی را نشان دهد که به کشف تقلب کمک میکنند.
کاوش، پاکسازی و غنی سازی دادهها
هنگام انجام تشخیص ناهنجاری، این مرحله حتی از حد معمول مهمتر است، زیرا اغلب دادهها حاوی نویز هستند (معمولاً خطاها، چه انسانی یا غیر انسانی) که شبیه به ناهنجاریهای واقعی است. از این رو، تمایز بین این دو و حذف هر گونه داده مشکلساز که میتواند مثبت کاذب باشد، بسیار مهم است.
در یک دنیای ایده آل، مقدار کافی از دادههای برچسبگذاری شده وجود دارد که کار از آنها شروع می شود. یعنی تحلیلگران یا دانشمندان داده میتوانند مجموعه دادههای بانک را با اطلاعاتی در مورد اینکه کدام رکوردها ناهنجاریها را نشان میدهند و کدامها طبیعی هستند، غنی کنند. ترجیح برای ساختن یک سیستم تشخیص ناهنجاری شروع با دادههایی است که بهعنوان غیرعادی یا عادی شناخته میشوند، زیرا سادهترین مسیر است که امکان استفاده از روشهای نظارت شده با طبقهبندی را فراهم میکند (بر خلاف روشهای تشخیص ناهنجاری بدون نظارت).
“گمانیک” ابزار هوشمند تشخیص ناهنجاری و تقلب در دادههای بانکی
گمانیک سامانه پایش تراکنشهای مشتری و تشخیص موارد غیرعادی در آنهاست. این سامانه با دارا بودن قابلیت تشخیص هوشمند ناهنجاری در تراکنشها و محاسبه ریسک موجودیتهای بانکی ابزاری برای کمک به تصمیمگیری بانک در خصوص مشتریان خود است. موارد مشکوکی که گمانیک ارزیابی و به بانک اعلام می کند شامل موارد زیر هستند:
- تشخیص تغییر غیرعـادی در تراکنشهای مشتری و اعلام آن به بانک
- اعلام مواردی چون پایانهها و پذیرندهها و کارتهای با تراکنشهای مشکوک به بانک
- امکان مقایسه رفتار یک مشتری با رفتار مشتریان مشابه و رفتار گذشته خود مشتری
- امکان تغییر میزان حساسیت در بررسی تراکنشها
چشمانداز پیشرو
از آنجایی که موارد استفاده تشخیص ناهنجاری روز به روز بیشتر و بیشتر میشوند، انتظار میرود که با افزایش مقیاس سازمانها و بهبود سطح اعتماد به سیستمهای مبتنی بر هوش مصنوعی، راهاندازی فرآیندهای تشخیص ناهنجاری نیز سادهتر شوند. بنابراین سازمانهای بیشتری روی معماری مناسب سرمایهگذاری میکنند تا دادههای حیاتی برای کار تشخیص ناهنجاری و ابزارهایی برای پردازش سریع آنها به دست آورند.
این بدان معنا نیست که اعتماد ذاتی است، یا اینکه وقتی ذینفعان به یک مدل اعتماد کنند، بقیه نیز طبعاً از آن پیروی خواهند کرد بلکه شفافیت و تجسم روشن همیشه برای اطمینان از پذیرش و ادغام، حیاتی خواهد بود. اما، به ظاهر امکانناپذیری پیشبینی و در نتیجه جلوگیری از هزینههای فاجعهبار تقلب (علاوه بر صرفهجویی در زمان و منابع سازمانی) در افق دید قرار دارد.
با این حال، تشخیص ناهنجاری تنها فرصت برای هوش مصنوعی در بانکداری نیست. چالشهای متعددی پیش روی بانک ها وجود دارد که تشخیص ناهنجاریها به تنهایی برای حل آنها ضعیف است.
[1] Real-time
[2] Batch
تدوین متن: ارژنگ طالبینژاد
منبع: Fraud and Anomaly Detection in Banking, A Step-by-Step Guide to Incorporating
میانگین آرا: 0 / 5. شمارش رایها: 0