ناهنجاری

سیستم‌های تشخیص ناهنجاری و تقلب؛ مشکلات و راه‌حل‌ها

مشکلات سیستم‌های تشخیص ناهنجاری و تقلب

تشخیص ناهنجاری در واقع یافتن الگوهای مورد نظر (غیرطبیعی، استثناها، ویژگی ها، و غیره) است که از رفتار مورد انتظار در مجموعه داده‌ها منحرف شده‌اند. با توجه به این تعریف، تشخیص ناهنجاری، بسیار شبیه به حذف نویز و تشخیص موارد غیرمعمول است.

سیستم‌های تشخیص ناهنجاری نیز ممکن است دچار مشکلاتی شوند که تشخیص و رفع آنها در تشخیص صحیح موارد و بهبود سیستم بسیار  مهم است.

در این مقاله مواردی از این دست مشکلات و راه حل آنها به صورت مختصر ارائه شده است.

ناهنجاری

 

راه حل‌هایی برای مشکلات سیستم‌های تشخیص ناهنجاری 

منفی/مثبت کاذب بیش از حد:

منفی‌های کاذب می‌توانند مضر باشند، اما از سوی دیگر، سیستمی که بسیاری از موارد مثبت کاذب را به عنوان ناهنجاری شناسایی می‌کند تقریباً هیچ فایده‌ای ندارد. در یک سیستم بلادرنگ، در صورتی که سیستم نویز بیش از حد تولید کند، جایی برای بازبینی مجدد هر گونه ناهنجاری احتمالی وجود ندارد. و در بسیاری از موارد استفاده، مثبت کاذب در تشخیص ناهنجاری می‌تواند اعتماد کاربران را به یک سازمان را از بین ببرد (به عنوان مثال، به این حس بد فکر کنید که بانک شما دائماً وجوه شما را به دلیل تشخیص کلاهبرداری مثبت کاذب مسدود می کند!).

راه‌حل: صرف زمان اولیه برای مهندسی ویژگی‌ها، برای اطمینان از اینکه نکات منفی یا مثبت کاذب زیادی وجود ندارد و ادامه دادن به تکرار، اصلاح و بهبود آن حتی پس از تولید مدل بسیار مهم هستند.

ناهنجاری

داده‌های گمشده یا ناقص:

تنها دلیل مثبت کاذب ، قدرتمند نبودن سیستم نیست. یکی دیگر از موارد می‌تواند فقدان داده‌های واضح باشد، که متأسفانه، یک مشکل دائمی است، زیرا مدل‌های تشخیص ناهنجاری بسیار تشنه‌ی داده هستند.

راه حل: روی جمع آوری و تجزیه و تحلیل خودکار داده‌ها از منابع متعارف (مانند داده‌های تراکنش) و غیر متعارف (مانند رسانه‌های اجتماعی) سرمایه گذاری کنید. زیرا هر چقدر هم که مدل شما خوب باشد، اگر به داده‌های کافی برای پایه گذاری تصویر کامل دسترسی نداشته باشد، عملکرد خوبی نخواهد داشت.

ناهنجاری

عدم چابکی برای مدیریت تغییرات در قواعد:

در دنیای امروز، تغییر تنها ثابت است! انسان در طول زمان تغییر می‌کند، بنابراین ایده رفتار عادی در زمینه تشخیص ناهنجاری همچنان تغییر خواهد کرد. علاوه بر این، سیستم‌ها نیز در طول زمان تغییر می‌کنند، اما تغییر تدریجی همیشه معادل رفتار غیرعادی نیست.

راه‌حل: هر سیستم تشخیص ناهنجاری‌ای که می‌سازید، صرف نظر از اینکه در چه موردی استفاده می‌کنید، باید به اندازه کافی چابک باشد تا با تغییر هنجارها تغییر کند. به طور مشابه، باید برنامه‌ای برای نظارت و بازبینی مستمر سیستم وجود داشته باشد تا اطمینان حاصل شود که در طول زمان همچنان طبق انتظار عمل می‌کند. سیستم‌ها همچنین باید تغییرات فصلی یا الگوهای دیگر را در نظر بگیرند – به عنوان مثال، مشتری در یک بانک معمولاً ممکن است در روزهای تعطیل خریدهای بزرگ‌تر از حد معمول انجام دهد، اما لزوماً نباید آنها را به عنوان ناهنجاری معرفی کرد.

موارد حایز اهمیت در بهره‌گیری از سیستم تشخیص ناهنجاری

در هنگام کار با سیستم تشخیص ناهنجاری چندین ویژگی وجود دارد که باید در نظر گرفت، سه مورد از آنها عبارتند از:

 درک و انتخاب مورد استفاده

اولین گام در تشخیص موفقیت آمیز ناهنجاری این است که واقعاً درک کنید که خط کسب و کار به چه نوع سیستمی نیاز دارد و یک چارچوب برای الزامات و اهداف قبل از شروع تنظیم کنید. اینها بحث‌های اولیه مهمی هستند زیرا همه کارهای کشف ناهنجاری یا تقلب یکسان نیستند. دقیقاً آنچه که به عنوان یک ناهنجاری واجد شرایط می‌شود و فرآیندهای بعدی که توسط تشخیص ناهنجاری آغاز می‌شود به طور گسترده‌ای بر اساس موارد استفاده متفاوت است.

به شکل قابل توجهی، ماهیت داده‌ها، مشکل مورد بررسی، و اهداف پروژه در تکنیک‌های به کار گرفته شده برای تشخیص ناهنجاری تأثیر مستقیم دارند. حتی در صنعت مالی، پروژه‌های مختلف تعاریف متفاوتی از آنچه که یک مورد داده را به یک ناهنجاری تبدیل می کند، خواهند داشت. به عنوان مثال، نوسانات بسیار کوچک در سیستمی که قیمت سهام را ردیابی می‌کند، می‌تواند ناهنجاری در نظر گرفته شود، در حالی که سیستم‌های دیگر مانند محل شارژ کارت می‌توانند دامنه بسیار وسیع‌تری از ورودی‌ها را تحمل کنند. بنابراین به کارگیری یک رویکرد واحد برای تمامی سایر انواع پروژه‌های داده منطقی نیست.

ناهنجاری

برای اطمینان از موفقیت یک پروژه کشف تقلب یا سایر پروژه‌های تشخیص ناهنجاری، گردآوری پروفایل‌های فنی انجام کار (اعم از دانشمندان علوم داده، کمیت‌ها یا آکچوئرها) با طرف تجاری (تیم ریسک، تحلیلگران) بسیار مهم است تا:

  • آنچه را که یک ناهنجاری است، تعریف و به طور مداوم اصلاح کنید. زیرا ناهنجاری ممکن است دائماً تغییر کند، که این به معنای نیاز به ارزیابی مجدد و مداوم است.
  • اهداف و پارامترهای پروژه را به طور کلی تعریف کنید. به عنوان مثال، هدف نهایی احتمالاً فقط شناسایی ناهنجاری‌ها نیست، بلکه چیزی بزرگتر است که بر تجارت تأثیر می‌گذارد، مانند مسدود کردن هزینه‌های جعلی. داشتن اهداف بزرگتر به شما این امکان را می‌دهد که محدوده پروژه و خروجی مورد انتظار را بهتر تعریف کنید.
  • به محض اینکه یک ناهنجاری شناسایی شد، مشخص کنید که سیستم در مرحله بعدی چه کاری انجام خواهد داد. به عنوان مثال، ناهنجاری‌ها برای تجزیه و تحلیل و بررسی بیشتر به تیم دیگری ارسال می‌شوند.
  • برنامه‌ای برای نظارت و ارزیابی موفقیت سیستم در آینده ایجاد کنید.
  • شناسایی کنید که کدام فرکانس تشخیص ناهنجاری (بلادرنگ[1] در مقابل دسته ای[2]) برای مورد استفاده حاضر مناسب است.

 دریافت داده‌ها

داشتن هر چه بیشتر اطلاعات، امکان مدلسازی دقیق‌تر برای تشخیص ناهنجاری را می‌دهد ، زیرا هرگز نمی‌دانیم کدام ویژگی‌ها ممکن است نشان‌دهنده یک ناهنجاری باشند. استفاده از انواع و منابع داده‌های متعدد چیزی است که به بانک‌ها اجازه می‌دهد تا فراتر از ناهنجاری‌های نقطه‌ای حرکت کنند و ناهنجاری‌های بافتی یا جمعی پیچیده‌تر را شناسایی کنند. به عبارت دیگر، تنوع، یک عامل کلیدی است.

به عنوان مثال، این امکان وجود دارد که داده‌های تراکنش در نگاه اول غیرعادی نباشند زیرا کلاهبردار در محدوده “عادی” عادات کاربر واقعی باقی مانده است. اما داده‌های استفاده از ATM یا وبلاگ‌های حساب ممکن است ناهنجاری‌هایی را نشان دهد که به کشف تقلب کمک می‌کنند.

کاوش، پاکسازی و غنی سازی داده‌ها

هنگام انجام تشخیص ناهنجاری، این مرحله حتی از حد معمول مهمتر است، زیرا اغلب داده‌ها حاوی نویز هستند (معمولاً خطاها، چه انسانی یا غیر انسانی) که شبیه به ناهنجاری‌های واقعی است. از این رو، تمایز بین این دو و حذف هر گونه داده مشکل‌ساز که می‌تواند مثبت کاذب باشد، بسیار مهم است.

در یک دنیای ایده آل، مقدار کافی از داده‌های برچسب‌گذاری شده وجود دارد که کار از آن‌ها شروع می شود. یعنی تحلیلگران یا دانشمندان داده می‌توانند مجموعه داده‌های بانک را با اطلاعاتی در مورد اینکه کدام رکوردها ناهنجاری‌ها را نشان می‌دهند و کدام‌ها طبیعی هستند، غنی کنند. ترجیح برای ساختن یک سیستم تشخیص ناهنجاری شروع با داده‌هایی است که به‌عنوان غیرعادی یا عادی شناخته می‌شوند، زیرا ساده‌ترین مسیر است که امکان استفاده از روش‌های نظارت شده با طبقه‌بندی را فراهم می‌کند (بر خلاف روش‌های تشخیص ناهنجاری بدون نظارت).

گمانیک” ابزار هوشمند تشخیص ناهنجاری و تقلب در داده‌های بانکی

گمانیک سامانه پایش تراکنش‌های مشتری و تشخیص موارد غیرعادی در آنهاست. این سامانه با دارا بودن قابلیت تشخیص هوشمند ناهنجاری در تراکنش‌ها و محاسبه ریسک موجودیت‌های بانکی ابزاری برای کمک به تصمیم‌گیری بانک در خصوص مشتریان خود است. موارد مشکوکی که گمانیک ارزیابی و به بانک اعلام می کند شامل موارد زیر هستند:

  • تشخیص تغییر غیرعـادی در تراکنش‌های مشتری و اعلام آن به بانک
  • اعلام مواردی چون پایانه‌ها و پذیرنده‌ها و کارت‌های با تراکنش‌های مشکوک به بانک
  • امکان مقایسه رفتار یک مشتری با رفتار مشتریان مشابه و رفتار گذشته خود مشتری
  • امکان تغییر میزان حساسیت در بررسی تراکنش‌ها

چشم‌انداز پیش‌رو

از آنجایی که موارد استفاده تشخیص ناهنجاری روز به روز بیشتر و بیشتر می‌شوند، انتظار می‌رود که با افزایش مقیاس سازمان‌ها و بهبود سطح اعتماد به سیستم‌های مبتنی بر هوش مصنوعی، راه‌اندازی فرآیندهای تشخیص ناهنجاری نیز ساده‌تر شوند. بنابراین  سازمان‌های بیشتری روی معماری مناسب سرمایه‌گذاری می‌کنند تا داده‌های حیاتی برای کار تشخیص ناهنجاری و ابزارهایی برای پردازش سریع آن‌ها به دست آورند.

این بدان معنا نیست که اعتماد ذاتی است، یا اینکه وقتی ذینفعان به یک مدل اعتماد کنند، بقیه نیز طبعاً از آن پیروی خواهند کرد بلکه شفافیت و تجسم روشن همیشه برای اطمینان از پذیرش و ادغام، حیاتی خواهد بود. اما، به ظاهر امکان‌ناپذیری پیش‌بینی و در نتیجه جلوگیری از هزینه‌های فاجعه‌بار تقلب (علاوه بر صرفه‌جویی در زمان و منابع سازمانی) در افق دید قرار دارد.

با این حال، تشخیص ناهنجاری تنها فرصت برای هوش مصنوعی در بانکداری نیست. چالش‌های متعددی پیش روی بانک ها وجود دارد که تشخیص ناهنجاری‌ها به تنهایی برای حل آنها ضعیف است.

[1] Real-time

[2] Batch

 


 

ترجمه و تلخیص: فروغ مروج صالحی

منبع: Fraud and Anomaly Detection in Banking, A Step-by-Step Guide to Incorporating

میانگین آرا: 0 / 5. شمارش رای‌ها: 0

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.