سیستم کشف تقلب به زبان ساده

سیستم کشف تقلب و یادگیری ماشینی:

در دنیای علم داده، متدولوژی و الگوریتم‌های زیادی وجود دارند که به طور دقیق، حجم زیادی از داده­‌های کاربر را به کار می‌­گیرند. کارشناسان یادگیری ماشین آنها را بسته به مجموعه داده های موجود به دو سناریو اصلی تقسیم می کنند:

سناریو ۱: مجموعه‌ی داده، دارای تعداد کافی نمونه تقلب است.

در این مورد، یادگیری ماشین کلاسیک یا تکنیک‌های مبتنی بر آمار برای شناسایی حملات متقلبانه به کار می‌رود. این شامل آموزش یک مدل یادگیری ماشین یا به کارگیری الگوریتم‌های کافی برای تخمین قانونی بودن تراکنش است. ما در اینجا متداول‌ترین الگوریتم‌های مورد استفاده را مرور می‌کنیم.

سناریوی 2: مجموعه داده نمونه تقلبی ندارد یا فقط تعداد بسیار کمی از آن‌ها وجود دارد.

در صورتی که هیچ یک از اطلاعات قبلی در مورد تراکنش‌های جعلی ذخیره نشده باشد، مدل یادگیری بر اساس نمونه‌هایی از معاملات قانونی ساخته شده است.

سیستم

مدل‌های یادگیری ماشینی در سیستم‌های کشف تقلب:

قبل از مرور مدل‌های یادگیری رایج دیگر که برای کشف تقلب استفاده می‌شوند، باید گفت که اکثریت آنها اهداف مشابهی دارند و تنها در ویژگی‌های ریاضی با یکدیگر متفاوت هستند. از این رو، داده‌های موجود در انتخاب مدل‌های یادگیری مناسب به جای خود الگوریتم، عاملی تعیین‌کننده در نظر گرفته می‌شوند. برخی از این مدل­‌ها عبارتند از:

جنگل های تصادفی یا جنگل­های تصمیم گیری تصادفی: این الگوریتم شاخه‌های تصمیم‌­گیری را ترکیب می‌کند و داده‌های از دست رفته، نویز، نقاط پرت و خطاها را به‌طور دقیق تجزیه و تحلیل می‌کند. این الگوریم در دسته­‌بندی سریع است و در نتیجه در میان متخصصان تشخیص تقلب به یکی از ارجحیت‌ها تبدیل شده است.

سیستم

شبکه های عصبی مصنوعی (ANN): این سیستم عملکرد مغز را برای انجام وظایف با یادگیری از گذشته، استخراج قوانین و پیش بینی فعالیت‌های آینده بر اساس شرایط فعلی شبیه سازی می‌کند. این سیستم می‌تواند می تواند با طبقه بندی یک ورودی در گروه های از پیش تعریف شده، تقلبی بودن یا نبودن تراکنش را پیش بینی کند.

سیستم

ماشین‌های حامل پشتیبان (SVM): این سیستم یک ابزار پیش‌بینی است که می‌تواند طیف گسترده‌ای از مشکلات یادگیری مانند تشخیص رقم دست‌نویس، طبقه‌بندی صفحات وب و تشخیص چهره را حل کند. این روش قادر به شناسایی فعالیت‌های متقلبانه در زمان معامله است.

سیستم

K- نزدیکترین همسایگان (KNN): به دلیل سادگی، به الگوریتم «یادگیری تنبل» نیز معروف است. این سیستم به جای انجام محاسبات پس از معرفی داده­‌ها، فقط آن­ها را برای طبقه بندی بیشتر ذخیره می‌کند. الگوریتم KNN بر شباهت ویژگی و نزدیکی داده‌ها استوار است. هنگامی که نزدیکترین همسایه داده‌ای مشکوک باشد، معامله به عنوان متقلبانه و زمانی که نزدیکترین داده‌ی همسایه قانونی باشد، معامله در دسته قانونی قرار می‌گیرد.

برگشت منطقی: یک الگوریتم پیش بینی است که توسط یادگیری ماشینی از دانش‌ آمار وام گرفته شده است. این الگوریتم به طور گسترده‌ای برای تشخیص تقلب کارت اعتباری و امتیازدهی اعتبار استفاده می‌شود.

سیستم

در نهایت، هدف هوش مصنوعی در زمینه کشف تقلب و جلوگیری از کلاهبرداری این است که به جای غربال کردن هزاران داده  به روشی طاقت فرسا و وقت گیر ، کار عوامل انسانی را در یافتن و بررسی ادعاها و معاملات متقلبانه آسان­‌تر کند.

بسیاری از ارائه دهندگان خدمات مالی و سازمان‌های بیمه به دلیل درگیری با مسئله تقلب و هزینه‌های عوامل انسانی مبارزه با آن دچار محدودیت می‌شوند. سود پیش‌بینی‌شده از پیاده‌سازی فناوری‌های یادگیری ماشینی در راستای کشف ناهنجاری و تقلب، بدون شک به هر سازمانی امکان رشد و توسعه می‌دهد.

بسیاری از شرکت‌های تجاری در حال حاضر از راه‌حل‌های خودکار شناسایی تقلب در سیستم­‌های خود برای جلوگیری از رفتارهای مشکوک مانند داده‌های نادرست، تصاحب حساب، کلاهبرداری در پرداخت و  فیشینگ استفاده می‌کنند.

استفاده از فناوری پیشرفته باعث افزایش اعتبار سازمان‌­های مالی و بیمه‌گر می‌شود و در نتیجه این سازمان‌­ها می‌توانند روابط بهتری بر پایه اعتماد و وفاداری با مشتریان خود برقرار کنند.

 


ترجمه و تلخیص: ارژنگ طالبی‌نژاد

منبع: Detecting Insurance Fraud with Machine Learning

میانگین آرا: 0 / 5. شمارش رای‌ها: 0

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد.