Het opsporen van anomalieën is een van de moeilijkere en ondergewaardeerde operationele gebieden in de asset-servicing sector van financiële instellingen. In het algemeen is een echte anomalie er een die afwijkt van de norm van het verwachte of het bekende. Anomalieën detecties in finance kunnen het gevolg zijn van onbekwaamheid, kwaadwilligheid, systeemfouten, ongevallen of het product van verschuivingen in de onderliggende structuur van dagelijkse processen. Anomalie detectieVoor de financiële dienstverleningssector is het opsporen van anomalieën van cruciaal belang, omdat zij kunnen wijzen op illegale activiteiten zoals fraude, identiteitsdiefstal, netwerk inbraak, account overname of witwaspraktijken, wat kan resulteren in ongewenste resultaten voor zowel de instelling als het individu. Er zijn verschillende manieren om de uitdaging van anomalie detectie aan te gaan, waaronder supervised en unsupervised learning. Het detecteren van gegevens of anomalieën op basis van historische data patronen en trends kan het operationele team van een financiële instelling verrijken door hun inzicht en paraatheid te vergroten. De uitdaging van het detecteren van anomalieënHet opsporen van anomalieën vormt om verschillende redenen een unieke uitdaging. In de eerste plaats is het volume en de complexiteit van gegevens in de financiële dienstverlening de afgelopen jaren toegenomen. Daarnaast is er een grote nadruk komen te liggen op de kwaliteit van gegevens, waardoor deze zijn veranderd in een manier om de gezondheid van een instelling te meten. Om het nog ingewikkelder te maken, vereist anomalie detectie de voorspelling van iets dat nog niet eerder is gezien of waarop nog niet is voorbereid. De toename van gegevens en het feit dat deze voortdurend veranderen, maakt de uitdaging nog groter. Anomalie Detectie zonder toezichtBij deze methoden wordt gebruik gemaakt van niet gesuperviseerde algoritmen voor machinaal leren. Niet-gesuperviseerde modellen voor machinaal leren, bijvoorbeeld K-Means, worden getraind op ongelabelde datasets. In de ongelabelde dataset hebben de gebeurtenissen of waarnemingen geen “normaal” of “anomalie” label. Hoewel de meeste gebeurtenissen in een typische dataset gewoonlijk normale gebeurtenissen zijn, is het leren of een (ongelabelde) gebeurtenis tot de normale of de anomalie behoort een moeilijk probleem. Eenvoudige clusteringalgoritmen werken goed in laagdimensionele ruimten. Bij machinaal leren vereisen problemen met een hoge dimensie in de ruimte vaak geavanceerde leermethoden zonder toezicht. Detectie van anomalieën onder supervisieBij supervised anomalie detectie wordt gebruik gemaakt van supervised machine learning-algoritmen zoals logistische regressie, KNN, beslisbomen, neurale netwerken. Deze algoritmen worden getraind op gelabelde trainingsgegevens en ingezet om een anomalie (rond bedrijfsprocessen) in de toekomst te voorspellen. Vaak is de uitdaging bij het trainen van deze algoritmen onevenwichtige data set van anomalie detectie problemen. Zoals we weten zijn anomalieën zeldzame gebeurtenissen; datasets voor anomalie detectie hebben vaak een onevenwichtige verdeling met een meerderheid van negatieve voorbeelden. Meer weten? Tuuring.com |
https://tuuring.com/ |