Evitando el fraude a través de la presentación de la información en grafos

Preview:

Citation preview

Evitando el fraude a través de la REpresentación de la información en grafos

Dr. Jesús Barrasa Univ. Deusto, 27 Oct 2015

Aclaración: esto no son grafos.

Qué es un grafo?

Vértice

Arco

Análisis de la “popularidad” de los diferentes tipos de bases de datos (db-engines.com)

El origen: Teoría de grafos

Con ustedes… Leonhard Euler

• Matemático suizo • Inventor de la teoría

de grafos (1736)

Königsberg (Prusia) - 1736

A

B

D

C

A

B

D

C

1

23

4

7

65

El modelo ‘Labeled Property Graph’

Redes sociales

Análisis de impacto en redes de telecomunicaciones

Sistemas de recomendación

Logística

Detección y prevención de fraude

Qué ha pasado hasta ahora? Límites del enfoque relacional• Introduce complejidad al modelizar

relaciones • Degradación del rendimiento al

aumentar el numero de asociaciones, y con el volumen de datos

• Complejidad de las consultas crece necesidad de JOINs

• Introducir nuevos tipos de datos y asociaciones requieres rediseño del esquema, migración, coste

… hacen a las RDB inadecuadas cuando las asociaciones entre puntos de datos son valiosas en tiempo real

Desarrollo lento Rendimiento pobre

Problemas escalabilidadCoste de mantenimiento

NoSQL al rescate, pero que pasa con las asociaciones?• No ofrecen estructuras de datos

para modelizar o almacenar relaciones

• Los lenguajes de consultas no incluyen elementos para consultarlas

• La logica de association de datos vive en la capa de aplicación

• No transaccionales (ACID)

… hacen a estas tres categorías NoSQL inadecuadas cuando las asociaciones entre puntos de datos son valiosas en tiempo real

El cruce de caminos

El modelo conceptual es el modelo físico

Fraude: First-Party

• Objetivo de los defraudadores? Solicitar lineas de credito, actuar de forma aparentemente normal, extender el credito… y desaparecer!

• Creación de identidades sintéticas

• Caso poco mediatizado, ya que solo los bancos se ven afectados. • En el caso de 3rd party se da una suplantación de personalidad y el

afectado es una tercera persona.

Tamaño del problema

• Decenas de miles de millones de $ son defraudados al año solo a bancos estadounidenses

• 25% del total de créditos personales amortizados como perdidas

Anillo de fraude

Hasta donde llega el análisis discreto?

…la reacción no es sencilla

• Cuando el fraude es detectado, qué se debe cancelar? • Cómo hacerlo mas rápido que los defraudadores para minimizar

pérdidas? Es posible prevenirlo?

• Modelizando los datos como grafos

La gente comparte piso… y es normal

La gente comparte piso… y es normal

MATCH (p1:AccountHolder)-[:HAS_ADDRESS]->(a)<- [:HAS_ADDRESS]-(p2:AccountHolder) WHERE p1 <> p2 RETURN p1,p2,a

Cadena sospechosa

Cadena sospechosa

MATCH p = (a1:AccountHolder)-[r1:HAS_ADDRESS|:HAS_PHONENUMBER*8]-(a2:AccountHolder) WHERE a1 <> a2 return p

Bloqueo de tarjetas

MATCH p = (a1:AccountHolder)-[r1:HAS_ADDRESS|:HAS_PHONENUMBER*8]-(a2:AccountHolder) WHERE a1 <> a2 WITH nodes(p) as fraudsterList limit 1 UNWIND fraudsterList AS fraudster MATCH fraudster-[:HAS_CREDITCARD]->(cc) return fraudster.fullName, fraudster.UniqueId, cc.accountNumber

Neo Technology Overview

Product • Neo4j - World’s leading graph database

• 1M+ downloads, adding 50k+ per month

• 14 years of R&D

Company • Neo Technology, Inc., founded 2007

• 110 employees with HQ in Silicon Valley; offices in London, Munich, Paris and Malmö

• 160+ enterprise subscription customers including 60+ G2k companies

• 20,000+ education registrants

• 18,000+ Meetup members

• 100+ technology and service partners

• $45M in funding from Fidelity, Sunstone, Conor, Creandum, Dawn Capital

Customers & Partners • Retail: Walmart, Target, Adidas, eBay

• Telco: Telenor, Tre, AT&T, Deutsche Telecom

• Financial Services: UBS, JP Morgan, RBC, ICE

• Partners: Accenture, McKinsey, BCG

May 14 2015