Autenticazione Continua Durante la Navigazione Web Basata sulla Dinamica del Mouse - Slide

22
Autenticazione Continua Durante la Navigazione Web Basata sulla Dinamica del Mouse Corso di laurea magistrale in Ingegneria Informatica Daniele De Gan DIA - Universit` a degli Studi di Trieste Relatore prof. Alberto Bartoli Correlatori prof. Eric Medvet dott. Andrea De Lorenzo

Transcript of Autenticazione Continua Durante la Navigazione Web Basata sulla Dinamica del Mouse - Slide

Autenticazione Continua Durante la Navigazione WebBasata sulla Dinamica del Mouse

Corso di laurea magistrale in Ingegneria Informatica

Daniele De Gan

DIA - Universita degli Studi di Trieste

Relatoreprof. Alberto Bartoli

Correlatoriprof. Eric Medvet

dott. Andrea De Lorenzo

Autenticazione e dinamica del mouse

Autenticazione nel web

Autenticazione:

Processo di verifica dell’identita per autorizzare l’accesso ai servizi

nel web paradigma Username - Password

Limitazioni:

a punto di accesso

partecipazione attiva utente

furto credenziali

Daniele De Gan (DIA - UniTs) Relazione attivita tesi 2 / 22

Autenticazione e dinamica del mouse

Problema

Si cerca un metodo di autenticazione web:

continuo

non invasivo

Le motivazioni:

ovviare alle possibili limitazioni dei sistemi tradizionali

meccanismo di supporto alle password

richiesta di maggior protezione dei dati sensibili

Daniele De Gan (DIA - UniTs) Relazione attivita tesi 3 / 22

Autenticazione e dinamica del mouse

La dinamica del mouse

Dinamica del mouse:

Successione di eventi

movimenti

click

scroll

. . .

Considerata una biometrica:

caratteristica dell’utente (ipotesi)

inconscia

non necessario hardware aggiuntivo

Daniele De Gan (DIA - UniTs) Relazione attivita tesi 4 / 22

Autenticazione e dinamica del mouse

Obiettivo della tesi

Sistema di autenticazione continua basato sulla dinamica del mouse

autenticare l’utente in base al suo utilizzo del mouse

supporto al meccanismo tradizionale di autenticazione

Fornire:

metodo di analisi

valutazioni del sistema

Daniele De Gan (DIA - UniTs) Relazione attivita tesi 5 / 22

Stato dell’arte

In letteratura

Diversi studi ma:

ambienti fortemente controllati

interazioni utente (serie di operazioni predefinite)

vincoli dispositivi

In commercio:

nessun prodotto che utilizzi esclusivamente la dinamica del mouse

Daniele De Gan (DIA - UniTs) Relazione attivita tesi 6 / 22

Stato dell’arte

Approccio di analisi

L’approccio consolidato in letteratura prevede:

1 raccolta dati

2 feature extraction

Feature:

Proprieta individuale e misurabile di un fenomeno osservatoEsempi → distanza percorsa, velocita media, ...

3 classificazione con strumenti di Machine Learning

Daniele De Gan (DIA - UniTs) Relazione attivita tesi 7 / 22

Raccolta dati

Raccolta dati

Utilizzato uno strumento sviluppato in precedenza:

registra e salva su file tutti gli eventi durante la navigazione

mousetastiera

completamente trasparente all’utente

proxy server + servizio web

Daniele De Gan (DIA - UniTs) Relazione attivita tesi 8 / 22

Raccolta dati

Raccolta dati

1 settimana

5 utenti del laboratorio

modalita

navigazione liberanessun vincolo

Utente Eventi registrati

1 160 9982 260 1583 206 1304 339 5325 244 140

Daniele De Gan (DIA - UniTs) Relazione attivita tesi 9 / 22

Raccolta dati

Eventi

Gli eventi registrati hanno:

codice evento

posizione assoluta → punto piano

timestamp → ordinati

Ottenute 5 sequenze di eventi ordinate per timestamp

Codice Evento X Y Time

. . . . . . . . . . . .64 690 263 137093460597764 734 725 137093460659664 724 656 13709346075844 740 594 13709346081118 740 594 13709346086121 740 594 1370934609072

. . . . . . . . . . . .

Daniele De Gan (DIA - UniTs) Relazione attivita tesi 10 / 22

Analisi dei dati

Sottosequenze

Idea:

Autenticare utenti in base alla dinamica precedente i click

Dalla sequenza di eventi:

Individuati gli eventi “click”

Selezionati N eventi precedenti ad ogni click

Per ogni utente:

Sequenza → Click → Insieme di sottosequenze

Daniele De Gan (DIA - UniTs) Relazione attivita tesi 11 / 22

Analisi dei dati

Le features

Ogni evento:

puo essere considerato un punto su un piano

sequenza di eventi → traiettoria

ha un’informazione temporale

Definite 39 features numeriche

durata

distanza

velocita

accelerazioni

direzioni dei movimenti

. . .

Daniele De Gan (DIA - UniTs) Relazione attivita tesi 12 / 22

Analisi dei dati

Feature extraction

Calcolo delle features, per ogni sottosequenza:

vettore le cui componenti sono i valori delle features

Per ogni utente:

Sequenza → Click → Insieme di sottosequenze → Insieme di vettori difeatures

Utente Numero vettori

1 10872 15123 10024 18395 1110

Daniele De Gan (DIA - UniTs) Relazione attivita tesi 13 / 22

Analisi dei dati

SVM

Support Vector Machines:

apprendimento supervisionato

computer vision, riconoscimento facciale, OCR

classificazione binaria

Ogni SVM e associata ad un utente (legittimo).

Training:

vettori utente legittimo + vettori utenti non legittimi → modello

Daniele De Gan (DIA - UniTs) Relazione attivita tesi 14 / 22

Analisi dei dati

Autenticazione

SVM:

input: vettore

output: legittimo/non legittimo

Strumento sviluppato:

input: insiemi di w vettori consecutivi

output:

maggioranza classe “legittimo” → utente autenticatoaltrimenti → utente non autenticato

Daniele De Gan (DIA - UniTs) Relazione attivita tesi 15 / 22

Valutazione sperimentale

Indici di prestazione

Input legittimo

sistema classifica non legittimo → FALSO POSITIVO

FPR (False Positive Rate)

Input non legittimo

sistema classifica legittimo → FALSO NEGATIVO

FNR (False Negative Rate)

Accuracy

Numero di classificazioni esatte su numero totale di input

Daniele De Gan (DIA - UniTs) Relazione attivita tesi 16 / 22

Valutazione sperimentale

Esperimento #1

Parametri fissati:

N = 10 eventi prima del click

w = 11 larghezza finestra di valutazione

Utente FPR σ FPR FNR σ FNR Accuracy

1 14.28 2.64 29.18 6.52 73.842 10.47 7.32 12.44 3.71 88.023 12.38 6.91 26.81 10.94 76.304 16.29 7.49 26.91 8.00 75.155 10.47 6.46 32.48 10.32 71.98

Media 12.78 6.16 25.56 7.89 77.05

Daniele De Gan (DIA - UniTs) Relazione attivita tesi 17 / 22

Valutazione sperimentale

Esperimento #2

Parametri:

N = 10 eventi prima del click

w ∈ {1, . . . , 60} larghezza finestra variabile

w FPR FNR Accuracy Prima valutazione (min.)

11 12.78 25.56 77.05 9.115 10.50 21.07 81.10 12.525 7.52 15.04 86.46 25.045 4.38 8.53 92.26 37.560 3.06 6.64 94.01 49.1

Daniele De Gan (DIA - UniTs) Relazione attivita tesi 18 / 22

Valutazione sperimentale

Esperimento #2

1 5 9 13 17 21 25 29 33 37 41 45 49 53 57

0.5

0.6

0.7

0.8

0.9

1.0

w

Acc

ura

cy

Daniele De Gan (DIA - UniTs) Relazione attivita tesi 19 / 22

Valutazione sperimentale

Esperimento #3

Mutua informazione features-utente

ordinato features per valore mutua informazione decrescentetraining con 1/4, 2/4 e 3/4 delle features

0 10 20 30 40 50 60

0.5

0.6

0.7

0.8

0.9

w

Acc

ura

cy

1/4 features2/4 features3/4 features4/4 features

Daniele De Gan (DIA - UniTs) Relazione attivita tesi 20 / 22

Valutazione sperimentale

Conclusioni

Obiettivi raggiunti:

sistema di autenticazione continua basata su dinamica del mouse

non invasivo

Sviluppi futuri:

aumento dimensioni dataset e valutazione

anomaly detection

Daniele De Gan (DIA - UniTs) Relazione attivita tesi 21 / 22

Grazie per l’attenzione

Daniele De Gan (DIA - UniTs) Relazione attivita tesi 22 / 22