Riconoscimento facciale AI per KYC

Introduzione: perché Face-KYC e dove sono i suoi limiti

Il controllo di identità è un requisito di base per i servizi finanziari e iGaming. Face-KYC (riconoscimento facciale in collegamento con i documenti) accelera il flusso di lavoro, riduce il frodo e rende riproducibili i controlli. Ma si tratta di dati biometrici personali, quindi l'architettura deve essere privacy-first: minimizzazione, consenso esplicito, crittografia, conservazione limitata e spiegazioni trasparenti. L'obiettivo tecnico è quello di dimostrare che davanti alla telecamera c'è una persona viva, non una maschera/video, e che corrisponde alla foto del documento.

1) Dati e raccolta: cosa è veramente necessario

Videocamere selfie (una breve clip o una serie di fotogrammi) per il livness e l'embedding facciale.

Foto/scansioni del documento (passaporto/ID/acque. ID) + zone MRZ/QR/chip.

Metadati: tipo di dispositivo, illuminazione, fuoco, esposizione, geometria facciale.

Logi di consenso: consenso esplicito alla biometria, regole di conservazione/rimozione, obiettivi di lavorazione.

I principi sono: riduzione del PI, crittografia del cavo e del disco, separazione delle chiavi e dei dati, TTL/retensh, accesso ai diritti minimi (RBAC/ABAC).

2) Rilevamento Lives (PAD): come distinguere un viso vivo da un falso

Lo scopo del PAD (presentation attack detection) è quello di dimostrare che davanti alla telecamera c'è un soggetto vivente, non una foto, un video sullo schermo, una maschera, un layout 3D o un dipfake.

Metodi:

Passivi (silent) - Analisi di microduttivi, parallax, riflessi/riflessi, texture/moire, descrizioni depth da una fotocamera, anomalie fotometriche.
Attivi (prompted) - Segui il punto dello sguardo, clicca/sorridi, gira la testa, gira il conto a voce alta (se possibile, senza iobiometrica in giurisdizioni rigide).
Multi-sensore (opzionale): TrueDepth/IR/ToF, luce strutturata, stereo.
Anti-rendering: protezione contro lo scorrimento delle reazioni precompilate (randomizzazione delle istruzioni/timing).

I segnali di attacco sono foto di carta, schermo smartphone/tablet (moire, brillantini), maschere (albedo/artefatti di bordo), impronte dipfive (inconsistency negli occhi/denti/limiti).

Esci: scansione della piovana + causa (bandiere XAI), le soglie vengono regolate in base alla giurisdizione e al rischio.

3) Mappatura «documento selfie»: precisione senza fuoriuscite

1. OCR/MRZ/chip - Estrarre foto e campi del documento; convalidare gli importi di controllo, data/paese/tipo.

2. Faccia detection & intimment - Trova il viso nei selfie e nel documento, normalizza la posa/illuminazione.

3. Face embeddings: embedding compressi/trasformati con apprendimento su dataset di grandi dimensioni, ma con fine-tune su fotogrammi di dominio (mobile, cattiva luce).

4. Confronto: intimità tosigna/Euclidean + soglie adattive (qualità fotogramma, posa, spostamento di età).

5. Dock-Checkout: convalida l'integrità del documento (ologrammi/GPU-pattern/microprotezione per i flussi high-risk), ricerca dei segni di contraffazione.

Risultato: match-score plausibile con intervalli di fiducia e finestre di qualità spiegabili.

4) Orchestratore di decisioni: «Malore/giallo/rosso».

Verde: Altissima Livese e Match, il documento è convalidato con l'apro auto, creazione di un account/aumento dei limiti.

Giallo: rischio moderato (luce bassa, faccia parzialmente nascosta, match controverso) prima-convalida morbida: ripetizione con suggerimenti, sostituzione del dispositivo/illuminazione, richiesta del secondo documento.

Rosso: chiaro PAD/documento falso/non corrispondenza, controllo manuale (HITL), rilevamento dell'incidente.

Tutte le soluzioni sono scritte in audittrail con versioni dei modelli, soglie e spiegazioni XAI.

5) Metriche di qualità: cosa misurare e mostrare

Liveness: APZER/BPZER (errori di accettazione/rifiuto degli attacchi), ACER, EER; separatamente per diversi tipi di attacchi (print/replay/mask/deepfake).

Face match: FAR/FRR, curve ROC/DATA, TPR@FAR=10⁻⁴... 10⁻⁶ per i flussi high-risk.

Qualità dei fotogrammi: percentuale di ricariche, distribuzione di pozioni/illuminazione/occlusioni.

Equità (fairness) - Suddivisione degli errori per sesso/età/tipo di pelle/dispositivi e illuminazione (balanced error rates).

Operativi: tempo medio di onboarding, quota di abbreviazione auto, quota HITL, riprovazioni, NPS/KYC-CSAT.

6) Equità e accessibilità: non solo precisione

Bias audits: rapporti regolari per segmenti e scenari di ripresa la somministrazione di gruppi sottorappresentati durante l'apprendimento/validazione.

A11y-UX: suggerimenti, gesti, sottotitoli, istruzioni vocali, modalità silenziosa, supporto per dispositivi deboli e luce bassa.

Edge-friendly - Prelevamento on-device (pendenza fotogrammi, dettaglio di qualità) con il caricamento solo delle porzioni necessarie.

7) Privacy by Design e conformità

Minimizzazione e purpose limitation: utilizzare la biometria solo per KYC e solo quanto necessario; storage separato della biometria e dei dati di query.

Tempo di conservazione: TTL breve selfie/video; a lungo termine - solo hash-embedding/login della soluzione, se consentito.

Diritti del soggetto dei dati: accesso/rimozione/contestazione della decisione; canali di query comprensibili.

Tracking dei modelli/versioni: lineage completo, riproduzione dello script di convalida.

Giurisdizioni: bordi di lavorazione (regioni locali), flag fich con modalità di regolazione diverse.

8) Integrazione antifrode: dove la Faccia-KYC ha il maggior effetto

Multi-accunting: grafico dei collegamenti per dispositivi/pagamenti + Face-dedup in ambedding (con limiti rigidi e basi legali).

Account Takeover: ri-rapido Face-re-verify quando cambia dispositivo/geo/metodo di pagamento.

Chargeback/bonus abuse: allinea i livelli KYC ai limiti e ai pagamenti automatici; I verdi sono un istante-kashout.

9) Attacchi e difesa: cosa rischia e come difendersi

Replay e attacchi print: moire/speculatori/flatness suggerimenti attivi.

Maschere/layout 3D: analisi di albedo/bordi/speculatori; profondità/IR se disponibile.

Diepface: oggetto di incostituzionalità (blink/gaze/teeth/skin), artefatti di generazione, audio-lip-sink (se usato dal suono).

Injection-attacchi video - SDK affidabili, convalida dell'ambiente, firma dei pacchetti, protezione contro il cambio fotocamera (device bining).

Attacchi al modello: monitoraggio del drift, controlli adversariali-robustness, campionamenti «canarini».

10) MLOs/QA: disciplina di produzione

Versioning dataset/fich/modelli/soglie; schemi di dati ben precisi.

Calibrazione continua sotto dispositivi/luci/regioni, smaltimento ombra, rollback.

Affidabilità del client: buffer offline, retrai con una rete debole, dettagli dei fotogrammi «piegati».

Disordine video/luce/omissioni di fotogrammi: il sistema deve degradarsi in modo morbido, non abbassarsi.

Cassette di sabbia per il controllo: repliche di verifiche con logi XAI, stand per il regolatore.

11) UX «senza dolore»: come ridurre i guasti

Qualità interattiva del traffico-luce (luce/distanza/cornice facciale).

Suggerimenti prima della ripresa e controllo attivo iperattivo (≤5 - 7 secondi).

Stato trasparente: «istantaneo/necessario riprovare/controllare manualmente» + causa con un linguaggio comprensibile.

Un tono rispettoso, senza minacce e «aspettate 72 ore», sempre con l'ETA.

12) Road map di implementazione (8-12 settimane) 4-6 mes, maturità →)

Settimane 1-2: requisiti/giurisdizione, Privacy by Design, selezione di sensori SDK, layout UX, metriche baseline.

Settimane 3-4: Lives v1 (passivo), face-match v1, OCR/MRZ, Storage sicuro, Loging Version.

Settimane 5-6: suggerimenti attivi, spiegazioni XAI, integrazione con antifrode/limiti, A/B UX.

Settimane 7-8: controllo fairness, monitoraggio drift, cassetta di sabbia per il revisore, playbook HITL.

Mesi 3-6: multi-touch/IR (dove consentito), reperti dipfeek, edge-ottimizzazione, formazione federale, aree di storage locali.

13) Errori frequenti e come evitarli

Affidarsi solo ai challenge attivi. Combinare segnali passivi e quality-gate.

Ignora luci/dispositivi. Testate con camere a basso costo e luce bassa; Dammi degli indizi.

Nessun controllo fairness. Gli errori di segmenti compromettono la sostenibilità legale e la fiducia.

Conservare la materia prima è troppo lungo. Riduce TTL, usa embedding/hash.

Senza XAI. Rifiuto inspiegabile di lamentele o multe.

Un monolite senza rollback. Qualsiasi aggiornamento senza A/B/ombre è un rischio per i feed di massa KYC.

AI-Face-KYC funziona quando è un sistema anziché una «libreria di riconoscimento»: livese + onesta partita facciale, soluzioni trasparenti, privacy rigorosa e disciplina MLops. Questo tracciato accelera contemporaneamente l'onboard degli utenti onesti, riduce il frodo e mantiene la fiducia del regolatore e dei clienti. I principi chiave sono la minimizzazione dei dati, la spiegabilità, l'equità e la sicurezza operativa per tutto il ciclo di vita.