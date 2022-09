Un algoritmo di riconoscimento linguistico utilizzato dall’Ufficio federale tedesco per le migrazioni e i rifugiati (Bundesamt für Migration und Flüchtlinge, Bamf) per identificare la provenienza dei richiedenti asilo potrebbe essere inefficace e comportare errori e discriminazioni. Da marzo 2017, infatti, il Bamf utilizza un programma (Dialect recognition software, Dias) per identificare la lingua e il dialetto parlato dai richiedenti asilo e in questo modo “aiutare” -sulla carta- a valutare la loro provenienza e a velocizzare l’esame delle domande di protezione. Secondo AlgorithmWatch, Ong di ricerca e di advocacy che studia gli algoritmi e i loro impatti sulla società, l’algoritmo si baserebbe su premesse scientifiche scorrette e su una “cultura del sospetto” nei confronti dei richiedenti asilo.

Nonostante le critiche puntuali, però, il Bamf ha ampliato il repertorio di lingue e dialetti esaminato dal Dias e presentato un progetto pilota al Consiglio europeo nell’ottobre 2020. Se inizialmente veniva utilizzato per identificare le lingue arabe, da un’interrogazione parlamentare presentata il 18 agosto di quest’anno dalla deputata del Parlamento tedesco Clara Bünger, è emerso che a partire da luglio 2022 il Dias ha iniziato ad essere impiegato per identificare le lingue persiane Farsi, Dari, Pashtu. Ma già in una presentazione tenuta il 7 ottobre 2020 al Consiglio europeo, tra le lingue in fase di sviluppo, oltre a quelle aggiunte a luglio 2022, erano presenti anche il dialetto curdo Kurmanji, il turco e diverse lingue africane. Inoltre sono diversi i Paesi europei che si sono mostrati interessati ad applicare il Dias. “Il ministero dell’Interno conferma che i Paesi partecipanti (al progetto pilota, ndr) sono Austria, Finlandia, Norvegia, Svezia, Grecia, Svizzera e Lituania. I rappresentanti del Bamf si sono già recati in Norvegia e in Svizzera per dimostrare il funzionamento del software”, denuncia AlgorithmWatch in una sua presa di posizione pubblica del 5 settembre 2022.

Il funzionamento del Dias non è complesso: un funzionario del Bamf chiede alla persona richiedente asilo di descrivere un’immagine nella sua lingua per ottenere un campione vocale. La conversazione viene quindi registrata e sottoposta a un’analisi biometrica da parte del Dias che permette di stimare le probabilità di appartenenza a una determinata lingua. Il report viene poi allegato alla cartella che descrive il caso del richiedente asilo e utilizzato come aiuto per velocizzare la valutazione della domanda di protezione. Nonostante le valutazioni ottenute in questo modo dovrebbero essere considerate solamente degli “indizi”, è stato ricostruito (ad esempio da Vice, nell’estate del 2018) come in diversi casi queste abbiano avuto una forte influenza sull’accoglimento di una domanda di asilo. “Soprattutto in presenza di un carico di lavoro elevato, di scadenze ristrette o di mancanza di formazione, c’è il rischio che il personale del Bamf finisca per interpretare i risultati del software come evidenze inconfutabili per poter prendere rapidamente una decisione –ha dichiarato Bünger ad AlgorithmWatch-. In tal caso sarebbe estremamente difficile per i richiedenti asilo contestare eventuali valutazioni errate”.

Non solo. Il linguista computazionale americano Mark Liberman, direttore del Linguistic data consortium presso l’Università della Pennsylvania, dove il Bamf ha ottenuto la maggior parte dei campioni vocali utilizzati per “addestrare” il proprio algoritmo, ha espresso in un suo commento ad AlgorithmWatch tutto il proprio scetticismo sulla capacità del Dias di identificare correttamente le lingue e i dialetti arabi e persiani. La sua critica riguarda soprattutto la difficoltà nell’attribuire uno standard unico a dialetti e lingue locali. “In Europa, la ‘lingua nazionale’ è stata introdotta con lo sviluppo degli Stati nazionali. Prima di allora era possibile imbattersi in barriere linguistiche anche allontanandosi di 100 chilometri dalla propria abitazione. Ma anche oggi può accadere che due persone che parlano spagnolo, ad esempio, non capiscano ognuno il dialetto dell’altro. E una persona che vive in Abruzzo e che parla un ‘italiano standard’ insegnato a scuola avrà un suono completamente diverso da un abitante della stessa Regione che parla dialetto abruzzese”, ricorda AlgorithmWatch. Con le lingue arabe e persiane il problema è ancora più complesso. “Mi risulta che la ‘standardizzazione’ del Dari e del Pashtu sia ancora meno consolidata, e quindi l’idea di stabilire linee nette che separino le parlate persiane, tra cui il Dari e il Pashtu, appunto, è probabilmente quasi senza speranza”.

Inoltre l’utilizzo dell’intelligenza artificiale per identificare la provenienza dei rifugiati rappresenterebbe una violazione dei loro diritti. Secondo l’European digital rights (Edri), organizzazione che difende i diritti digitali nel continente, “si tratta di una tecnologia in linea con quelle che cercano di prevedere l’orientamento sessuale o le convinzioni politiche delle persone, e come tale dovrebbe essere vietata”. “Nel processo di valutazione si presume che i richiedenti asilo forniscano informazioni false sulla loro identità e origine nonostante non esistono prove di questo comportamento -ha concluso Bünger, denunciando la ‘cultura del sospetto’ che anima strumenti come il Dias-. Invece di soluzioni tecnologiche costose e soggette a errori bisognerebbe investire su un’adeguata formazione del personale del Bamf per consentire procedure di asilo eque”.

