
Garantire l’affidabilità dei circuiti elettronici: premiato uno studio del Politecnico
In occasione della International Test Conference, che si è svolta a San Diego, in California, dal 21 al 26 settembre scorsi, un gruppo di ricercatori del Dipartimento di Automatica e Informatica-DAUIN ha ricevuto il JETTA/TTTC Best Paper Award 2024 per l’articolo “Investigating and Reducing the Architectural Impact of Transient Faults in Special Function Units for GPUs”, pubblicato open access sulla rivista “Journal of Electronic Testing: Theory and Application” (JETTA), edita da Springer.
Alla conferenza ITC i professionisti del collaudo e della progettazione di circuiti elettronici si riuniscono annualmente per confrontarsi sulle sfide che il settore si trova ad affrontare oggi, e per apprendere come queste sfide possono essere sostenute grazie agli sforzi congiunti del mondo accademico, dei fornitori di strumenti per la progettazione e il collaudo, e degli ingegneri di collaudo.
Il TTTC (Test Technology Technical Community) è un’organizzazione nata all’interno della IEEE Computer Society per riunire e favorire lo scambio di esperienze tra coloro che si occupano di collaudo di circuiti e sistemi elettronici.
Gli autori dell’articolo premiato sono Josie Esteban Rodriguez Condia, Juan-David Guerrero-Balaguera, Robert Alexander Limas Sierra e Matteo Sonza Reorda, rispettivamente ricercatore, assegnista di ricerca, dottorando e docente presso il DAUIN, ed Edwar J. Patino Nunez, ricercatore presso la Universidad Pedagogica y Tecnologica de Colombia (UPTC).
L’articolo si concentra sull'affidabilità delle GPU – circuiti elettronici in grado di eseguire calcoli matematici ad alta velocità, in particolare per applicazioni di Intelligenza Artificiale – e dei loro componenti interni: garantirla è fondamentale, soprattutto in settori critici per la sicurezza come le auto a guida autonoma. Queste applicazioni all'avanguardia si affidano infatti alle GPU per implementare algoritmi complessi grazie alla loro flessibilità di programmazione. Tuttavia, con il progresso delle tecnologie di integrazione usate nella realizzazione dei circuiti elettronici cresce la preoccupazione per il potenziale aumento della sensibilità ai possibili guasti. In particolare, le GPU sono oggi spesso utilizzate nel calcolo ad alte prestazioni e nell'addestramento delle reti neurali. Nonostante il loro uso frequente e il loro ruolo critico in diversi settori, le valutazioni di affidabilità delle GPU e lo sviluppo di soluzioni di mitigazione efficaci rappresentano oggi un problema aperto e parzialmente irrisolto, soprattutto a causa della complessità di tali dispositivi, che possono oggi includere fino a svariati miliardi di transistor.
Il lavoro portato avanti dai ricercatori del DAUIN prova quindi a fornire una risposta al problema, proponendo una valutazione dell'impatto dei guasti transitori sulle principali strutture hardware nelle GPU.
Lo studio rappresenta un esempio di successo in termini di collaborazione tra il Politecnico di Torino e un’università colombiana (UPTC), con cui da tempo sono attive varie forme di interazione, con scambio di docenti e studenti.