Stefano Calzolari

Foto di Stefano Calzolari

Dottorando in Ingegneria Informatica E Dei Sistemi , 39o ciclo (2023-2026)
Dipartimento di Automatica e Informatica (DAUIN)

Docente esterno e/o collaboratore didattico
Dipartimento di Automatica e Informatica (DAUIN)

Profilo

Dottorato di ricerca

Argomento di ricerca

Agenti Conversazionali Incarnati Consapevoli delle Emozioni (E2CA)

Tutori

Interessi di ricerca

Computer graphics and Multimedia
Data science, Computer vision and AI
Software engineering and Mobile computing

Biografia

Mi sono laureato in Ingegneria del Cinema e dei Mezzi di Comunicazione (LM-32) nell’ Aprile del 2023 ed iniziato il mio percorso di dottorato in Ingegneria Informatica e dei Sistemi nel Novembre dello stesso anno. Il mio gruppo di ricerca è il Computer Graphics & Vision Group (CG&VG) il quale opera principalmente nel campo della Realtà Aumentata (AR), Mista e Virtuale (VR), Interazione Uomo-Macchina (HMI), User eXperience (UX), Computer Vision, Machine Learning e Intelligenza Artificiale.

La mia ricerca nello specifico si focalizza sugli Embodied Conversational Agents (ECAs), personaggi virtuali capaci di simulare una conversazione simile a quella umana utilizzando l'elaborazione del linguaggio naturale e l'interazione multimodale. Gli ECAs possono essere utilizzati in una moltitudine di applicazioni, dall'istruzione alla formazione, come assistenti virtuali o come compagni virtuali. In molte di queste aree, migliorare l'efficacia e il realismo degli ECAs richiede renderli capaci di esprimere emozioni credibili e sfruttare gli effetti dell'emotività umana per creare un efficace legame empatico con gli utenti finali.

Lo scopo della mia ricerca è duplice.
Il primo obiettivo è sviluppare un framework per la prototipazione degli ECAs per applicazioni di Extended Reality (AR/VR) che permetta un’integrazione dei principali elementi atti alla simulazione di un umano:
  • Animazione: sfruttando tecniche di Motion Matching e Inverse Kinematic (IK)
  • Emozioni, tramite modelli come il Pleasure-Arousal-Dominance (PAD) o il modello Circumplex
  • Speech, tramite tecnologie di Speech-To-Text (STT), Text-To-Speech (TTS) e lip-sync
  • Behaviour, scomponendo il comportamento dell’agente in Azioni atomiche e componibili utilizzando classici sistemi Finite-State-Machine (FSM), Behavioural-Trees (BT) o Goal Oriented Action Planning (GOAP) e i Large Language Models (LLMs) per il reasoning e la pianificazione delle Azioni tramite moderne tecniche di Artificial Intelligence (AI).
Il secondo obiettivo è valutare come questi sistemi possano migliorare il grado di “credibilità” (Believability) che gli agenti suscitano nei confronti dell’utente durante l’interazione con gli stessi. I principali strumenti utilizzati sono questionari di UX e dati raccolti durante l’interazione utente-agente quali ad esempio frequenze di interazione, dati di traiettoria dell’utente, dati di eye-tracking.

Didattica

Insegnamenti

Corso di laurea magistrale

Corso di laurea di 1° livello

  • Informatica. A.A. 2024/25, INGEGNERIA AEROSPAZIALE. Collaboratore del corso

Ricerca

Gruppi di ricerca

Pubblicazioni

Pubblicazioni più recenti Vedi tutte le pubblicazioni su Porto@Iris