Ph.D. in Ingegneria Informatica E Dei Sistemi , 37^th cycle (2021-2024)

Ph.D. obtained in 2025

Profile

Research topic

Exploring the use of Deep Natural Language Processing models to analyze documents in cross-lingual and multi-domain scenarios

Research interests

Data science, Computer vision and AI

Biography

Hi, I am Lorenzo Vaiani, a PhD student immersed in the captivating world of multimodal learning. My primary research focus revolves around the intricate interplay between vision and language, with a specific emphasis on leveraging AI techniques to tackle pressing societal issues. I got my bachelor's degree in 2018 at the University of Florence and my master's degree at Politecnico di Torino in 2021, with a thesis titled "From Cluster Distributions Through Kernel Density Estimate to Driving Behaviour Scores: A Complete Data Science Pipeline."

My PhD focuses on multimodal learning. I am deeply passionate about unraveling the complexities of social media content and visually rich documents.
Beyond my core expertise in vision-language problems, I am keenly interested in the audio and video domains. This diverse skill set allows me to approach a wide range of complex challenges, further expanding the horizons of my research endeavors.

Teaching

Teachings

Master of Science

Data science lab: process and methods. A.A. 2021/22, DATA SCIENCE AND ENGINEERING. Collaboratore del corso
Data science lab: process and methods. A.A. 2022/23, DATA SCIENCE AND ENGINEERING. Collaboratore del corso
Data science lab: process and methods. A.A. 2023/24, DATA SCIENCE AND ENGINEERING. Collaboratore del corso
Data science lab: process and methods. A.A. 2024/25, DATA SCIENCE AND ENGINEERING. Collaboratore del corso
Deep natural language processing. A.A. 2023/24, DATA SCIENCE AND ENGINEERING. Collaboratore del corso
Deep natural language processing. A.A. 2024/25, DATA SCIENCE AND ENGINEERING. Collaboratore del corso

MostraNascondi A.A. passati

Bachelor of Science

Dati, algoritmi e le frontiere dell'informatica - Intraprendenti. A.A. 2024/25, INGEGNERIA AEROSPAZIALE. Collaboratore del corso
Basi di dati. A.A. 2021/22, INGEGNERIA INFORMATICA. Collaboratore del corso
Basi di dati. A.A. 2022/23, INGEGNERIA INFORMATICA. Collaboratore del corso

MostraNascondi A.A. passati

Research

Research groups

DBDM - Database and Data Mining Group

Publications

Works published during the Ph.D. View all publications in Porto@Iris

Benedetto, Irene; Koudounas, Alkis; Vaiani, Lorenzo; Pastor, Eliana; Cagliero, Luca; ... (2025)
Boosting court judgment prediction and explanation using legal entities. In: ARTIFICIAL INTELLIGENCE AND LAW, vol. 33, pp. 605-640. ISSN 0924-8463
Contributo su Rivista
Vaiani, Lorenzo (2025)
Exploring the Use of Deep Models to Analyze Data in Multimodal Scenarios. relatore: CAGLIERO, LUCA; GARZA, PAOLO; , 37. XXXVII Ciclo, P.: 121
Doctoral Thesis
Cagliero, Luca; Vaiani, Lorenzo; Pastor, Eliana; Koudounas, Alkis; Baralis, Elena; ... (2025)
Detecting and Mitigating Challenges in Zero-Shot Video Summarization with Video LLMs. In: 63rd Annual Meeting of the Association for Computational Linguistics: ACL 2025, Vienna (AT), 27Jul - 1 Aug 2025, pp. 286-301. ISBN: 979-8-89176-256-5
Contributo in Atti di Convegno (Proceeding)
Napolitano, Davide; Vaiani, Lorenzo; Cagliero, Luca (2025)
PoliTo at SemEval-2025 Task 1: Beyond Literal Meaning: A Chain-of-Though Approach for Multimodal Idiomacity Understanding. In: 19th International Workshop on Semantic Evaluation, Vienna (AT), July 27-August 1, 2025, pp. 2071-2076
Contributo in Atti di Convegno (Proceeding)
Vaiani, Lorenzo; Napolitano, Davide; Cagliero, Luca (2025)
A Graph Attention Network Combining Multifaceted Element Relationships for Full Document-Level Understanding. In: COMPUTERS, vol. 14. ISSN 2073-431X
Contributo su Rivista
Gallipoli, Giuseppe; Papicchio, Simone; Vaiani, Lorenzo; Cagliero, Luca; Miola, Arianna; ... (2024)
Keyword-based Annotation of Visually-Rich Document Content for Trend and Risk Analysis using Large Language Models. In: The Joint Workshop of the 7th Financial Technology and Natural Language Processing (FinNLP), the 5th Knowledge Discovery from Unstructured Data in Financial Services (KDF), and the 4th Economics and Natural Language Processing (ECONLP) Workshop (FinNLP-KD, Turin (ITA), 20 May, 2024, pp. 130-136
Contributo in Atti di Convegno (Proceeding)
LA QUATRA, Moreno; Koudounas, Alkis; Vaiani, Lorenzo; Baralis, Elena; Cagliero, Luca; ... (2024)
Benchmarking Representations for Speech, Music, and Acoustic Events. In: 2024 IEEE International Conference on Acoustics, Speech, and Signal Processing Workshops (ICASSPW), Seoul (KOR), 14-19 April 2024, pp. 505-509. ISBN: 979-8-3503-7451-3
Contributo in Atti di Convegno (Proceeding)
Napolitano, Davide; Vaiani, Lorenzo; Cagliero, Luca (2024)
Efficient Neural Network-based Estimation of Interval Shapley Values. In: IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING, vol. 36, pp. 8108-8119. ISSN 1041-4347
Contributo su Rivista
Ding, Yihao; Vaiani, Lorenzo; Han, Caren; Lee, Jean; Garza, Paolo; Poon, Josiah; ... (2024)
3MVRD: Multimodal Multi-task Multi-teacher Visually-Rich Form Document Understanding. In: Association for Computational Linguistics 2024, Bangkok, Thailand and virtual meeting, August 11-16, 2024, pp. 15233-15244
Contributo in Atti di Convegno (Proceeding)
Vaiani, Lorenzo; Cagliero, Luca; Garza, Paolo (2024)
Emotion Recognition from Videos Using Multimodal Large Language Models. In: FUTURE INTERNET, vol. 16. ISSN 1999-5903
Contributo su Rivista
Benedetto, Irene; Koudounas, Alkis; Vaiani, Lorenzo; Pastor, Eliana; Cagliero, Luca; ... (2024)
MAINDZ at SemEval-2024 Task 5: CLUEDO-Choosing Legal oUtcome by Explaining Decision through Oversight. In: SemEval-2024 (Workshop of ACL), Mexico City (MEX), 20-21 June, 2024, pp. 997-1005
Contributo in Atti di Convegno (Proceeding)
Napolitano, D.; Vaiani, L.; Cagliero, L. (2024)
On Leveraging Multi-Page Element Relations in Visually-Rich Documents. In: 48th IEEE Annual Computers, Software, and Applications Conference, COMPSAC 2024, Osaka (JPN), 02-04 July 2024, pp. 360-365. ISBN: 979-8-3503-7696-8
Contributo in Atti di Convegno (Proceeding)
Morra, Lia; Azzari, Alberto; Bergamasco, Letizia; Braga, Marco; Capogrosso, Luigi; ... (2023)
Designing Logic Tensor Networks for Visual Sudoku puzzle classification. In: 17th International Workshop on Neural-Symbolic Learning and Reasoning (NeSy 2023), Certosa di Pontignano, Siena (Italia), July 3-5, 2023, pp. 223-232. ISSN 1613-0073
Contributo in Atti di Convegno (Proceeding)
Koudounas, Alkis; LA QUATRA, Moreno; Vaiani, Lorenzo; Colomba, Luca; Attanasio, ... (2023)
ITALIC: An Italian Intent Classification Dataset. In: INTERSPEECH 2023, Dublin (Ireland), 20 August - 24 August 2023, pp. 2153-2157
Contributo in Atti di Convegno (Proceeding)
Napolitano, Davide; Vaiani, Lorenzo; Cagliero, Luca (2023)
Learning Confidence Intervals for Feature Importance: A Fast Shapley-based Approach. In: Data Analytics solutions for Real-LIfe APplications (DARLI-AP), Ioannina (Greece), March 28-31, 2023. ISSN 1613-0073
Contributo in Atti di Convegno (Proceeding)
Benedetto, Irene; Koudounas, Alkis; Vaiani, Lorenzo; Pastor, Eliana; Baralis, Elena; ... (2023)
PoliToHFI at SemEval-2023 Task 6: Leveraging Entity-Aware and Hierarchical Transformers For Legal Entity Recognition and Court Judgment Prediction. In: SemEval-2023 (Workshop of ACL), Toronto (CAN), July 9–14, 2023, pp. 1401-1411
Contributo in Atti di Convegno (Proceeding)
Vaiani, Lorenzo; Cagliero, Luca; Garza, Paolo (2023)
PoliTo at SemEval-2023 Task 1: CLIP-based Visual-Word Sense Disambiguation Based on Back-Translation. In: SemEval-2023 (Workshop of ACL), Toronto (CAN), July 9–14, 2023, pp. 1447-1453
Contributo in Atti di Convegno (Proceeding)
D'Amico, Lorenzo; Napolitano, Davide; Vaiani, Lorenzo; Cagliero, Luca (2023)
PoliTo at MULTI-Fake-DetectiVE: Improving FND-CLIP for Multimodal Italian Fake News Detection. In: EVALITA 2023, Parma, Italy, September 7-8, 2023. ISSN 1613-0073
Contributo in Atti di Convegno (Proceeding)
Ravagli, Jason; Vaiani, Lorenzo (2022)
JRLV at SemEval-2022 Task 5: The Importance of Visual Elements for Misogyny Identification in Memes. In: International Workshop on Semantic Evaluation (SemEval-2022), Seattle (USA), July 10–15, 2022, pp. 610-617
Contributo in Atti di Convegno (Proceeding)
Vaiani, Lorenzo; LA QUATRA, Moreno; Cagliero, Luca; Garza, Paolo (2022)
ViPER: Video-based Perceiver for Emotion Recognition. In: Multimodal Sentiment Analysis Challenge (MuSe 2022), Lisbon (PT), October 10-15, 2022, pp. 67-73
Contributo in Atti di Convegno (Proceeding)

More publicationsLess publications

Lorenzo Vaiani

Ph.D. in Ingegneria Informatica E Dei Sistemi , 37th cycle (2021-2024)

Dissertation:

Tutors:

Research presentation: