唐昊煜,山东大学助理教授,硕士研究生导师。分别于 2016 年、2021 年获得西安交通大学本科、博士学位。研究方向为多媒体计算、跨模态检索、机器学习,具体聚焦于自然语言引导的跨模态视频理解、视频-文本问答和标记学习等方面;已在 CVPR、AAAI、IJCAI、MM、IEEE TKDE、IEEE TMM、IEEE TCSVT、IEEE TITS 等国际 CCF A 类会议或 ACM/IEEE 汇刊发表10余篇论文(其中1篇ESI高被引论文),国家发明专利 2 项,参与国家级和省部级等单位横纵向课题共 5 项,同时担任 IEEE TPAMI, IEEE TKDE, IEEE TMM, IEEE TCSVT,和 ACM MM、ICML、NeurIPS、CVPR、ICLR等国际知名期刊会议的审稿人和程序委员会委员,已发表论文详见https://scholar.google.com/citations?user=pA9PNhsAAAAJ。欢迎本科生和应届硕士生联系来组科研!邮箱:tanghao258@sdu.edu.cn
新闻:
指导硕士生穆晓旭一作论文《FACE: A Dual-Template and Adaptive Curriculum Framework for Unsupervised Text-Based Person Search》被ACM MM2025 (CCF-A)录用!(2025-7-5)
本人受邀为TPAMI 审稿人(2025-3-30)
指导本科生钟文亮一作论文《Towards Stable and Storage-efficient Dataset Distillation: Matching Convexified Trajectory》被CVPR 2025 (CCF-A)录用!(2025-2-27)
指导硕士生邓雄文一作论文《Boundary-Aware Temporal Dynamic Pseudo-Supervision Pairs Generation for Zero-Shot Natural Language Video Localization》被AAAI 2025 (CCF-A)录用!(2024-12-10)
指导硕士生姜涵一作论文《Revisiting Unsupervised Temporal Action Localization: The Primacy of High-Quality Actionness and Pseudolabels》被ACM MM2024 (CCF-A)录用!(2024-7-21)
本人第一作者论文《Listen as you wish: Fusion of audio and text for cross-modal event detection in smart cities》被Information Fusion(SCI 一区,IF=15)录用!(2024-5-19)
1.视频理解及视频片段定位
在多媒体(视频、图像、文本、音频)语义理解的基础上,研究基于传统模型和大语言模型的视频动作定位和跨模态视频片段定位技术。
跨模态视频片段定位
视频动作定位
2.多模态大模型
基于大语言模型进行图像/视频文本问答,评估大模型回答中的幻觉。
大模型问答
3.机器学习(多视角表示学习、标签分布式学习/标签增强)
通过建模样本与多个标签间的概率分布关系来提升多标签任务性能;通过优化标注质量、引入外部知识或生成伪标签等手段改善标签信息的完整性和准确性。
标签增强