唐昊煜,山东大学助理教授,硕士研究生导师。分别于 2016 年、2021 年获得西安交通大学本科、博士学位。研究方向为多媒体计算、跨模态检索、机器学习,具体聚焦于自然语言引导的跨模态视频理解、视频-文本问答和标记学习等方面;已在 CVPR、AAAI、IJCAI、MM、IEEE TKDE、IEEE TMM、IEEE TCSVT、IEEE TITS 等国际 CCF A 类会议或 ACM/IEEE 汇刊发表10余篇论文(其中1篇ESI高被引论文),国家发明专利 2 项,参与国家级和省部级等单位横纵向课题共 5 项,同时担任 IEEE TPAMI, IEEE TKDE, IEEE TMM, IEEE TCSVT,和 ACM MM、ICML、NeurIPS、CVPR、ICLR等国际知名期刊会议的审稿人和程序委员会委员,已发表论文详见https://scholar.google.com/citations?user=pA9PNhsAAAAJ。欢迎本科生和应届硕士生联系来组科研!
新闻:
本人受邀为TPAMI 审稿人(2025-3-30)
指导本科生钟文亮一作论文《Towards Stable and Storage-efficient Dataset Distillation: Matching Convexified Trajectory》被CVPR 2025 (CCF-A)录用!(2025-2-27)
指导硕士生邓雄文一作论文《Boundary-Aware Temporal Dynamic Pseudo-Supervision Pairs Generation for Zero-Shot Natural Language Video Localization》被AAAI 2025 (CCF-A)录用!(2024-12-10)
指导硕士生姜涵一作论文《Revisiting Unsupervised Temporal Action Localization: The Primacy of High-Quality Actionness and Pseudolabels》被ACM MM2024 (CCF-A)录用!(2024-7-21)
本人第一作者论文《Listen as you wish: Fusion of audio and text for cross-modal event detection in smart cities》被Information Fusion(SCI 一区,IF=15)录用!(2024-5-19)
1.视频理解及视频片段定位
在多媒体(视频、图像、文本、音频)语义理解的基础上,研究基于传统模型和大语言模型的视频动作定位和跨模态视频片段定位技术。
跨模态视频片段定位
视频动作定位
2.多模态大模型
基于大语言模型进行图像/视频文本问答,评估大模型回答中的幻觉。
大模型问答
3.机器学习(多视角表示学习、标签分布式学习/标签增强)
通过建模样本与多个标签间的概率分布关系来提升多标签任务性能;通过优化标注质量、引入外部知识或生成伪标签等手段改善标签信息的完整性和准确性。
标签增强
团队名称: |
山东大学智能媒体研究中心 |
团队介绍: |
iLearn自2017年成立以来,先后主持了多项国家自然科学基金青年项目、面上项目、重点项目、科技部重点研发课题、教育部长江学者、达摩院青橙奖、山东省杰出青年基金项目、智洋创新千万级横向项目、腾讯犀牛鸟项目、山东电力项目等横纵向项目,经费累计6000余万。 iLearn在CCF-A类会议或IEEE/ACM汇刊发表论文100余篇、专著3部,申请/授权40余项国内外发明专利。iLearn致力于打造多元化、国际化的科研环境,目前iLearn已与香港、新加坡、澳大利亚、英国、加拿大、美国等地区或国家的知名科研院所建立了密切的合作关系,实现老师和学生的多次互访。此外,iLearn注重以工业界的实际需求为导向,用工业界真实的数据,做最接地气的研究;积极探索产学研合作的新模式新机制,与智洋创新科技有限公司建立了人工智能联合实验室,将多媒体检索技术落地于智慧电力,实现成果转化及产品实现。 |
团队成员: |