Current position: Home >>Research Focus

大语言模型

Click:

聚焦于构建具备深度语义理解与复杂推理能力的神经网络系统,以 Transformer 架构为核心,通过海量文本数据预训练形成通用语言表征,其核心研究方向涵盖:①高效训练与微调技术,如检索增强生成(RAG)结合外部知识库提升生成准确性,LoRA、QLoRA 等低秩适配方法在冻结主干参数的同时实现轻量微调;②动态推理与泛化能力,包括上下文学习(ICL)通过提示示例实现零样本 / 少样本任务适配,思维链(CoT)和多模态交互技术(如 MLLM 融合视觉编码)突破单一模态限制;③工程化与应用落地,如大模型 Agent 在自动化网页导航(AUTOWEBGLM)、软件开发(AutoDev)等复杂场景的部署,以及 RAG 在问答系统、代码生成中的垂直领域优化。