欢迎来到我的站点
关于我
我是王子龙,目前在微软亚洲研究院(上海)机器学习组担任Senior Researcher。我的研究聚焦于 AI4Health、Foundation Models 与 Human-AI Interaction 的交叉前沿,致力于构建可靠、可泛化、深度契合真实世界需求的人工智能系统,尤其面向医疗健康等高风险场景。我于 2018 年获得复旦大学上海医学院临床医学医学博士学位。临床训练塑造了我的研究方法论:以医学问题为牵引,强调模型在真实世界异质数据下的稳健性、与临床推理的一致性,以及在复杂工作流中的安全部署。
我的研究主要沿三条主线展开:在 AI4Health 方向,我关注医学影像与多模态智能系统,用于筛查、诊断与长期疾病管理;在 Foundation Models 方向,我探索多模态基础模型与医疗大语言模型(LLM)的架构设计、评测方法与强化学习优化策略,以提升泛化能力、可解释性与临床可信度;在 Human-AI Interaction 方向,我研究先进 AI 系统(包括多模态与智能体模型)在真实场景中的人机交互机制,涵盖临床工作流、无障碍技术以及老龄人群应用等场景,强调 human-in-the-loop 设计,使用户能够查询、验证、纠错并引导 AI 行为,从而提升系统的透明性、可控性与可信度。
在 2023 年加入微软亚洲研究院之前,我曾在医疗科技初创公司担任 CTO,主导研发多款 AI 软件医疗器械(SaMD),并推动完成临床验证、注册审批与市场准入,形成从技术研发到产业落地的完整转化经验。我曾入选 2020 年福布斯中国 30 岁以下精英榜与 2021 年胡润 U30 中国创业领袖榜,并担任中国计算机学会(CCF)数字医学专委会执行委员。
最新动态
[2026年2月] 我们发布 OMGs(卵巢肿瘤多学科智能体系统),这是一个由大语言模型驱动的多智能体框架,旨在支持卵巢肿瘤全病程管理中的 MDT(多学科会诊)决策。在多中心评估中,OMGs 的表现达到专家 MDT 共识水平,展示了协作式智能体系统在高风险临床决策支持中的潜力。
[2026年1月] 我们推出 GI-Bench 基准测试平台,涵盖 20 种细粒度病变类别,并围绕消化道内镜五阶段临床工作流,对多模态大语言模型(MLLMs)进行系统性评估,推动面向真实临床流程的多模态模型评价标准建设。
[2025年8月] 我们开源 Agent Lightning⚡ 框架,使开发者能够通过强化学习(RL)训练任意 AI 智能体。该框架将智能体执行过程与模型训练过程解耦,可在几乎无需修改代码的情况下,无缝集成至 LangChain、AutoGen、CrewAI 等主流框架。
[2025年8月] 我们发布两项医疗基础模型预印本成果:RenalCLIP(面向肾癌精准肿瘤学的视觉-语言基础模型)与 DermINO(基于多视图混合预训练策略的皮肤科通用基础模型)。
联系方式
- Email: wangzilong@microsoft.com
- GitHub: wizardlancet
Selected Publications
2026
- GI-Bench: A Panoramic Benchmark Revealing the Knowledge-Experience Dissociation of Multimodal Large Language Models in Gastrointestinal Endoscopy Against Clinical Standards.
- OMGs: A multi-agent system supporting MDT decision-making across the ovarian tumour care continuum.
- Exploring interpretability for visual prompt tuning with cross-layer concepts.ICLR (OpenReview), 2026 · Link
- Joint adaptation of uni-modal foundation models for multi-modal Alzheimer's disease diagnosis.ICLR (OpenReview), 2026 · Link
- Reasoning-driven multimodal LLM for domain generalization.ICLR (OpenReview), 2026 · Link
- Do not let low-probability tokens over-dominate in RL for LLMs.ICLR (OpenReview), 2026 · Link
- Screen Reader Programmers in the Vibe Coding Era: Adaptation, Empowerment, and New Accessibility Landscape.
- The Potential and Value of AI Chatbot in Personalized Cognitive Training.
2025
- A Disease-Centric Vision-Language Foundation Model for Precision Oncology in Kidney Cancer.
- DermINO: Hybrid Pretraining for a Versatile Dermatology Foundation Model.
- Learning Robust Representations for Medical Images via Unifying (Self-)Supervisions.ICLR 2025 submission (OpenReview), 2025 · Link
- Agent Lightning: Train ANY AI Agents with Reinforcement Learning.
- AI-assisted facial analysis in healthcare: From disease detection to comprehensive management.Patterns, 2025 · Link
2024
- Screening chronic kidney disease through deep learning utilizing ultra-wide-field fundus images.
- DualStreamFoveaNet: A dual stream fusion architecture with anatomical awareness for robust fovea localization.
- LLM-RadJudge: Achieving Radiologist-Level Evaluation for X-Ray Report Generation.
2023
- Early detection of visual impairment in young children using a smartphone-based deep learning system.