news 2026/4/23 22:39:17

中国AI大模型全景盘点:多模态与行业专用模型

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
中国AI大模型全景盘点:多模态与行业专用模型

中国大模型生态繁荣,在多模态技术与垂直行业应用方面涌现出大量特色模型。以下继续以序号形式盘点多模态及行业专用模型。

  1. 日日新V6.5(商汤科技):多模态能力强劲,在权威评测中超越GPTo等国际模型,性价比提升5倍。采用图文交错思维链技术,在医疗和金融等领域有实际落地应用。
  2. 盘古大模型(华为):专注于工业场景的优化(如制造业能耗降低),提供全栈国产化算力方案。在气象预测、铁路故障识别等硬核场景中表现出不可替代性,政企市场渗透深入。
  3. Skywork系列(昆仑万维):推出多模态统一模型UniPic.5B,实现图像理解、生成与编辑三合一。其开源的Skywork-R1V3等多模态模型也是社区活跃项目。
  4. Step系列(阶跃星辰):具备原生多模态推理能力,在相关榜单达到SOTA水平。其开源的基础模型Step3同样支持多模态,并组建模芯生态联盟。
  5. 通义万相2.2(阿里巴巴):阿里巴巴的开源视频生成模型,率先在视频生成扩散模型中引入MoE架构,有效解决计算资源消耗大的问题。其首创的电影美学控制系统,使生成视频在光影、色彩等方面接近专业电影水平。
  6. Seed系列(字节跳动):字节跳动的多模态模型家族,其图像生成模型Seedream和图像编辑模型Seededit.在国际评测中名列前茅。此外,还发布了实验性扩散语言模型SeedDiffusionPreview。
  7. 紫东太初(中科院自动化所):专注于多模态认知计算,是学术开源的重要贡献者。
  8. 生命大模型(留凤科技):专注生命科学与人工智能交叉领域,锚定个人生命数据库,对生命全周期精准洞察与推演。
  9. 安全大模型(奇安信):专注于敏感数据脱敏,脱敏准确率高。
  10. 行业大模型(云从科技):专注于海关、机场流程优化,形成政企项目闭环。
  11. 对话大模型(思必驰):专注于车载语音交互,有效提升用户满意度。
  12. 润知大模型(润和软件):提供金融AI智能化测试、智能问答/问数/报告/审核等商业化产品。
  13. 智象未来:其模型是HuggingFace趋势榜TOP1中中国AI开源团队的一员。
  14. Agentar-Fin-R1(蚂蚁数科):一个为银行、证券等金融场景量身打造的“专业中枢”大模型,有着覆盖66个细分场景的系统性真实金融数据集。在多个权威金融大模型评测基准上表现优异。
  15. HunyuanWorld(腾讯):腾讯的3D世界生成模型,登上了HuggingFace趋势榜。
  16. Wan2.2(阿里巴巴):阿里开源的通义万相2.2系列中的统一视频生成模型,支持文生视频、图生视频等。
  17. ThinkSound(阿里巴巴):阿里开源的CoT音频模型,实现了从视频到音频的生成。
  18. Ming-Lite-Omni.5(蚂蚁集团):蚂蚁集团开源的多模态大模型,支持任意模态到任意模态的转换。
  19. SmallThinker(上海交通大学):上海交通大学开源的端侧原生大模型,能够在1GB内存的设备上运行,非常适合边缘部署。

ScienceOneS1(磐石):磐石开源的科学基础大模型,专注于科学领域。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!