news 2026/4/23 9:21:46

给 AI 打个分,就能搞出估值17亿独角兽??刚刚完成1.5亿美元A轮融资,这个AI 评测平台彻底火了!LMArena

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
给 AI 打个分,就能搞出估值17亿独角兽??刚刚完成1.5亿美元A轮融资,这个AI 评测平台彻底火了!LMArena

你好,我是杰哥

2026年开年没几天,AI 圈又爆出一个大新闻:那个让我们天天刷大模型排名的LMArena(前身Chatbot Arena),正式宣布完成1.5 亿美元A轮融资,融资后估值直接飙到17 亿美元,妥妥成为AI独角兽!

从一个大学实验室的开源项目,到如今估值 17亿的商业公司,LMArena只用了不到三年时间。

这波操作,真的让人感叹:原来给 AI 模型“打分”,也能打出上亿身家!

今天我们就来聊聊这个现象级 AI 评测平台,看看它到底凭什么这么牛。

从学术玩具到行业标杆:LMArena的逆袭之路

LMArena的前身是LMSYS Org推出的Chatbot Arena,最早只是 UC 伯克利等高校研究者搞的一个小实验。

2023 年 ChatGPT 火了之后,大家发现传统基准测试(像MMLU、HumanEval)根本测不出模型真实水平——做题强,不代表聊天好用。

于是LMSYS团队灵机一动:干脆让用户直接盲测投票吧!

用户输入同一个问题,两个匿名模型同时回答,你投票选哪个更好,投票完再揭晓是谁对谁。

这种“众包+双盲+Elo评分”的模式,一下子就火了。

短短几年:

  • 累计超过5000万张用户投票
  • 评估了400多个开源和闭源模型
  • 开源了14.5万个高质量对战数据
  • 支持文本、视觉、图像生成、视频等多模态评测

现在,新模型一发布,第一件事就是冲到LMArena看排名。**Gemini、Claude、Grok、DeepSeek……**哪个没在这里被用户“拷打”过?

它已经成了AI行业的“黄金标准”。

重磅融资细节:大佬们集体All in

这次A轮融资规模1.5亿美元,由Felicis加州大学投资公司UC Investments领投,a16z(Andreessen Horowitz)、Kleiner Perkins、Lightspeed Venture Partners等一众顶级VC跟投。

要知道,2025 年 5 月它才刚拿了 1 亿美元种子轮,当时估值 6 亿。

短短 8个月,估值直接翻了近 3倍!

团队表示,这笔钱将用来:

  • 加速开发新功能
  • 提升用户体验
  • 扩大团队规模
  • 继续保持社区驱动的开放精神

创始人团队基本都是伯克利、斯坦福、CMU等顶校的90后华人研究员,技术硬核,低调务实。

官方公告里还特别感谢社区:没有大家的5000万张投票,就没有今天的LMArena

为什么LMArena这么重要?

传统基准是“考试式”测分,LMArena是“擂台式”真人PK。

优势显而易见:

  1. 真实用户偏好:反映真实使用场景,而不是实验室数据
  2. 公平双盲:避免品牌光环影响(很多人一看到GPT就投它)
  3. 动态排行:Elo评分实时更新,新模型随时能冲榜
  4. 多模态支持:不止聊天,还能比画图、看图、写代码

它不仅帮用户选模型,还给开发者提供了最宝贵的反馈数据,推动整个行业进步。

亲测体验:两分钟上瘾,根本停不下来

我第一时间去官网https://lmarena.ai/试玩了Battle模式,真的太爽了!

体验1:经典盲测对战

点开“New Chat” → 选择“Battle”模式,输入问题:“帮我写一首关于2026年AI独角兽的打油诗。”

两个匿名模型(左Model A,右Model B)同时给出答案。

一个诗写得押韵幽默,一个更结构化但平淡。

我果断投了左边更好——揭晓!左边居然是某个新出的开源模型,右边是老牌闭源巨头。

瞬间有种“人民的力量”的成就感!

体验2:图像生成擂台

切换到Text-to-Image Arena,输入提示词:“一只带着眼睛的波斯猫在霓虹都市飞驰”。

两个模型生成的图同时展示,我投了更酷的那张。

投票完还能看到详细排名和历史对战记录。

体验3:查看排行榜

Leaderboard页面超级清晰,文本、视觉、硬核推理等多维度排行一目了然。目前榜首还是那些熟悉的名字,但新模型随时可能逆袭。

总之,用下来只想说:**这才是最公平、最好玩的AI 评测方式!**每天刷一刷,基本就能知道哪个模型最强。

写在最后:AI评测的未来,已经来了

LMArena的爆火,说明一个道理:AI 时代,光有模型不够,还得有靠谱的“裁判”

它不仅帮我们普通用户选到最好用的 AI,还在推动整个行业向更透明、更负责的方向发展。

融资成功后,LMArena会变得更强——更多模态、更多功能、更好体验。

你还在等什么?

赶紧去https://lmarena.ai/开投!多投几票,你就是 AI 进步的推动者~

最后

关注【AI信息风向】,回复 666,即可获取更多 AI 行业报告和 AI 前沿工具。

AI 技术正以前所未有的速度发展,它将如何塑造我们的未来?让我们拭目以待。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/22 18:14:28

M2FP WebUI使用全攻略:上传图片→自动拼图→下载结果三步走

M2FP WebUI使用全攻略:上传图片→自动拼图→下载结果三步走 🌟 为什么需要多人人体解析? 在计算机视觉领域,人体解析(Human Parsing) 是语义分割的一个精细化分支,目标是将人体划分为多个具有…

作者头像 李华
网站建设 2026/4/16 15:55:45

PSM-ME-RS232/R接口转换器

PSM-ME-RS232/R 接口转换器(文字说明)产品定位串行接口转换器用于不同标准的串行接口设备之间的数据转换常见于工业自动化、仪器仪表及控制系统核心功能接口转换:将 RS232 信号转换为 RS485/RS422,或反向转换通信模式:…

作者头像 李华
网站建设 2026/4/18 5:29:33

M2FP模型部署避坑指南:解决mmcv._ext缺失与tuple索引越界报错

M2FP模型部署避坑指南:解决mmcv._ext缺失与tuple索引越界报错 📖 项目背景与核心挑战 在当前计算机视觉应用中,多人人体解析(Human Parsing) 是智能服装推荐、虚拟试衣、人像编辑等场景的关键前置技术。M2FP&#xff0…

作者头像 李华
网站建设 2026/4/16 14:38:15

如何用M2FP构建智能服装推荐系统?

如何用M2FP构建智能服装推荐系统? 🧩 M2FP 多人人体解析服务:为智能穿搭提供精准视觉理解 在个性化推荐系统中,视觉理解能力是实现“所见即所得”智能推荐的核心前提。尤其是在时尚电商、虚拟试衣、智能穿搭等场景中,如…

作者头像 李华
网站建设 2026/3/14 23:39:33

2 ** 3 ** 2 等于多少?90% 的人第一眼都算错

有一次我加班到凌晨,咖啡一杯接一杯。 第一杯,精神回来了; 第二杯,手速起飞; 第三杯,感觉自己能写完一个中台; 第四杯……心跳开始报警。 我突然意识到:有些东西不是线性增长的,而是指数级爆炸的。 技术世界里也是这样。你以为只是“再乘一次”,但结果已经完全不是一…

作者头像 李华