news 2026/4/23 20:29:56

L2-1 Compass评测书生大模型实践

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
L2-1 Compass评测书生大模型实践

C-Eval数据集的评测

  • 运行时遇到如下报错:
returnnext(self.gen)File"/root/.conda/envs/opencompass10/lib/python3.10/site-packages/modelscope/msdatasets/utils/hf_datasets_util.py", line1492,inload_dataset_with_ctx dataset_res=DatasetsWrapperHF.load_dataset(*args, **kwargs)File"/root/.conda/envs/opencompass10/lib/python3.10/site-packages/modelscope/msdatasets/utils/hf_datasets_util.py", line1008,inload_dataset builder_instance=DatasetsWrapperHF.load_dataset_builder(File"/root/.conda/envs/opencompass10/lib/python3.10/site-packages/modelscope/msdatasets/utils/hf_datasets_util.py", line1142,inload_dataset_builder dataset_module=DatasetsWrapperHF.dataset_module_factory(File"/root/.conda/envs/opencompass10/lib/python3.10/site-packages/modelscope/msdatasets/utils/hf_datasets_util.py", line1447,indataset_module_factory raise e1 from None File"/root/.conda/envs/opencompass10/lib/python3.10/site-packages/modelscope/msdatasets/utils/hf_datasets_util.py", line1401,indataset_module_factory).get_module()File"/root/.conda/envs/opencompass10/lib/python3.10/site-packages/modelscope/msdatasets/utils/hf_datasets_util.py", line914,inget_module_with_script raise ValueError(ValueError: Loading opencompass/ceval-exam requires you to execute the dataset scriptinthat repo on yourlocalmachine. Make sure you havereadthe code there to avoid malicious use,thensetthe optiontrust_remote_code=True to remove this error.

判断是参数的问题,通过修改若干如下位置的代码:

把trust_remote_code = trust_remote_code 改成如下=True,完成运行

运行结果

自建数据集测评

运行结果

多模态数据集测评


版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 12:32:43

消费入口设计:1000元免单产品如何吸引海量流量?

流量是商业的起点。今天,我们深入探讨这套体系是如何设计一个无法抗拒的消费入口,用“免费”策略吸引海量用户,为后续的裂变与转化打下坚实基石的。1. “免单”背后的精妙心理设计传统的打折促销已经让用户麻木。而“1000元免单产品”的杀伤力…

作者头像 李华
网站建设 2026/4/23 14:10:47

【Java毕设源码分享】基于ssm+vue的怀旧小筑客栈管理系统的设计与实现(程序+文档+代码讲解+一条龙定制)

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

作者头像 李华
网站建设 2026/4/23 15:36:04

监控Source端Pg对Flink CDC的影响

1.pom <?xml version"1.0" encoding"UTF-8"?> <project xmlns"http://maven.apache.org/POM/4.0.0"xmlns:xsi"http://www.w3.org/2001/XMLSchema-instance"xsi:schemaLocation"http://maven.apache.org/POM/4.0.0 htt…

作者头像 李华
网站建设 2026/4/23 15:35:47

医疗边缘用Rust部署稳推理

&#x1f4dd; 博客主页&#xff1a;jaxzheng的CSDN主页 医疗边缘计算的稳定之锚&#xff1a;Rust语言在AI推理部署中的革命性应用目录医疗边缘计算的稳定之锚&#xff1a;Rust语言在AI推理部署中的革命性应用 引言&#xff1a;边缘医疗的稳定性危机 一、应用场景与价值&#x…

作者头像 李华
网站建设 2026/4/23 14:49:03

【路径规划】基于DWA实现机器人动态避障路径规划附Matlab代码

✅作者简介&#xff1a;热爱科研的Matlab仿真开发者&#xff0c;擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。 &#x1f34e; 往期回顾关注个人主页&#xff1a;Matlab科研工作室 &#x1f447; 关注我领取海量matlab电子书和数学建模资料 &#…

作者头像 李华