Emotion2Vec+ Large输出目录在哪？results.json路径全解析-深圳市維司達科技有限公司

Emotion2Vec+ Large输出目录在哪？results.json路径全解析

1. Emotion2Vec+ Large语音情感识别系统二次开发构建by科哥

你是不是也遇到过这种情况：用Emotion2Vec+ Large跑完一段音频，结果页面显示成功了，可回头找result.json文件时却一头雾水？明明界面说“已保存”，可outputs文件夹里一堆带时间戳的子目录，根本不知道该进哪个？

别急，这问题我也踩过坑。今天咱们不讲大道理，就直奔主题——把输出路径、文件结构、关键数据怎么读，给你掰扯清楚。尤其是那个让人摸不着头脑的results.json（实际是result.json），到底藏在哪，长什么样，怎么用，一次性全说明白。

这个系统是基于阿里达摩院开源的Emotion2Vec+ Large模型二次开发的WebUI版本，由“科哥”打包部署，极大降低了使用门槛。但正因为封装了一层，很多底层细节被隐藏了，导致开发者想拿结果做后续处理时，反而不知道从哪下手。

所以这篇文章，就是为你准备的“结果文件寻宝图”。不管你是想批量分析数据、做可视化，还是集成到自己的项目里，搞懂输出结构是第一步。

2. 输出目录结构详解

2.1 默认输出根目录

所有识别结果都统一保存在项目根目录下的：

outputs/

这个目录是固定的，不会因为重启或更新而改变。只要你没手动删，历史记录都在这儿。

2.2 每次识别生成独立子目录

每次点击“开始识别”，系统都会创建一个以时间戳命名的新文件夹，格式为：

outputs_YYYYMMDD_HHMMSS/

比如：

outputs/outputs_20240104_223000/

这意味着：

同一时刻只能有一个任务
每次识别都有独立空间，不会覆盖之前的成果
时间戳精确到秒，适合做日志追踪

提示：如果你做了多次测试，最新的目录通常就是最近一次运行的结果。

3. 单次识别结果的文件组成

3.1 典型目录内容

进入任意一个outputs_XXXXXX_XXXXXX/目录后，你会看到最多三个文件：

文件名	是否必有	说明
`processed_audio.wav`	是	预处理后的音频，统一转为16kHz WAV
`result.json`	是	核心识别结果，JSON格式
`embedding.npy`	否	特征向量文件，仅当勾选“提取Embedding”时生成

注意：文件名是固定的，不会根据上传的原文件名变化。

3.2 processed_audio.wav：标准化后的音频

系统会对上传的音频进行预处理：

转采样率至16kHz（模型输入要求）
转单声道
保存为WAV格式

这个processed_audio.wav就是模型实际分析的音频副本。你可以用它来验证预处理是否正常，比如听一下有没有失真。

3.3 result.json：情感识别的核心结果

这才是我们最关心的文件。虽然界面上叫“results”，但文件名其实是单数——result.json。

完整结构示例：

{ "emotion": "happy", "confidence": 0.853, "scores": { "angry": 0.012, "disgusted": 0.008, "fearful": 0.015, "happy": 0.853, "neutral": 0.045, "other": 0.023, "sad": 0.018, "surprised": 0.021, "unknown": 0.005 }, "granularity": "utterance", "timestamp": "2024-01-04 22:30:00" }

字段解释：

字段	含义
`emotion`	主要情感标签（英文小写）
`confidence`	置信度，浮点数（0~1）
`scores`	所有9类情感的得分字典
`granularity`	分析粒度：`utterance`或`frame`
`timestamp`	识别时间，与目录时间戳一致

重点提醒：emotion字段返回的是英文小写，如happy、sad，不是中文也不是首字母大写。做后续处理时要注意映射关系。

3.4 embedding.npy：可选的深度特征向量

当你在WebUI中勾选了“提取 Embedding 特征”选项，系统会额外导出一个.npy文件。

这是音频的高维特征表示，维度通常是(T, D)，其中：

T是时间步长（utterance模式下为1）
D是特征维度（Large模型一般为1024）

Python读取方式：

import numpy as np # 加载特征向量 embedding = np.load('embedding.npy') print(f"Shape: {embedding.shape}") # 示例输出: (1, 1024) # 可用于相似度计算、聚类等任务

这个文件对做二次开发特别有用，比如：

构建语音情感数据库
做用户情绪趋势分析
训练下游分类器

4. 如何快速定位最新结果？

4.1 手动查找法

打开终端，执行：

ls -t outputs/ | head -n 1

这条命令会按修改时间排序，列出最新的输出目录名，比如：

outputs_20240104_223000

然后进入该目录查看文件即可：

cd outputs/outputs_20240104_223000 cat result.json

4.2 自动化脚本建议

如果你要做批量处理，可以写个Python脚本自动扫描最新目录：

import os import json from pathlib import Path def get_latest_output(): outputs_dir = Path("outputs") if not outputs_dir.exists(): print("输出目录不存在") return None # 按创建时间排序，取最新 dirs = sorted(outputs_dir.iterdir(), key=os.path.getctime, reverse=True) for d in dirs: if d.is_dir() and d.name.startswith("outputs_"): return d return None # 使用示例 latest_dir = get_latest_output() if latest_dir: result_file = latest_dir / "result.json" if result_file.exists(): with open(result_file, 'r', encoding='utf-8') as f: data = json.load(f) print(f"主情感: {data['emotion']}, 置信度: {data['confidence']:.3f}")

这样就能无缝对接你的数据分析流程。

5. WebUI界面与文件系统的对应关系

很多人以为界面上看到的就是全部，其实不然。WebUI只是前端展示层，真正的数据落地还得看文件系统。

WebUI功能	对应文件系统行为
上传音频	复制并转换为`processed_audio.wav`
开始识别	生成`result.json`
勾选Embedding	生成`embedding.npy`
显示情感结果	读取`result.json`中的`emotion`和`scores`
下载Embedding	提供`embedding.npy`下载链接

所以即使你不点“下载”，文件也已经存在本地了。只要知道路径，随时可以拿。

6. 常见误区与避坑指南

6.1 误以为文件名会变

有人以为result.json会带上原音频名字，比如audio_result.json。不会！每次都是固定名称，靠目录区分任务。

✅ 正确做法：通过目录时间戳管理不同任务。

6.2 忽略粒度设置的影响

utterance模式：embedding.npy是一个向量(1, 1024)
frame模式：embedding.npy是一个序列(T, 1024)，T取决于音频长度

如果后续代码假设是单向量，但在frame模式下运行，就会出错。

✅ 建议：在读取embedding.npy前，先检查result.json里的granularity字段。

6.3 直接修改输出目录

不要手动重命名或移动outputs/下的目录，否则可能导致WebUI状态异常或日志错乱。

✅ 正确做法：处理完成后，复制所需文件到其他位置再操作。

6.4 忘记清理磁盘

每个任务至少生成两个文件（~几MB），长时间运行可能积累大量数据。

✅ 建议：定期清理旧目录，或写个定时脚本保留最近N天的数据。

7. 二次开发实用技巧

7.1 如何将结果导入数据库？

你可以把result.json的内容插入MySQL、MongoDB等数据库。例如MongoDB文档结构：

{ "task_id": "20240104_223000", "original_filename": "user_upload.mp3", "emotion": "happy", "confidence": 0.853, "scores": { ... }, "feature_path": "outputs/outputs_20240104_223000/embedding.npy", "timestamp": "2024-01-04 22:30:00" }

配合脚本自动化入库，轻松构建情绪分析平台。

7.2 如何批量处理多个音频？

虽然WebUI不支持批量上传，但你可以：

写个shell脚本循环调用API（如果有开放接口）
或者直接替换processed_audio.wav，然后触发识别逻辑（需了解内部机制）

更简单的办法：多次手动上传，然后用脚本统一收集所有result.json文件。

find outputs/ -name "result.json" -exec cp {} batch_results/ \;

7.3 如何验证结果一致性？

对比WebUI显示的情感和result.json中的值是否一致：

# 伪代码逻辑 webui_emotion = get_from_frontend() # 如通过截图或日志 file_emotion = data['emotion'] if webui_emotion.lower() == file_emotion: print("结果一致") else: print("警告：前后端结果不匹配！")

这在调试自定义部署环境时非常有用。

8. 总结

现在你应该彻底明白Emotion2Vec+ Large的输出机制了：

输出根目录：outputs/
每次识别：生成一个outputs_YYYYMMDD_HHMMSS/子目录
核心文件：result.json（注意是单数）包含完整情感得分
附加文件：embedding.npy（可选）用于二次开发
音频副本：processed_audio.wav为16kHz标准格式

最关键的一点：别被WebUI迷惑，真正的数据在文件系统里等着你去挖掘。

掌握了这套输出结构，你就不只是“使用者”，而是能真正把它集成进自己项目的“开发者”。

下一步，不妨试试把这些result.json数据汇总起来，做个情绪趋势仪表盘，或者训练个个性化情感模型——这才刚刚开始。

获取更多AI镜像
想探索更多AI镜像和应用场景？访问 CSDN星图镜像广场，提供丰富的预置镜像，覆盖大模型推理、图像生成、视频生成、模型微调等多个领域，支持一键部署。

Emotion2Vec+ Large输出目录在哪？results.json路径全解析