FST ITN-ZH入门教程:WebUI操作全解析
1. 简介与学习目标
欢迎阅读FST ITN-ZH 中文逆文本标准化(ITN)WebUI 操作全解析教程。本文是一份从零开始的完整使用指南,旨在帮助用户快速掌握该系统的各项功能和操作技巧。
本系统由开发者“科哥”基于 FST 构建并进行 WebUI 二次开发,支持将中文口语化或非标准表达自动转换为规范化的书面格式,广泛适用于语音识别后处理、自然语言理解、数据清洗等场景。
学习目标
完成本教程后,您将能够: - 熟练访问并启动 FST ITN-ZH WebUI 系统 - 使用“文本转换”功能完成单条语句的标准化处理 - 利用“批量转换”功能高效处理大量文本数据 - 掌握高级设置参数对输出结果的影响 - 理解常见问题及应对策略
前置知识要求
- 具备基本的 Linux 命令行操作能力
- 能够通过浏览器访问指定 IP 和端口的服务
- 了解中文数字、时间、货币等常见表达形式
2. 环境准备与服务启动
在使用 WebUI 之前,请确保已正确部署系统环境,并能正常启动服务。
启动或重启应用
运行以下命令以启动或重启服务:
/bin/bash /root/run.sh该脚本会初始化模型加载、启动 FastAPI 服务,并绑定到默认端口7860。首次运行可能需要 3–5 秒完成模型加载。
提示:若服务无法访问,请检查防火墙设置及端口开放状态,确认
7860端口处于监听状态。
3. 访问 WebUI 界面
浏览器访问地址
打开任意现代浏览器(推荐 Chrome 或 Edge),输入以下地址:
http://<服务器IP>:7860其中<服务器IP>替换为实际部署机器的公网或局域网 IP 地址。
例如:
http://192.168.1.100:7860页面加载成功后,您将看到如下主界面:
界面顶部显示项目名称与开发者信息,下方包含两个主要功能标签页:“📝 文本转换”和“📦 批量转换”。
4. 功能一:文本转换(单条处理)
这是最常用的功能模块,适用于测试、调试或处理少量文本。
4.1 操作步骤详解
- 切换至文本转换页
点击顶部标签页中的「📝 文本转换」
输入待转换文本
- 在左侧「输入文本」区域键入需要标准化的内容
支持多行输入,系统会整体分析并转换所有可识别项
点击开始转换
- 单击「开始转换」按钮
若为首次使用或修改了高级设置,系统将短暂重新加载模型(约 3–5 秒)
查看输出结果
转换完成后,右侧「输出结果」框中将展示标准化后的文本
后续操作
- 可点击「复制结果」将输出回填至输入框继续编辑
- 点击「清空」清除所有内容
- 点击「保存到文件」将当前结果持久化存储于服务器
4.2 实际示例演示
示例输入:
二零零八年八月八日早上八点半点击操作:
[开始转换]输出结果:
2008年08月08日 8:30a.m.此过程实现了日期与时间的联合标准化,体现了系统对复合语义的理解能力。
5. 功能二:批量转换(大规模处理)
当面对成百上千条记录时,手动逐条处理效率低下。此时应使用“批量转换”功能。
5.1 文件准备规范
创建一个纯文本.txt文件,每行一条原始语句,格式如下:
二零零八年八月八日 一百二十三 早上八点半 一点二五元 二十五千克 京A一二三四五注意:请勿添加编号、标点前缀或其他非必要字符;每行仅包含一条独立语句。
5.2 批量操作流程
- 切换至批量转换页
点击「📦 批量转换」标签页
上传文件
- 点击「上传文件」按钮
选择本地
.txt文件并确认上传执行转换
- 点击「批量转换」按钮
系统将逐行处理并生成对应标准化结果
下载结果
- 转换完成后,点击「下载结果文件」链接
- 文件将以带时间戳的命名方式保存,如:
itn_result_20250405_1430.txt
5.3 批量处理优势
- 高吞吐量:一次可处理数千行文本
- 一致性保障:统一参数下输出风格一致
- 便于集成:输出文件可直接导入数据库或下游系统
6. 快速示例与一键填充
为方便用户快速体验核心功能,界面底部提供多个预设示例按钮。
6.1 示例按钮列表
| 按钮 | 输入示例 |
|---|---|
[日期] | 二零零八年八月八日 |
[时间] | 早上八点半 |
[数字] | 一百二十三 |
[货币] | 一点二五元 |
[分数] | 五分之一 |
[度量] | 二十五千克 |
[数学] | 负二 |
[车牌] | 京A一二三四五 |
[长文本] | 二零一九年九月十二日的晚上... |
6.2 使用方法
点击任一按钮,系统会自动将对应示例文本填入输入框,无需手动输入即可立即测试转换效果。
建议用途:新用户首次使用时,依次点击各示例按钮,全面感受系统支持的能力范围。
7. 高级设置详解
通过调整高级选项,您可以精细控制转换行为,满足不同业务需求。
7.1 转换独立数字
- 开启状态:
幸运一百→幸运100 - 关闭状态:
幸运一百→幸运一百
适用场景:
若上下文强调“一百”是数量而非修辞,则建议开启;否则保持关闭以保留语言习惯。
7.2 转换单个数字 (0–9)
- 开启状态:
零和九→0和9 - 关闭状态:
零和九→零和九
说明:
控制是否将单字数字(如“零”、“三”)也转为阿拉伯数字。某些正式文档中需保留汉字写法。
7.3 完全转换'万'
- 开启状态:
六百万→6000000 - 关闭状态:
六百万→600万
对比示例: - 开启:三万五千→35000- 关闭:三万五千→3.5万
建议:
金融报表、统计分析等需精确数值的场景建议开启;日常阅读材料可关闭以提升可读性。
提示:每次更改设置后,首次转换会有轻微延迟,因系统需重建转换图。
8. 支持的转换类型一览
系统目前已覆盖多种常见中文表达形式的标准化任务。
8.1 日期转换
输入: 二零零八年八月八日 输出: 2008年08月08日 输入: 二零一九年九月十二日 输出: 2019年09月12日支持年月日全格式,兼容“二〇”与“零”的混合写法。
8.2 时间转换
输入: 早上八点半 输出: 8:30a.m. 输入: 下午三点十五分 输出: 3:15p.m.自动识别“早上/上午”、“下午/晚上”并映射为 a.m./p.m. 格式。
8.3 数字转换
输入: 一百二十三 输出: 123 输入: 一千九百八十四 输出: 1984支持千以内整数,以及“万”、“亿”单位的层级解析。
8.4 货币转换
输入: 一点二五元 输出: ¥1.25 输入: 一百美元 输出: $100自动匹配币种符号,支持“元”、“美元”、“欧元”等常见单位。
8.5 分数与度量单位
输入: 五分之一 → 输出: 1/5 输入: 三分之二 → 输出: 2/3 输入: 二十五千克 → 输出: 25kg 输入: 三十公里 → 输出: 30km8.6 数学表达式与特殊编号
输入: 负二 → 输出: -2 输入: 正五点五 → 输出: +5.5 输入: 京A一二三四五 → 输出: 京A12345特别适用于车牌号、编号序列等结构化信息提取。
9. 使用技巧与最佳实践
9.1 技巧一:长文本综合处理
系统支持在同一句话中识别并转换多个实体类型。
示例输入:
这件事发生在二零一九年九月十二日的晚上,大概八点半左右,涉及金额为一万二千元。输出结果:
这件事发生在2019年09月12日的晚上,大概8:30左右,涉及金额为12000元。应用场景:ASR 输出后处理、客服对话归一化、新闻摘要生成等。
9.2 技巧二:高效批量处理流程
对于大批量数据,推荐以下工作流:
- 将原始数据导出为
.txt文件,每行一条 - 上传至 WebUI 进行批量转换
- 下载结果文件并做二次校验
- 导入数据库或用于训练数据预处理
性能提示:单次处理 1000 行文本平均耗时约 15–20 秒(取决于硬件配置)。
9.3 技巧三:结果持久化保存
点击「保存到文件」按钮,系统将在服务器端生成带有时间戳的结果文件,路径通常位于/root/output/目录下,文件名形如:
itn_output_20250405_143022.txt便于后期追溯与审计。
10. 常见问题解答(FAQ)
10.1 Q1: 转换结果不准确怎么办?
答:
首先检查输入文本是否符合标准表达。若仍存在问题,请尝试: - 调整“高级设置”中的参数组合 - 分段输入长句,定位具体错误位置 - 查看是否有方言或非常规表达未被支持
10.2 Q2: 是否支持方言或变体表达?
答:
目前支持以下变体: - 大写数字:壹、贰、叁、肆、伍 - 特殊读音:幺(代表“一”)、两(代表“二”) - 混合写法:如“二〇二四年”、“两千二十四年”
暂不支持粤语、闽南语等地方发音规则。
10.3 Q3: 转换速度慢是什么原因?
答:
首次转换或修改参数后需重新构建 FST 图,因此会有 3–5 秒延迟。后续转换均为毫秒级响应。如持续缓慢,请检查 CPU/内存占用情况。
10.4 Q4: 如何保留版权信息?
答:
本项目承诺永久开源免费使用,但必须保留以下声明:
webUI二次开发 by 科哥 | 微信:312088415 承诺永远开源使用 但是需要保留本人版权信息!可在输出日志、界面底部或文档中注明。
11. 操作按钮功能说明
| 按钮 | 功能描述 |
|---|---|
| 开始转换 | 触发当前输入文本的标准化处理 |
| 清空 | 清除输入与输出区域的所有内容 |
| 复制结果 | 将输出内容复制回输入框,便于连续编辑 |
| 保存到文件 | 将当前结果写入服务器文件,带时间戳命名 |
| 批量转换 | 对上传的.txt文件执行批量化处理 |
12. 界面布局解析
主界面采用简洁直观的设计风格,主要分为以下几个区域:
┌─────────────────────────────────────────┐ │ [紫蓝渐变] 中文逆文本标准化 (ITN) │ │ webUI二次开发 by 科哥 │ ├─────────────────────────────────────────┤ │ [📝 文本转换] [📦 批量转换] │ │ │ │ ┌───────────┐ ┌───────────┐ │ │ │ 输入框 │ → │ 输出框 │ │ │ │ │ │ │ │ │ └───────────┘ └───────────┘ │ │ │ │ [开始转换] [清空] [复制] [保存] │ ├─────────────────────────────────────────┤ │ 🎯 快速示例 │ │ [日期] [时间] [数字] [货币] ... │ └─────────────────────────────────────────┘- 顶部标题栏:项目名称 + 开发者信息
- 功能标签页:切换不同操作模式
- 双栏输入输出区:清晰分离原始与标准化文本
- 操作按钮组:常用功能一键可达
- 快速示例区:降低上手门槛
13. 技术支持与反馈渠道
如在使用过程中遇到问题或有功能建议,欢迎联系开发者获取支持。
- 微信联系方式:312088415
- 开发者昵称:科哥
- 反馈建议内容:包括但不限于 Bug 报告、新特性请求、性能优化建议
我们致力于持续改进工具稳定性与功能性,您的反馈至关重要。
14. 许可证与使用声明
本项目遵循Apache License 2.0开源协议发布。
核心条款摘要: - 允许商业使用、修改、分发 - 不提供任何形式的担保 - 必须保留原始版权声明
特别说明:
webUI二次开发 by 科哥 | 微信:312088415 承诺永远开源使用 但是需要保留本人版权信息!获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。