news 2026/4/23 14:02:28

FST ITN-ZH入门教程:WebUI操作全解析

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
FST ITN-ZH入门教程:WebUI操作全解析

FST ITN-ZH入门教程:WebUI操作全解析

1. 简介与学习目标

欢迎阅读FST ITN-ZH 中文逆文本标准化(ITN)WebUI 操作全解析教程。本文是一份从零开始的完整使用指南,旨在帮助用户快速掌握该系统的各项功能和操作技巧。

本系统由开发者“科哥”基于 FST 构建并进行 WebUI 二次开发,支持将中文口语化或非标准表达自动转换为规范化的书面格式,广泛适用于语音识别后处理、自然语言理解、数据清洗等场景。

学习目标

完成本教程后,您将能够: - 熟练访问并启动 FST ITN-ZH WebUI 系统 - 使用“文本转换”功能完成单条语句的标准化处理 - 利用“批量转换”功能高效处理大量文本数据 - 掌握高级设置参数对输出结果的影响 - 理解常见问题及应对策略

前置知识要求

  • 具备基本的 Linux 命令行操作能力
  • 能够通过浏览器访问指定 IP 和端口的服务
  • 了解中文数字、时间、货币等常见表达形式

2. 环境准备与服务启动

在使用 WebUI 之前,请确保已正确部署系统环境,并能正常启动服务。

启动或重启应用

运行以下命令以启动或重启服务:

/bin/bash /root/run.sh

该脚本会初始化模型加载、启动 FastAPI 服务,并绑定到默认端口7860。首次运行可能需要 3–5 秒完成模型加载。

提示:若服务无法访问,请检查防火墙设置及端口开放状态,确认7860端口处于监听状态。


3. 访问 WebUI 界面

浏览器访问地址

打开任意现代浏览器(推荐 Chrome 或 Edge),输入以下地址:

http://<服务器IP>:7860

其中<服务器IP>替换为实际部署机器的公网或局域网 IP 地址。

例如:

http://192.168.1.100:7860

页面加载成功后,您将看到如下主界面:

界面顶部显示项目名称与开发者信息,下方包含两个主要功能标签页:“📝 文本转换”和“📦 批量转换”。


4. 功能一:文本转换(单条处理)

这是最常用的功能模块,适用于测试、调试或处理少量文本。

4.1 操作步骤详解

  1. 切换至文本转换页
  2. 点击顶部标签页中的「📝 文本转换」

  3. 输入待转换文本

  4. 在左侧「输入文本」区域键入需要标准化的内容
  5. 支持多行输入,系统会整体分析并转换所有可识别项

  6. 点击开始转换

  7. 单击「开始转换」按钮
  8. 若为首次使用或修改了高级设置,系统将短暂重新加载模型(约 3–5 秒)

  9. 查看输出结果

  10. 转换完成后,右侧「输出结果」框中将展示标准化后的文本

  11. 后续操作

  12. 可点击「复制结果」将输出回填至输入框继续编辑
  13. 点击「清空」清除所有内容
  14. 点击「保存到文件」将当前结果持久化存储于服务器

4.2 实际示例演示

示例输入:
二零零八年八月八日早上八点半
点击操作:
[开始转换]
输出结果:
2008年08月08日 8:30a.m.

此过程实现了日期与时间的联合标准化,体现了系统对复合语义的理解能力。


5. 功能二:批量转换(大规模处理)

当面对成百上千条记录时,手动逐条处理效率低下。此时应使用“批量转换”功能。

5.1 文件准备规范

创建一个纯文本.txt文件,每行一条原始语句,格式如下:

二零零八年八月八日 一百二十三 早上八点半 一点二五元 二十五千克 京A一二三四五

注意:请勿添加编号、标点前缀或其他非必要字符;每行仅包含一条独立语句。

5.2 批量操作流程

  1. 切换至批量转换页
  2. 点击「📦 批量转换」标签页

  3. 上传文件

  4. 点击「上传文件」按钮
  5. 选择本地.txt文件并确认上传

  6. 执行转换

  7. 点击「批量转换」按钮
  8. 系统将逐行处理并生成对应标准化结果

  9. 下载结果

  10. 转换完成后,点击「下载结果文件」链接
  11. 文件将以带时间戳的命名方式保存,如:itn_result_20250405_1430.txt

5.3 批量处理优势

  • 高吞吐量:一次可处理数千行文本
  • 一致性保障:统一参数下输出风格一致
  • 便于集成:输出文件可直接导入数据库或下游系统

6. 快速示例与一键填充

为方便用户快速体验核心功能,界面底部提供多个预设示例按钮。

6.1 示例按钮列表

按钮输入示例
[日期]二零零八年八月八日
[时间]早上八点半
[数字]一百二十三
[货币]一点二五元
[分数]五分之一
[度量]二十五千克
[数学]负二
[车牌]京A一二三四五
[长文本]二零一九年九月十二日的晚上...

6.2 使用方法

点击任一按钮,系统会自动将对应示例文本填入输入框,无需手动输入即可立即测试转换效果。

建议用途:新用户首次使用时,依次点击各示例按钮,全面感受系统支持的能力范围。


7. 高级设置详解

通过调整高级选项,您可以精细控制转换行为,满足不同业务需求。

7.1 转换独立数字

  • 开启状态幸运一百幸运100
  • 关闭状态幸运一百幸运一百

适用场景
若上下文强调“一百”是数量而非修辞,则建议开启;否则保持关闭以保留语言习惯。

7.2 转换单个数字 (0–9)

  • 开启状态零和九0和9
  • 关闭状态零和九零和九

说明
控制是否将单字数字(如“零”、“三”)也转为阿拉伯数字。某些正式文档中需保留汉字写法。

7.3 完全转换'万'

  • 开启状态六百万6000000
  • 关闭状态六百万600万

对比示例: - 开启:三万五千35000- 关闭:三万五千3.5万

建议
金融报表、统计分析等需精确数值的场景建议开启;日常阅读材料可关闭以提升可读性。

提示:每次更改设置后,首次转换会有轻微延迟,因系统需重建转换图。


8. 支持的转换类型一览

系统目前已覆盖多种常见中文表达形式的标准化任务。

8.1 日期转换

输入: 二零零八年八月八日 输出: 2008年08月08日 输入: 二零一九年九月十二日 输出: 2019年09月12日

支持年月日全格式,兼容“二〇”与“零”的混合写法。

8.2 时间转换

输入: 早上八点半 输出: 8:30a.m. 输入: 下午三点十五分 输出: 3:15p.m.

自动识别“早上/上午”、“下午/晚上”并映射为 a.m./p.m. 格式。

8.3 数字转换

输入: 一百二十三 输出: 123 输入: 一千九百八十四 输出: 1984

支持千以内整数,以及“万”、“亿”单位的层级解析。

8.4 货币转换

输入: 一点二五元 输出: ¥1.25 输入: 一百美元 输出: $100

自动匹配币种符号,支持“元”、“美元”、“欧元”等常见单位。

8.5 分数与度量单位

输入: 五分之一 → 输出: 1/5 输入: 三分之二 → 输出: 2/3 输入: 二十五千克 → 输出: 25kg 输入: 三十公里 → 输出: 30km

8.6 数学表达式与特殊编号

输入: 负二 → 输出: -2 输入: 正五点五 → 输出: +5.5 输入: 京A一二三四五 → 输出: 京A12345

特别适用于车牌号、编号序列等结构化信息提取。


9. 使用技巧与最佳实践

9.1 技巧一:长文本综合处理

系统支持在同一句话中识别并转换多个实体类型。

示例输入

这件事发生在二零一九年九月十二日的晚上,大概八点半左右,涉及金额为一万二千元。

输出结果

这件事发生在2019年09月12日的晚上,大概8:30左右,涉及金额为12000元。

应用场景:ASR 输出后处理、客服对话归一化、新闻摘要生成等。

9.2 技巧二:高效批量处理流程

对于大批量数据,推荐以下工作流:

  1. 将原始数据导出为.txt文件,每行一条
  2. 上传至 WebUI 进行批量转换
  3. 下载结果文件并做二次校验
  4. 导入数据库或用于训练数据预处理

性能提示:单次处理 1000 行文本平均耗时约 15–20 秒(取决于硬件配置)。

9.3 技巧三:结果持久化保存

点击「保存到文件」按钮,系统将在服务器端生成带有时间戳的结果文件,路径通常位于/root/output/目录下,文件名形如:

itn_output_20250405_143022.txt

便于后期追溯与审计。


10. 常见问题解答(FAQ)

10.1 Q1: 转换结果不准确怎么办?


首先检查输入文本是否符合标准表达。若仍存在问题,请尝试: - 调整“高级设置”中的参数组合 - 分段输入长句,定位具体错误位置 - 查看是否有方言或非常规表达未被支持

10.2 Q2: 是否支持方言或变体表达?


目前支持以下变体: - 大写数字:壹、贰、叁、肆、伍 - 特殊读音:幺(代表“一”)、两(代表“二”) - 混合写法:如“二〇二四年”、“两千二十四年”

暂不支持粤语、闽南语等地方发音规则。

10.3 Q3: 转换速度慢是什么原因?


首次转换或修改参数后需重新构建 FST 图,因此会有 3–5 秒延迟。后续转换均为毫秒级响应。如持续缓慢,请检查 CPU/内存占用情况。

10.4 Q4: 如何保留版权信息?


本项目承诺永久开源免费使用,但必须保留以下声明:

webUI二次开发 by 科哥 | 微信:312088415 承诺永远开源使用 但是需要保留本人版权信息!

可在输出日志、界面底部或文档中注明。


11. 操作按钮功能说明

按钮功能描述
开始转换触发当前输入文本的标准化处理
清空清除输入与输出区域的所有内容
复制结果将输出内容复制回输入框,便于连续编辑
保存到文件将当前结果写入服务器文件,带时间戳命名
批量转换对上传的.txt文件执行批量化处理

12. 界面布局解析

主界面采用简洁直观的设计风格,主要分为以下几个区域:

┌─────────────────────────────────────────┐ │ [紫蓝渐变] 中文逆文本标准化 (ITN) │ │ webUI二次开发 by 科哥 │ ├─────────────────────────────────────────┤ │ [📝 文本转换] [📦 批量转换] │ │ │ │ ┌───────────┐ ┌───────────┐ │ │ │ 输入框 │ → │ 输出框 │ │ │ │ │ │ │ │ │ └───────────┘ └───────────┘ │ │ │ │ [开始转换] [清空] [复制] [保存] │ ├─────────────────────────────────────────┤ │ 🎯 快速示例 │ │ [日期] [时间] [数字] [货币] ... │ └─────────────────────────────────────────┘
  • 顶部标题栏:项目名称 + 开发者信息
  • 功能标签页:切换不同操作模式
  • 双栏输入输出区:清晰分离原始与标准化文本
  • 操作按钮组:常用功能一键可达
  • 快速示例区:降低上手门槛

13. 技术支持与反馈渠道

如在使用过程中遇到问题或有功能建议,欢迎联系开发者获取支持。

  • 微信联系方式:312088415
  • 开发者昵称:科哥
  • 反馈建议内容:包括但不限于 Bug 报告、新特性请求、性能优化建议

我们致力于持续改进工具稳定性与功能性,您的反馈至关重要。


14. 许可证与使用声明

本项目遵循Apache License 2.0开源协议发布。

核心条款摘要: - 允许商业使用、修改、分发 - 不提供任何形式的担保 - 必须保留原始版权声明

特别说明

webUI二次开发 by 科哥 | 微信:312088415 承诺永远开源使用 但是需要保留本人版权信息!

获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 14:01:08

springboot电脑商城系统

第一章 系统开发背景与SpringBoot适配性 当前电脑销售领域&#xff0c;传统线下商城面临获客难、库存管理混乱、客户服务响应慢等问题&#xff0c;而普通线上商城又存在电脑型号复杂导致的参数展示不清晰、售后流程不规范、个性化推荐缺失等痛点——消费者难快速找到匹配需求的…

作者头像 李华
网站建设 2026/4/22 9:07:20

springboot大学生勤工助学系统

第一章 系统开发背景与SpringBoot适配性 当前高校勤工助学管理中&#xff0c;传统模式存在诸多痛点&#xff1a;岗位发布依赖线下通知&#xff0c;信息传播范围有限且易滞后&#xff1b;学生申请需提交纸质材料&#xff0c;审核流程繁琐导致效率低下&#xff1b;岗位考勤多靠人…

作者头像 李华
网站建设 2026/4/23 13:56:27

YOLOv5避坑指南:环境配置总出错?试试0配置云端版

YOLOv5避坑指南&#xff1a;环境配置总出错&#xff1f;试试0配置云端版 你是不是也遇到过这种情况&#xff1a;创业项目刚起步&#xff0c;急需用YOLOv5做个目标检测原型来演示给投资人看。结果在家用电脑上折腾了三天&#xff0c;Python版本、PyTorch不兼容、CUDA驱动报错……

作者头像 李华
网站建设 2026/4/18 5:27:45

Open-AutoGLM应用场景拓展:自动打卡机器人部署案例

Open-AutoGLM应用场景拓展&#xff1a;自动打卡机器人部署案例 1. 引言 1.1 技术背景与业务需求 在现代企业办公环境中&#xff0c;考勤打卡已成为日常管理的重要环节。然而&#xff0c;手动打卡不仅耗时&#xff0c;还容易因遗忘、网络延迟或通勤问题导致异常记录。尽管部分…

作者头像 李华
网站建设 2026/4/23 6:41:22

Qwen3-1.7B混合精度推理,节省显存又提速

Qwen3-1.7B混合精度推理&#xff0c;节省显存又提速 1. 引言&#xff1a;大模型轻量化推理的新范式 随着大语言模型在各类应用场景中的广泛落地&#xff0c;部署效率与资源消耗之间的矛盾日益突出。传统FP16或FP32精度下的模型虽然具备高推理质量&#xff0c;但对显存和算力的…

作者头像 李华
网站建设 2026/4/23 8:21:33

YOLOv5图像识别保姆级教程:0配置云端环境,3步出结果

YOLOv5图像识别保姆级教程&#xff1a;0配置云端环境&#xff0c;3步出结果 你是不是也遇到过这样的情况&#xff1f;作为一名设计师&#xff0c;手头有大量设计素材需要分类和标注——比如图标、按钮、背景图、人物插画等。你想用AI自动识别这些元素&#xff0c;提升工作效率…

作者头像 李华