零代码实现中文文本归一化|基于FST ITN-ZH WebUI操作
你有没有遇到过这样的问题:语音识别系统输出的文本是“二零零八年八月八日早上八点半”,但你想把它变成标准格式“2008年08月08日 8:30a.m.”?或者客户说“一点二五元”,你希望自动转成“¥1.25”用于财务记录?
这类需求在语音处理、智能客服、会议纪要、教育辅导等场景中非常常见。传统做法是写一堆正则表达式,维护成本高、覆盖不全、容易出错。有没有一种无需编程、开箱即用、准确率高的解决方案?
答案就是今天要介绍的工具——FST ITN-ZH 中文逆文本标准化(ITN)WebUI版。它基于有限状态转录机(FST)技术,专为中文设计,支持日期、时间、数字、货币、分数、度量单位等多种格式转换,更重要的是:完全零代码操作,小白也能轻松上手。
本文将带你全面了解这款由“科哥”二次开发并开源的WebUI版本,从功能使用到实际应用场景,手把手教你如何用它快速完成中文文本的标准化处理。
1. 什么是中文逆文本标准化(ITN)
1.1 简单来说:把“说出来的文字”变“写出来的格式”
“逆文本标准化”听起来很专业,其实它的任务很简单:把自然语言中的口语化数字和表达,转换成机器可读的标准格式。
比如:
- 口语输入:“我今年二十五岁”
- 标准输出:“我今年25岁”
这个过程就叫Inverse Text Normalization(ITN),它是语音识别(ASR)系统中不可或缺的一环。没有它,ASR输出的结果只能看不能用;有了它,才能真正实现结构化数据提取。
1.2 为什么需要ITN?
想象一下这些场景:
- 智能客服听到用户说“我要买一百二十三张票”,系统必须知道这是
123张,而不是字符串“一百二十三” - 医疗录音中医生提到“血压一百四十比九十”,需要准确解析为
140/90 - 财务系统录入“三点五万元”,应自动转为
35000元或¥35,000
如果靠人工一个个改,效率低还容易出错。而FST ITN-ZH正是为此类问题量身打造的自动化工具。
1.3 技术原理简析:FST如何工作?
FST(Finite State Transducer,有限状态转录机)是一种高效的规则引擎,特别适合做一对一或多对一的语言转换任务。
你可以把它理解成一个“智能替换器”:
- 它不是简单的关键词匹配
- 而是通过预定义的状态机模型,理解上下文语义
- 比如“一万两千”会被识别为“12000”,而不是“100002000”
这种机制速度快、资源占用小、准确率高,非常适合部署在本地或边缘设备上。
2. 快速上手:无需代码,浏览器即可操作
2.1 启动服务
该镜像已预装所有依赖环境,只需运行以下命令即可启动WebUI界面:
/bin/bash /root/run.sh执行后,系统会自动拉起Gradio构建的Web服务,默认监听端口7860。
2.2 访问地址
在浏览器中打开:
http://<服务器IP>:7860你会看到一个简洁美观的紫蓝渐变风格界面,标题为“中文逆文本标准化 (ITN)”,底部注明“webUI二次开发 by 科哥”。
3. 核心功能详解:两大模式满足不同需求
3.1 功能一:单条文本转换( 文本转换)
适用于日常调试、少量文本处理。
使用步骤:
- 打开页面,点击顶部「 文本转换」标签页
- 在左侧“输入文本”框中键入内容,例如:
二零零八年八月八日早上八点半 - 点击「开始转换」按钮
- 右侧“输出结果”框立即显示标准化结果:
2008年08月08日 8:30a.m.
实际案例演示:
| 输入 | 输出 |
|---|---|
| 一百二十三 | 123 |
| 一点二五元 | ¥1.25 |
| 二十五千克 | 25kg |
| 负二 | -2 |
| 京A一二三四五 | 京A12345 |
整个过程无需任何配置,点击即得结果,非常适合非技术人员使用。
3.2 功能二:批量文件处理(📦 批量转换)
当面对大量待处理文本时,手动一条条输入显然不现实。这时就要用到“批量转换”功能。
操作流程:
准备一个
.txt文件,每行一条原始文本,例如:二零零八年八月八日 一百二十三 早上八点半 一点二五元进入「📦 批量转换」标签页
点击「上传文件」按钮,选择准备好的文本文件
点击「批量转换」按钮
转换完成后,页面提供下载链接,点击即可获取结果文件
输出文件示例:
生成的文件名为output_YYYYMMDD_HHMMSS.txt,内容如下:
2008年08月08日 123 8:30a.m. ¥1.25这种方式可以轻松处理上千行数据,极大提升工作效率。
4. 高级设置:灵活控制转换行为
虽然默认设置已经能满足大多数场景,但FST ITN-ZH也提供了几个关键开关,让你可以根据业务需求微调转换逻辑。
4.1 转换独立数字
- 开启效果:
幸运一百→幸运100 - 关闭效果:
幸运一百→幸运一百
适用场景:如果你希望保留某些成语或固定搭配中的中文数字(如“百尺竿头”),建议关闭此选项。
4.2 转换单个数字(0-9)
- 开启效果:
零和九→0和9 - 关闭效果:
零和九→零和九
说明:控制是否将“零、一、二……九”这类单字数字进行替换。对于强调语义完整性的文本(如诗歌、教学材料),可考虑关闭。
4.3 完全转换“万”
- 开启效果:
六百万→6000000 - 关闭效果:
六百万→60万
典型用途:金融报表、数据库导入等需要纯数字字段的场景推荐开启;普通文档阅读则可保持关闭以提高可读性。
这些设置支持实时生效,修改后无需重启服务,再次点击“开始转换”即可应用新规则。
5. 支持的转换类型一览
FST ITN-ZH覆盖了中文中最常见的口语化表达形式,以下是主要支持类别及示例:
5.1 日期转换
将中文年月日表述转为标准日期格式。
输入: 二零一九年九月十二日 输出: 2019年09月12日5.2 时间表达
识别上午/下午、几点几分,并转换为12小时制带a.m./p.m.标记。
输入: 下午三点十五分 输出: 3:15p.m.5.3 数字规整
处理整数、大数单位(万、亿)、特殊读法(幺、两)等。
输入: 六百零五 输出: 605 输入: 幺三六七八九零一二三 输出: 13678901235.4 货币金额
自动添加货币符号,支持人民币、美元、欧元等。
输入: 一百美元 输出: $100 输入: 五十欧元 输出: €505.5 分数与比例
将“几分之几”结构转为数学分数形式。
输入: 三分之二 输出: 2/35.6 度量单位
结合数值与单位缩写,符合国际惯例。
输入: 三十公里 输出: 30km5.7 数学符号
处理正负号、小数点等数学表达。
输入: 正五点五 输出: +5.55.8 特殊编码:车牌号
专为中文车牌设计,仅转换数字部分,保留汉字和字母。
输入: 沪B六七八九零 输出: 沪B678906. 实战技巧分享:提升使用效率
6.1 技巧一:长文本智能识别
系统不仅能处理单一表达,还能同时识别一段话中的多个目标。
输入: 这件事发生在二零一九年九月十二日的晚上,大概八点半左右,涉及金额为一万二千元。 输出: 这件事发生在2019年09月12日的晚上,大概8:30左右,涉及金额为12000元。这使得它非常适合用于会议纪要、访谈记录、语音笔记等复杂文本的后处理。
6.2 技巧二:利用示例按钮快速测试
页面底部提供多个快捷示例按钮:
| 按钮 | 示例输入 |
|---|---|
[日期] | 二零零八年八月八日 |
[时间] | 早上八点半 |
[数字] | 一百二十三 |
[货币] | 一点二五元 |
[分数] | 五分之一 |
[度量] | 二十五千克 |
[数学] | 负二 |
[车牌] | 京A一二三四五 |
[长文本] | 二零一九年九月十二日的晚上... |
点击任意按钮,输入框会自动填充对应示例,方便快速验证功能。
6.3 技巧三:保存结果便于追溯
每次转换完成后,可点击「保存到文件」按钮,系统会将当前结果写入服务器指定目录,文件名包含时间戳,避免覆盖。
路径通常为/root/output/,命名格式如result_20250405_142310.txt,方便后续查找和归档。
7. 常见问题解答
7.1 Q:转换结果不准确怎么办?
A:请先检查输入文本是否符合标准普通话表达。若仍存在问题,尝试调整“高级设置”中的参数组合。例如关闭“转换单个数字”可能有助于保留特定语境下的原意。
7.2 Q:支持哪些数字变体?
A:系统兼容多种常见读法:
- 简体:一、二、三
- 大写:壹、贰、叁(适用于正式文书)
- 变体:幺(代表“1”)、两(代表“2”)
例如:“幺三六”可正确转为“136”,“两百”转为“200”。
7.3 Q:首次转换为什么有点慢?
A:首次加载或修改参数后,系统需重新编译FST模型,耗时约3~5秒。后续转换均为毫秒级响应,请耐心等待第一次初始化完成。
7.4 Q:能否去除版权信息?
A:不可以。开发者明确声明:“承诺永远开源使用,但必须保留以下版权信息”:
webUI二次开发 by 科哥 | 微信:312088415这是使用该镜像的前提条件,请尊重原创劳动成果。
8. 总结:轻量高效,落地无忧的中文ITN方案
FST ITN-ZH WebUI版是一款极具实用价值的中文文本归一化工具。它不仅继承了FST技术本身的高效与精准,更通过图形化界面大幅降低了使用门槛。
无论是个人用户想快速处理几段语音转写文本,还是企业需要批量清洗ASR输出数据,这款工具都能提供稳定可靠的解决方案。
它的核心优势在于:
- 零代码操作:无需编程基础,浏览器点几下就能用
- 多类型支持:涵盖日期、时间、货币、车牌等高频场景
- 批量处理能力:轻松应对千行级文本转换任务
- 本地运行安全:数据不出内网,保障隐私与合规
- 永久免费开源:社区驱动,持续更新
对于正在寻找中文ITN落地方案的团队来说,这无疑是一个值得优先尝试的选择。
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。