news 2026/6/10 16:46:50

中文分词模拟器

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
中文分词模拟器

题目描述

给定一个连续不包含空格字符的字符串,该字符串仅包含英文小写字母及英文标点符号(逗号、句号、分号),同时给定词库,对该字符串进行精确分词。

说明:

  • 精确分词:字符串分词后,不会出现重叠。例如 "ilovechina",不同切分后可得到 "i", "love", "china"。

  • 标点符号不分词,仅用于断句。

  • 词库:根据常识及词库统计出来的常用词汇。例如:dictionary={"i","love","china","ilovechina","lovechina"}。

  • 分词原则:采用分词顺序优先且最长匹配原则。“ilovechina”,假设分词结果[i,ilove,lo,love,ch,china,lovechina] 则输出 [ilove,china]

    • 错误输出:[i, lovechina],原因:"ilove" > 优先于 "lovechina" 成词。

    • 错误输出:[i, love, china],原因:"ilove" > "i",遵循最长匹配原则。

输入描述

  1. 字符串长度限制:0 < length < 256
  2. 词库长度限制:0 < length < 100000
  3. 第一行输入待分词语句 "ilovechina"
  4. 第二行输入中文词库 "i, love, china, ch, na, ve, lo, this, is, the, word"

输出描述

按顺序输出分词结果 "i, love, china"

示例一

输入:
ilovechina
i,love,china,ch,na,ve,lo,this,is,the,word

输出:
i,love,china

说明:
输入的字符串被按最长匹配原则分为 "i", "love", "china"。

示例二

输入:
ilovech
i,love,china,ch,na,ve,lo,this,is,the,word

输出:
i,love,ch

说明:
输入的字符串被按最长匹配原则分为 "i", "love", "ch"。

示例三

输入:

iat
i,love,china,ch,na,ve,lo,this,is,the,word,beauti,tiful,ful
输出:

i a,t

代码思路

2024华为OD机试真题---中文分词模拟器-CSDN博客

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/10 14:05:27

【Git学习】Git分支的多人协作

单一分支的多人协作创建testGit1本地与远程仓库修改本地仓库local的级别的用户名和邮箱$ git config --local user.name 鲁智深$ git config --local user.mail luzhishen126.com项目克隆把远程项目克隆到本地形成一个本地仓库&#xff1a;git clone 远程仓库HTTP此时克隆下来的…

作者头像 李华
网站建设 2026/6/10 14:03:38

【R语言高手进阶指南】:5步搞定农业产量的复杂数据建模

第一章&#xff1a;Shell脚本的基本语法和命令Shell脚本是Linux/Unix系统中自动化任务的核心工具&#xff0c;通过编写可执行的文本文件&#xff0c;用户能够组合命令、控制流程并处理数据。一个典型的Shell脚本以“shebang”开头&#xff0c;用于指定解释器。脚本的起始声明 所…

作者头像 李华
网站建设 2026/6/10 14:04:17

永磁同步电机滑模观测器Simulink搭建模型探索

永磁同步电机滑模观测器simulink搭建模型&#xff08;3种&#xff09;&#xff0c;附参考论文。 模型中有用锁相环或低通滤波器提取电角度和电角速度。在永磁同步电机&#xff08;PMSM&#xff09;的控制领域&#xff0c;滑模观测器&#xff08;SMO&#xff09;因其对参数变化和…

作者头像 李华
网站建设 2026/6/10 14:03:38

day33打卡

浙大疏锦行

作者头像 李华
网站建设 2026/6/9 18:57:21

RN性能优化实战:从卡顿到丝滑的进阶之路

RN性能优化实战&#xff1a;从卡顿到丝滑的进阶之路 在前一篇文章中&#xff0c;我们掌握了RN的跨端适配技巧&#xff0c;能够保证应用在多设备上的一致性显示。但实际开发中&#xff0c;随着应用功能增多&#xff0c;常会出现列表卡顿、页面加载缓慢、内存泄漏等性能问题&…

作者头像 李华
网站建设 2026/6/10 14:58:43

MyBatis-Plus代码生成器

MyBatis-Plus代码生成器 MyBatis-Plus代码生成器生成结果 MyBatis-Plus 代码生成器是 MP 提供的自动化代码生成工具&#xff0c;核心是基于数据库表结构&#xff0c;通过配置一键生成符合 MP 规范的全套分层代码&#xff08;包含实体类、Mapper 接口、Mapper XML、Service 层、…

作者头像 李华