news 2026/4/23 12:41:33

算法题 匹配子序列的单词数

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
算法题 匹配子序列的单词数

匹配子序列的单词数

问题描述

给定字符串s和一个字符串数组words,返回wordss的子序列的单词数目。

子序列:通过删除s中的一些字符(也可以不删除)而不改变剩余字符相对位置所形成的新字符串。

示例

输入: s = "abcde", words = ["a","bb","acd","ace"] 输出: 3 解释: 有三个单词是s的子序列:"a","acd","ace"。

算法思路

暴力

  • 对每个单词都从头开始在s中匹配
  • 时间复杂度:O(words.length × s.length × avg_word_length)
  • 对于大量重复单词会重复计算

方法

  1. 预处理 + 二分查找:为每个字符预处理其在s中的位置,然后对每个单词使用二分查找
  2. 多指针:为每个单词维护一个指针,同时遍历s
  3. 缓存:使用哈希表缓存已计算的结果,避免重复单词的重复计算

代码实现

方法一:预处理 + 二分查找

importjava.util.*;classSolution{/** * 使用预处理和二分查找判断子序列 * * @param s 源字符串 * @param words 单词数组 * @return 是s的子序列的单词数目 */publicintnumMatchingSubseq(Strings,String[]words){// 1: 预处理 - 为每个字符记录其在s中出现的所有位置List<Integer>[]positions=newList[26];for(inti=0;i<26;i++){positions[i]=newArrayList<>();}for(inti=0;i<s.length();i++){positions[s.charAt(i)-'a'].add(i);}// 2: 使用缓存避免重复计算Map<String,Boolean>cache=newHashMap<>();intcount=0;// 3: 对每个单词判断是否为子序列for(Stringword:words){if(cache.containsKey(word)){if(cache.get(word)){count++;}continue;}booleanisSubseq=isSubsequence(word,positions);cache.put(word,isSubseq);if(isSubseq){count++;}}returncount;}/** * 使用二分查找判断单词是否为子序列 * * @param word 待检查的单词 * @param positions 字符位置预处理数组 * @return true表示是子序列,false表示不是 */privatebooleanisSubsequence(Stringword,List<Integer>[]positions){intprevIndex=-1;// 上一个匹配字符在s中的位置for(charc:word.toCharArray()){List<Integer>charPositions=positions[c-'a'];// 如果字符c在s中不存在,直接返回falseif(charPositions.isEmpty()){returnfalse;}// 二分查找第一个大于prevIndex的位置intleft=0,right=charPositions.size();while(left<right){intmid=left+(right-left)/2;if(charPositions.get(mid)<=prevIndex){left=mid+1;}else{right=mid;}}// 如果没有找到合适的位置if(left==charPositions.size()){returnfalse;}// 更新prevIndex为找到的位置prevIndex=charPositions.get(left);}returntrue;}}

方法二:多指针

importjava.util.*;classSolution{/** * 使用多指针判断子序列 * 为每个单词维护一个指针,同时遍历s */publicintnumMatchingSubseq(Strings,String[]words){// 使用缓存避免重复计算Map<String,Integer>wordCount=newHashMap<>();for(Stringword:words){wordCount.put(word,wordCount.getOrDefault(word,0)+1);}// 为每个唯一单词创建指针Map<String,Integer>pointers=newHashMap<>();for(Stringword:wordCount.keySet()){pointers.put(word,0);}intmatchedCount=0;// 遍历s的每个字符for(charc:s.toCharArray()){// 复制需要更新的单词列表List<String>toRemove=newArrayList<>();// 检查每个单词的当前指针位置for(Stringword:pointers.keySet()){intptr=pointers.get(word);if(ptr<word.length()&&word.charAt(ptr)==c){ptr++;pointers.put(word,ptr);// 如果单词完全匹配if(ptr==word.length()){matchedCount+=wordCount.get(word);toRemove.add(word);}}}// 移除已完全匹配的单词for(Stringword:toRemove){pointers.remove(word);}}returnmatchedCount;}}

方法三:优化二分查找

importjava.util.*;classSolution{/** * 使用Collections.binarySearch优化的二分查找 */publicintnumMatchingSubseq(Strings,String[]words){// 预处理字符位置List<Integer>[]positions=newList[26];for(inti=0;i<26;i++){positions[i]=newArrayList<>();}for(inti=0;i<s.length();i++){positions[s.charAt(i)-'a'].add(i);}Map<String,Boolean>cache=newHashMap<>();intcount=0;for(Stringword:words){if(cache.computeIfAbsent(word,w->isSubsequenceOptimized(w,positions))){count++;}}returncount;}privatebooleanisSubsequenceOptimized(Stringword,List<Integer>[]positions){intprevIndex=-1;for(charc:word.toCharArray()){List<Integer>list=positions[c-'a'];if(list.isEmpty())returnfalse;// 使用Collections.binarySearch找到插入位置intpos=Collections.binarySearch(list,prevIndex+1);if(pos<0){pos=-pos-1;// 转换为插入位置}if(pos>=list.size()){returnfalse;}prevIndex=list.get(pos);}returntrue;}}

方法四:暴力

importjava.util.*;classSolution{/** * 暴力双指针,使用缓存优化 */publicintnumMatchingSubseq(Strings,String[]words){Map<String,Boolean>cache=newHashMap<>();intcount=0;for(Stringword:words){if(cache.computeIfAbsent(word,w->isSubsequenceBrute(s,w))){count++;}}returncount;}privatebooleanisSubsequenceBrute(Strings,Stringword){inti=0,j=0;while(i<s.length()&&j<word.length()){if(s.charAt(i)==word.charAt(j)){j++;}i++;}returnj==word.length();}}

算法分析

  • 时间复杂度

    • 预处理 + 二分查找:O(s.length + (word.length × log(s.length)))
    • 多指针:O(s.length × unique_words_count)
    • 暴力(带缓存):O(s.length × unique_words_count)
  • 空间复杂度

    • 预处理 + 二分查找:O(s.length + unique_words_count)
    • 多指针:O(unique_words_count × avg_word_length)
    • 暴力:O(unique_words_count × avg_word_length)

算法过程

1:s = “abcde”, words = [“a”,“bb”,“acd”,“ace”]

预处理

  • positions[‘a’] = [0]
  • positions[‘b’] = [1]
  • positions[‘c’] = [2]
  • positions[‘d’] = [3]
  • positions[‘e’] = [4]

单词检查

  1. “a”

    • 字符’a’:在positions[0]中找> -1的位置 → 找到0
    • 完全匹配
  2. “bb”

    • 第一个’b’:在positions[1]中找> -1的位置 → 找到1
    • 第二个’b’:在positions[1]中找> 1的位置 → 未找到
  3. “acd”

    • ‘a’:找到位置0,prevIndex=0
    • ‘c’:在positions[2]中找> 0的位置 → 找到2,prevIndex=2
    • ‘d’:在positions[3]中找> 2的位置 → 找到3,prevIndex=3
    • 完全匹配
  4. “ace”

    • ‘a’:找到位置0,prevIndex=0
    • ‘c’:找到位置2,prevIndex=2
    • ‘e’:在positions[4]中找> 2的位置 → 找到4,prevIndex=4
    • 完全匹配

结果:3个单词匹配

测试用例

publicstaticvoidmain(String[]args){Solutionsolution=newSolution();// 测试用例1:标准示例String[]words1={"a","bb","acd","ace"};System.out.println("Test 1: "+solution.numMatchingSubseq("abcde",words1));// 3// 测试用例2:重复单词String[]words2={"a","a","a"};System.out.println("Test 2: "+solution.numMatchingSubseq("abcde",words2));// 3// 测试用例3:空单词String[]words3={""};System.out.println("Test 3: "+solution.numMatchingSubseq("abcde",words3));// 1// 测试用例4:无匹配String[]words4={"bb","cb","bd"};System.out.println("Test 4: "+solution.numMatchingSubseq("abcde",words4));// 0// 测试用例5:完全匹配String[]words5={"abcde"};System.out.println("Test 5: "+solution.numMatchingSubseq("abcde",words5));// 1// 测试用例6:长字符串StringlongS="abcdefghijklmnopqrstuvwxyz";String[]words6={"ace","xyz","aeiou","bcdfg"};System.out.println("Test 6: "+solution.numMatchingSubseq(longS,words6));// 4// 测试用例7:单字符sString[]words7={"a","b","c"};System.out.println("Test 7: "+solution.numMatchingSubseq("a",words7));// 1// 测试用例8:大量重复单词String[]words8=newString[5000];Arrays.fill(words8,"ace");System.out.println("Test 8: "+solution.numMatchingSubseq("abcde",words8));// 5000// 测试用例9:边界情况String[]words9={"a","z"};System.out.println("Test 9: "+solution.numMatchingSubseq("a",words9));// 1// 测试用例10:空sString[]words10={"a",""};System.out.println("Test 10: "+solution.numMatchingSubseq("",words10));// 1 (只有空字符串匹配)}

关键点

  1. 缓存

    • words数组可能包含大量重复单词
    • 缓存可以将时间复杂度从 O(total_words) 降低到 O(unique_words)
  2. 二分查找

    • 预处理每个字符的位置,避免重复遍历s
    • 对于长s和短单词,效率提升
  3. 子序列

    • 不需要连续,必须保持相对顺序
    • 空字符串是任何字符串的子序列
  4. 字符位置

    • 使用 ArrayList 存储每个字符的所有位置
    • 位置天然有序,适合二分查找
  5. 边界情况处理

    • 空字符串、单字符、重复字符等特殊情况
    • 字符在s中不存在的情况

常见问题

  1. 为什么需要缓存?

    • words可能包含重复单词
    • 不缓存会导致重复计算,效率低下
  2. 二分查找?

    • 找第一个大于prevIndex的位置
    • 确保字符的相对顺序正确
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/3 15:11:31

FaceFusion支持ONNX格式导出:跨框架部署更灵活

FaceFusion支持ONNX格式导出&#xff1a;跨框架部署更灵活 在AI视觉应用日益普及的今天&#xff0c;人脸替换技术已不再局限于实验室或高端影视制作&#xff0c;而是逐步渗透到短视频、直播、社交娱乐乃至企业级数字人系统中。然而&#xff0c;一个长期困扰开发者的难题始终存在…

作者头像 李华
网站建设 2026/4/4 14:43:38

FaceFusion在房地产虚拟看房中的角色扮演应用

FaceFusion在房地产虚拟看房中的角色扮演应用 在售楼处的互动大屏前&#xff0c;一位购房者上传了自己的照片&#xff0c;几秒后&#xff0c;屏幕中的虚拟导览员突然“变脸”——那张熟悉的脸正微笑着向他介绍客厅的采光设计。他忍不住凑近屏幕&#xff1a;“这真的是我住在这里…

作者头像 李华
网站建设 2026/4/23 11:31:54

Oscar多模态预训练模型:从入门到实战完整指南

Oscar多模态预训练模型&#xff1a;从入门到实战完整指南 【免费下载链接】Oscar Oscar and VinVL 项目地址: https://gitcode.com/gh_mirrors/os/Oscar Oscar&#xff08;Object-Semantics Aligned Pre-training&#xff09;是由微软开发的开源多模态预训练框架&#x…

作者头像 李华
网站建设 2026/4/23 11:35:57

还在为显存不足发愁?Open-AutoGLM动态内存分配黑科技来了

第一章&#xff1a;显存焦虑时代的技术破局在大模型训练与推理需求爆发的当下&#xff0c;GPU显存已成为制约AI研发效率的关键瓶颈。面对动辄数百GB的模型参数&#xff0c;传统全量加载方式已难以为继&#xff0c;开发者亟需从算法、框架与硬件协同层面寻找新的突破口。模型并行…

作者头像 李华
网站建设 2026/4/23 9:58:49

独家揭秘:Open-AutoGLM上线前不外传的5层校验机制,确保零误差输入

第一章&#xff1a;Open-AutoGLM输入准确率的核心挑战 在大规模语言模型应用中&#xff0c;Open-AutoGLM的输入准确率直接影响推理结果的可靠性。尽管该模型具备强大的语义理解能力&#xff0c;但其性能高度依赖于输入数据的质量与结构一致性。当输入存在噪声、歧义或格式偏差时…

作者头像 李华
网站建设 2026/4/20 10:06:00

Open-AutoGLM前后台任务调度(从异步处理到实时反馈全流程拆解)

第一章&#xff1a;Open-AutoGLM 前后台操作协同机制Open-AutoGLM 作为一个支持自动化大语言模型任务调度的开源框架&#xff0c;其前后台协同机制是系统高效运行的核心。该机制通过标准化接口与异步通信策略&#xff0c;实现前端用户操作与后端任务引擎之间的无缝衔接。请求处…

作者头像 李华