news 2026/4/23 11:50:14

有限自动机与正规式之间的相互转换是形式语言与自动机理论中的核心内容,广泛应用于编译器设计中的词法分析阶段

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
有限自动机与正规式之间的相互转换是形式语言与自动机理论中的核心内容,广泛应用于编译器设计中的词法分析阶段

有限自动机与正规式之间的相互转换是形式语言与自动机理论中的核心内容,广泛应用于编译器设计中的词法分析阶段。以下是对两个转换方向的系统化总结和说明:


1.有限自动机转换为正规式(NFA → 正规式)

目标:给定一个 NFA $ M $,求一个正规式 $ R $,使得 $ L® = L(M) $。

步骤详解

  1. 扩展状态图

    • 添加一个新的初始状态 $ x $ 和一个新的终止状态 $ y $。
    • 从 $ x $ 到原初态引一条 $ \varepsilon $-转移弧。
    • 从每一个原终态到 $ y $ 引一条 $ \varepsilon $-转移弧。
    • 确保整个自动机只有一个初态 $ x $ 和一个终态 $ y $。
  2. 逐步消除中间状态

    • 每次选择一个非 $ x $、非 $ y $ 的状态 $ q $ 进行消除。
    • 对于所有进入 $ q $ 的弧(如 $ p \xrightarrow{R_1} q $)和所有从 $ q $ 出发的弧(如 $ q \xrightarrow{R_2} r $),以及 $ q $ 上可能存在的自环 $ R_3 $:
      • 在 $ p $ 和 $ r $ 之间添加新弧:$ p \xrightarrow{R_1 R_3^* R_2} r $。
    • 若已有从 $ p $ 到 $ r $ 的路径,则使用“选择”运算合并:$ R_{\text{new}} = R_{\text{old}} | R_1 R_3^* R_2 $。
    • 删除状态 $ q $ 及其所有关联的边。
  3. 最终结果

    • 当只剩 $ x $ 和 $ y $ 时,若存在 $ x \xrightarrow{R} y $,则 $ R $ 即为所求正规式。
    • 如果没有路径,则正规式为 $ \varnothing $。

消除规则归纳

  • 串联:$ a \xrightarrow{R_1} b \xrightarrow{R_2} c $ → $ a \xrightarrow{R_1R_2} c $
  • 并联:$ a \xleftarrow[R_2]{R_1} b $ → $ a \xrightarrow{R_1|R_2} b $
  • 自环处理:涉及状态 $ b $ 有自环 $ R_2 $,前后分别为 $ R_1, R_3 $,则变为 $ a \xrightarrow{R_1 R_2^* R_3} c $

2.正规式转换为有限自动机(正规式 → NFA)

目标:给定正规式 $ R $,构造等价的 NFA $ M $,满足 $ L(M) = L® $。

方法:通常采用Thompson 构造法

步骤详解

  1. 初始结构

    • 构造一个仅含两个状态的状态图:初态 $ x $、终态 $ y $,中间以标记为 $ R $ 的弧连接:$ x \xrightarrow{R} y $。
  2. 递归分解正规式结构

    • 根据正规式的三种基本运算进行拆分:
(1)连接运算 $ R = R_1 R_2 $
  • 原结构:$ x \xrightarrow{R_1 R_2} y $
  • 拆分方式:引入中间状态 $ k $
  • 新结构:$ x \xrightarrow{R_1} k \xrightarrow{R_2} y $
(2)选择运算 $ R = R_1 | R_2 $
  • 原结构:$ x \xrightarrow{R_1 | R_2} y $
  • 拆分方式:从 $ x $ 分两条路径分别经 $ R_1、、R_2 $ 到达 $ y $
  • 或引入辅助状态,通过 $ \varepsilon $-转移实现分支
(3)闭包运算 $ R = R_1^$*:
  • 原结构:$ x \xrightarrow{R_1^*} y $

  • 拆分方式:引入新状态 $ k $

  • 结构:
    $ x \xrightarrow{\varepsilon} k $,
    $ k \xrightarrow{R_1} k $(自环),
    $ k \xrightarrow{\varepsilon} y $

  • 实现零次或多次匹配。

  1. 重复上述过程,直到所有弧上的标记都变成单个字符或 $ \varepsilon $,此时得到的就是合法的 NFA。

  2. 输出 NFA:该 NFA 接受的语言与原始正规式相同。


✅ 应用场景与意义(知识点用途)

  • 词法分析器自动生成
    • 编程语言的关键字、标识符、常量等词汇模式可用正规式描述。
    • 工具(如 Lex)将这些正规式转换为 NFA → 转换为 DFA → 最小化 → 生成词法分析代码。
  • 正则表达式引擎实现基础
    • 多数现代编程语言中regex的底层机制基于自动机构造。
  • 形式化验证与模式匹配系统
    • 如网络入侵检测、文本编辑器搜索功能等。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/4/23 11:47:40

Dify变量作用域管理PyTorch模型输入输出参数

Dify变量作用域管理PyTorch模型输入输出参数 在现代AI工程实践中,一个看似微不足道的变量命名或作用域设计,往往会在大规模训练任务中演变为难以追踪的显存泄漏、状态污染甚至服务崩溃。尤其是在使用GPU加速的深度学习场景下,每一次张量的创建…

作者头像 李华
网站建设 2026/4/23 11:47:35

python Manim 制作科普动画!

📘 Manim 动画脚本说明文档:排列公式可视化 P(5, 3) 1. 脚本简介 (What is this?) 这是一个基于 Python Manim 引擎编写的数学可视化脚本。 它的核心目的是直观演示排列公式 (Permutation) 的推导过程,具体案例为 P(5,3)P(5,3),即“从 5 个人中选出 3 个人排座次”。 …

作者头像 李华
网站建设 2026/4/23 11:50:09

YOLOv10官方镜像上线!适配最新CUDA 12.4驱动

YOLOv10官方镜像上线!适配最新CUDA 12.4驱动 在工业视觉系统不断追求“更快、更准、更稳”的今天,一个看似微小的技术组合——YOLOv10 CUDA 12.4,正在悄然改变AI部署的边界。这不仅是版本号的简单更新,而是一次从算法设计到硬件…

作者头像 李华
网站建设 2026/4/18 3:12:57

基于ISODATA改进算法的负荷场景曲线聚类:风光场景生成新利器

基于ISODATA改进算法的负荷场景曲线聚类(适用于风光场景生成) 摘要:代码主要做的是一种基于改进ISODATA算法的负荷场景曲线聚类,代码中,主要做了四种聚类算法,包括基础的K-means算法、ISODATA算法、L-ISODA…

作者头像 李华
网站建设 2026/4/21 3:40:30

一站式AI开发环境:PyTorch + Jupyter + SSH远程访问

一站式AI开发环境:PyTorch Jupyter SSH远程访问 在深度学习项目日益复杂的今天,一个稳定、高效且易于协作的开发环境,往往决定了团队能否快速推进实验、验证想法并落地模型。现实中,许多开发者仍面临“环境配置耗时数天”“本地…

作者头像 李华