spaCy 是一个用于 Python 高级自然语言处理的开源库。本视频展示了如何在 spaCy 中创建一个自定义的实体链接模型,以将文本中提及的“Emerson”消歧到知识库中的唯一标识符。这是通过在 Prodigy 中从头标注一些文本数据来训练一个机器学习模型实现的。您可以按照这个笔记本来操作:代码库链接。
步骤详解
- 00:00– 实体链接挑战简介
- 04:52– 设置知识库
- 10:30– 使用 Prodigy 标注训练数据
- 19:19– 将训练数据解析为 spaCy 所需的格式
- 23:12– 创建并训练实体链接组件
- 25:36– 在未见数据上测试实体链接组件
SPACY & PRODIGY
- spaCy: spaCy官网
- 免费在线课程: 课程链接
- Prodigy 网站与文档: Prodigy官网
本教程相关资源
- 代码与数据: 项目代码库
- spaCy 中的实体链接(spaCy IRL 讲座): 相关讲座视频
- 实体链接文档: 官方文档
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)