实战:用 Claude Skills 搞定多表合并与数据清洗
01. 痛点场景:混乱的数据源
假设你面临这样一个典型的“高血压”需求:
“把这三张表(糖尿病患者随访数据)合并成一张标准的分析表,统一日期格式、性别、病名,并剔除重复的‘张伟’。”
表1 内分泌科-老王录入版
ID,Name,Gender,Visit_Date,Diagnosis,HbA1c 1001,张伟,男,2024.01.15,2型糖尿病,7.5% 1002,王芳,女,2024.01.16,T2DM,6.8 % 1003,李娜,Female,2024.02.01,1型糖尿病, 1004,刘强,男,2024.02.10,T2DM,8.2%表2 社区门诊-小李录入版
ID,Name,Sex,Date,Type,Value 2001,陈杰,M,2024/1/20,二型糖,6.5 ,,,,, 2002,杨敏,F,2024/2/14,Pre-diabetes,5.9 2003,赵强,M,2024/03/05,正常,5.2 2004,孙丽,F,24/3/12,2型,9.1表3 急诊留观-补录版
Patient_ID,Patient_Name,Gender,Check_Time,Disease,HbA1c_Level 1001,张伟,Male,2024-01-15,Type 2 Diabetes,7.5 3001,吴刚,男,2024-04-01,糖尿病酮症,11.2 3002,郑华,女,2024-04-02,T2DM, 3003,周梅,女,2024-04-05,2型糖尿病,6.402. 工程师的解法 (The Skill Workflow)
利用 Skill,我们不需要手写 Python 脚本,只需要直接对话,让 LLM 自主决策并执行。
Step 1: 定义规则 (requirements.md)
读取当前目录下所有的 csv 文件。请帮我执行以下清洗任务,并生成一个最终文件 final_clean_data.xlsx: 合并数据:将三份数据合并,统一表头为 [ID, Name, Gender, Date, Diagnosis, HbA1c]。 清洗日期:将所有日期格式统一为标准的 YYYY-MM-DD。 标准化术语: Gender: 统一为 "Male/Female"。 Diagnosis: 只要包含“2型”、“二型”、“T2DM”、“Type 2”,一律统一为 "T2DM"。 清洗数值:去掉 HbA1c 中的 % 符号,转为纯数字。 去重与排序:如果 ID 重复,保留日期最新的那条;最后按日期排序。Step 2: 下达指令
在终端直接输入:
# 语法结构:/技能名称 [具体的执行指令]/xlsx 按照 requirements.md 对当前文件夹下的所有 .csv 文件进行清洗合并Step 3: 最终交付结果
可以看出,Skill 完整地按照自然语言的要求完成了清洗任务。
03. Skill 安装说明 (SOP)
Step 1: 获取 Skill
找到你想用的 Skill 文件夹(例如本例中的xlsx工具)。
Step 2: 安装
- 项目级安装(推荐):复制到当前项目根目录下的
.claude/skills文件夹即可。 - 全局安装:将 Skill 文件夹复制到
~/.claude/skills(Mac/Linux) 或相应的用户目录下。
04. Skill 使用方式
在 Claude Code 终端内,主要有三种调用逻辑:
显式调用:
使用/xlsx(或其他 Skill 名称) 唤起对应工具,随后输入具体指令。自动触发:
在日常对话中直接描述需求,Claude 会根据语义自动判断并调用已安装的工具。长期记忆植入 (Project Context):
在项目根目录的CLAUDE.md文件中提及这些技能,使其成为 Claude 的项目常识。示例:在
CLAUDE.md中写入:Always refer to the skills in .claude/skills/ when refactoring code.
05. 更多细节与参考
- 官方文档:Claude Agent Skills Overview
- TRAE 深度解析:TRAE 对 SKILLS 的详细介绍
- 官方博客:Skills Explained - Claude Blog
- 实践指南:Official Best Practices
- 官方仓库:GitHub - anthropics/skills
- 社区推荐:
- Humanizer-zh (去 AI 味工具)
- VideoCut-skills (视频剪辑工具)
如果这篇文章对你有帮助,欢迎关注(wx同号)。
如果你在配置 Skill 的过程中遇到任何问题,或者有更好的实战场景建议,欢迎随时私信沟通,我很乐意收到你的反馈。
我将持续分享 AI 工程化、Agent 实战及算法应用相关的深度内容。我们下期见。