docs/knowledge development
Summary
为 Typeless 构建个性化语音识别词典,挖掘知识库专业术语并批量导入 181 个词条
Outcomes
从知识库中挖掘并整理了 8 个分类的专业术语,创建可复用的词库文件。开发了自动化脚本,成功导入 181 个词条到 Typeless,修复了代理拦截和 md 解析问题,并记录了完整的 API 使用和踩坑细节。
Learnings
- Typeless API 的 User-Agent 检查是隐蔽的(不返回错误而是空数据),Python urllib 默认 UA 会被静默拒绝
- macOS 代理设置影响本地 127.0.0.1 连接,需要 no_proxy 环境变量绕过 — 适用于所有本地调试场景
- CDP 删除操作需要 UUID(user_dictionary_id)而不是 term,逆向工程时需要先查询获取 ID
- md 文件解析需要显式过滤注释行(> 开头)和分隔符(---),否则被误导入为词条
Files Modified (7)
- /Users/tianli/.claude/projects/-Users-tianli-docs-knowledge/memory/MEMORY.md
- /Users/tianli/.claude/projects/-Users-tianli-docs-knowledge/memory/feedback_proxy_localhost.md
- /Users/tianli/.claude/projects/-Users-tianli-docs-knowledge/memory/feedback_typeless_pitfalls.md
- /Users/tianli/.claude/projects/-Users-tianli-docs-knowledge/memory/project_typeless_dictionary.md
- /Users/tianli/.claude/projects/-Users-tianli-docs-knowledge/memory/reference_typeless_api.md
- /Users/tianli/Dev/scripts/scripts/tools/typeless_batch_add.py
- /Users/tianli/docs/knowledge/typeless-dictionary.md