AI 系统越复杂,日志越重要。你需要知道用户输入了什么、模型返回了什么、哪一步超时、哪一条链路回退、哪个 key 消耗异常。
但问题也很明显:日志里可能包含用户隐私、业务规则、内部文档、系统提示和敏感数据。
所以真正困难的不是“要不要留日志”,而是“留到什么程度刚刚好”。
1. 全量原文日志很方便,也很危险
最省事的做法,是把请求和响应完整保存。但一旦进入生产,这种做法的风险会越来越高。
2. DLP 和脱敏要默认开启
更合理的方式是默认脱敏:
- Authorization header 永不明文落盘
- 邮箱、手机号、身份证等字段自动识别
- 系统提示中的密钥和内部链接做 masking
- 某些字段只保留摘要
3. 采样比全量更可持续
不是所有请求都要完整保留。高风险任务、失败请求、回退请求、异常高成本请求,更适合提高采样率;普通成功请求只留结构化日志即可。
4. 排障视角和安全视角要分层
开发者需要知道哪一步出错,但不一定需要看到完整敏感内容。
因此可以把日志拆成两层:
- 结构化层:请求 ID、模型、token、延迟、错误码
- 受控原文层:仅授权人员可见
5. 中转站层最适合做统一日志策略
如果每个应用都自己决定日志格式和脱敏规则,最后一定会越来越乱。
统一入口能把日志治理集中起来,像 https://top-api.cc 这样的中转层更适合承接统一 DLP、字段屏蔽、采样和权限隔离。
结语
AI 日志不是留得越多越好,也不是越少越安全。关键在于:默认脱敏、结构化优先、异常请求重点保留、原文访问有权限边界。平衡做对了,排障和安全才不会互相拖后腿。
Leave a Reply