邢东尼:团队日报自动汇总
筛日报1.5小时→5分钟,风险发现从事后复盘提前到1-2天预警
场景故事
张伟|团队Leader
“周一早上,一打开钉钉,247条未读直接傻眼。李四说’快完了’,王五说’小问题’,赵六说’有点慢’——全是模棱两可的废话,听了等于没听。
每天硬着头皮花1.5小时翻那些日报,我是团队Leader,不是能掐会算的算命先生。”
赵六|后端工程师
“周四随口提了一句’数据库有点慢’,当时觉得不严重,没当回事。
结果周五下午,直接死锁了!服务整整炸了2小时,12个人火急火燎地救火到凌晨2点,烧了¥4,800的人民币,心疼死了。
周一复盘会上,CTO黑着脸点名批张伟’风险管理形同虚设’,场面一度尴尬到脚趾抠地。我也没想到会炸成这样……真是悔得肠子都青了。”
CTO|技术负责人
“每天1.5小时筛日报,每周3小时写周报,一个月下来等于白瞎2.4个工作日。花这么多时间精力,风险还不是照样漏得稀里哗啦?
自从上了AI辅助系统:筛日报只要5分钟,还能提前1-2天预警风险,周报15分钟轻松搞定,效率直接起飞。我就纳了闷了:这么香的操作,为什么不早点用?“
效果展示

八格表单
1. 什么时候用?(触发时刻)
- 团队日报消息混杂日报、闲聊、表情包,Leader每天要花大块时间人工筛选
- 日报充满”快了""差不多”等模糊表述,风险信号被淹没在流水账里
- 需要把风险发现从”周五复盘”提前到”当天预警”
- 需要为团队周报提供可追溯、可量化的原始数据,而不是凭印象总结
2. 做出来是什么?给谁?(目标产出)
三大交付物:
- 日报评分卡(Markdown ≤200字):总分/四维度/扣分点/≤3条改进建议
- 结构化JSON(可解析):固定字段,可自动化处理
- 团队周报:Top3进展 + Top3风险 + 协作清单
效率对比:
| 维度 | 传统方式 | 自动化后 | 提升 |
|---|---|---|---|
| 筛日报 | 1.5小时 | 5分钟 | 18倍 |
| 写周报 | 3小时 | 15分钟 | 12倍 |
| 风险发现 | 事后复盘 | 提前1-2天 | 实时预警 |
数据来源:2026年2月3日-9日连续7天抽样;统计口径 = 从打开群到发出评分卡的时间戳差。
3. 需要准备什么?(输入清单)
必需输入(3项):
- 团队成员当日日报(Markdown格式优先,纯文本亦可)
- 团队规模数字(如”12人”)
- 协作平台名称(飞书/钉钉/企业微信)
日报质量标准(5W2H模板):
【项目名】任务名称
• 进度:X%→Y%(+增量%)
• 今日完成:具体成果(量化数据)
• 明日计划:具体任务,预计完成度→Z%
• 风险/求助:具体问题,已@谁,期望响应时间
好日报 vs 烂日报:
| 类型 | 特征 | 示例 |
|---|---|---|
| ✅ 好 | 有【项目名】+ 进度增量 + 量化数据 | 【用户中心重构】70%→85%,响应时间500ms→200ms |
| ❌ 烂 | 无标签 + 模糊表述≥3次 + 流水账 | ”今天做了一些工作,快了,差不多,感觉挺累” |
4. 怎么跟AI说?(提示词模板|BTCAE完整版)
操作前必读:将 {团队规模} 和 {协作平台} 替换成实际信息,再整体复制到AI对话框。
示例:{团队规模} → 12人;{协作平台} → 飞书
变量表:
| 变量 | 含义 | 可选值/示例 | 默认值 |
|---|---|---|---|
{团队规模} | 数字+单位 | 12人;可选3-30人 | 10人 |
{协作平台} | 团队所用IM工具 | 飞书/钉钉/企业微信/Slack | 飞书 |
{日报内容} | 待评分的日报文本 | 1条或多条日报文本 | 1条 |
核心提示词(可直接复制):
B (Background)
你是项目管理专家,服务{团队规模}技术团队。团队每天通过{协作平台}提交日报,但消息混杂日报、闲聊、表情包,Leader需人工筛选,平均耗时1.5小时。日报质量参差不齐,大量"快了""差不多"等模糊表述,风险信号经常被淹没。你的任务:将非结构化日报转化为结构化数据,实现风险早发现、协作早响应。
T (Task)
对日报进行质量评分(满分100分),生成改进建议。子任务:识别模糊表述、检测流水账、计算进度偏差、风险等级判定。
C (Constraints)
• 评分按四维度打分:完整性30分+清晰度30分+结构化20分+反内卷20分
• 反内卷维度量化规则:
• 20分满分:只记录可交付成果/计划/风险/求助,不记录情绪与加班叙事
• 出现主观感受/情绪词每条-5分(如'好累/很烦/加班到9点');最多扣到0分
• 白名单词汇不扣分:'阻塞/风险/报警/熔断/中断/回滚'等技术风险词
• 所有扣分必须引用原文原句,并标注行号:
• 若用户未提供行号,你先给每行自动加前缀L1/L2/...后再引用
• 引用格式:L3: "登录模块快完了"
• 不得编造原文没有的数据
• 评分卡不超过200字,改进建议不超过3条
• 质量红线:模糊表述≥3次→总分<60分
• 禁用词:赋能、抓手、闭环、生态、方法论、一站式、全方位、赛道、降本增效、拉通、综上所述、总体来看、多维度、协同效应
• 句式:短句优先(≤20字/句),动词开头
A (Acceptance)
【输出规则】严格按以下顺序输出3个二级标题,不要插入其它标题:
Part1 评分表(1个Markdown表格 + 改进建议1-3条,合计≤200字)
| 维度 | 得分 | 扣分原因(引用原文) |
|---|---|---|
| 完整性 | /30 | |
| 清晰度 | /30 | |
| 结构化 | /20 | |
| 反内卷 | /20 | |
| 总分 | /100 |
改进建议(≤3条):
1.
2.
3.
Part2 模糊表述清单(0-N条列表,每条格式:Lx: "..." → "...")
• Lx: "原文片段" → "具体表述"
Part3 JSON(仅1个json代码块,必须可解析)
{
"user": "unknown",
"date": "YYYY-MM-DD",
"score": 0,
"dimensions": {
"completeness": 0,
"clarity": 0,
"structure": 0,
"anti_involution": 0
},
"risk_level": "P2",
"deduction_items": [],
"ambiguous_terms": [],
"needs_help": false,
"help_targets": [],
"source_quotes": []
}
risk_level判定规则:
• P0:出现"阻塞/中断/无法上线/回滚/数据丢失/安全"等,或明确影响线上且给出时间点
• P1:依赖方未响应>24h、性能/稳定性指标恶化>30%、进度偏差>20%
• P2:其余一般问题/信息缺失但未指向明确风险
协作请求识别规则:必须同时包含"@某人"+"期望响应日期"才算协作请求。单纯的"感谢@某人"不算。
输出后自检:
□ 总分和四维度分数已输出
□ 每个扣分引用了原文具体位置(含行号)
□ 改进建议≤3条且每条是可执行动作
□ 评分卡字数≤200字
□ 未使用禁用词
□ JSON格式正确且所有字段完整
□ risk_level仅为P0/P1/P2之一
E (Example)
示例1:问题日报(47分)
用户输入:
请对以下日报进行评分:
今天上午参加了需求评审会,下午和产品讨论了方案,晚上又开了技术评审会,加班到9点,感觉挺累的……
AI输出(结构清单:Part1表格1个 + Part2列表2条 + Part3 JSON 1个):
Part1 评分表
| 维度 | 得分 | 扣分原因(引用原文) |
|---|---|---|
| 完整性 | 15/30 | L1缺项目名、进度百分比、量化成果 |
| 清晰度 | 10/30 | L1"讨论了方案"无具体输出 |
| 结构化 | 7/20 | L1流水账式叙述,无结构 |
| 反内卷 | 15/20 | L1"加班到9点"(-3分)、"感觉挺累的"(-2分) |
| 总分 | 47/100 |
改进建议:
1. 用"输出X页文档,完成度Y%"替换"讨论了方案"
2. 每个任务加上【项目名】标签
3. 删掉"加班到9点""感觉挺累"等主观感受
Part2 模糊表述清单
• L1: "讨论了方案" → 改为"输出方案文档3页,覆盖2个核心流程"
• L1: "感觉挺累的" → 删除,日报不记录主观感受
Part3 JSON
{
"user": "unknown",
"date": "2026-02-10",
"score": 47,
"dimensions": {
"completeness": 15,
"clarity": 10,
"structure": 7,
"anti_involution": 15
},
"risk_level": "P2",
"deduction_items": ["缺量化数据", "无进度百分比", "记流水账", "含情绪表述"],
"ambiguous_terms": ["讨论了方案", "感觉挺累的"],
"needs_help": false,
"help_targets": [],
"source_quotes": ["今天上午参加了需求评审会", "下午和产品讨论了方案", "晚上又开了技术评审会"]
}
示例2:优秀日报(92分)
用户输入:
请对以下日报进行评分:
【用户中心重构】性能优化
• 进度:70%→85%(+15%)
• 今日完成:数据库查询优化,响应时间从500ms降至200ms
• 明日计划:接口缓存改造,预计完成度→95%
• 风险:Redis集群扩容需DBA支持,2月9日已@张三,待响应
AI输出(结构清单:Part1表格1个 + Part2列表0条 + Part3 JSON 1个):
Part1 评分表
| 维度 | 得分 | 扣分原因(引用原文) |
|---|---|---|
| 完整性 | 30/30 | 无扣分 |
| 清晰度 | 28/30 | L5"待响应"缺预计响应时间 |
| 结构化 | 20/20 | 无扣分 |
| 反内卷 | 14/20 | L5协作请求缺升级机制(-6分) |
| 总分 | 92/100 |
改进建议:
1. L5"2月9日已@张三,待响应"改为"2月9日已@张三,预计2月11日前响应,超时升级Leader"
Part2 模糊表述清单
(无)
Part3 JSON
{
"user": "unknown",
"date": "2026-02-10",
"score": 92,
"dimensions": {
"completeness": 30,
"clarity": 28,
"structure": 20,
"anti_involution": 14
},
"risk_level": "P1",
"deduction_items": ["协作请求缺预计响应时间"],
"ambiguous_terms": [],
"needs_help": true,
"help_targets": ["@张三"],
"source_quotes": ["Redis集群扩容需DBA支持,2月9日已@张三"]
}
现在,请对以下日报进行评分:{日报内容}
失败提示词对照
❌ 原句:帮我评价一下这个日报写得怎么样
🔍 失败原因:缺少评分维度、输出格式、约束条件,AI会输出主观感想而非结构化评分卡。
✅ 修正:使用本卡片完整BTCAE提示词,明确4维度评分规则 + JSON输出格式 + 禁用词清单。
5. 具体怎么操作?(步骤拆解|MVP 5分钟跑通)
| 步骤 | 动作 |
|---|---|
| 1 | 复制上方提示词完整代码块 |
| 2 | 替换2个变量:{团队规模} 和 {协作平台} |
| 3 | 打开ChatGPT/Kimi/豆包/通义千问任一 |
| 4 | 粘贴替换后的提示词 + 一条团队日报 |
| 5 | 查看结果:评分表 + 模糊表述清单 + JSON |
| 6 | 复制”改进建议”发给对应成员 |
预期耗时:首次10分钟,后续每次2分钟。
跑通MVP后,再考虑自动化部署(见第8点”以后能自动吗”)。
6. 怎么算做完?(验收标准)
- 评分准确率≥80%:每周抽样10条对比人工评分,误差≤5分
- 协作请求召回率≥90%:漏报数÷总协作请求数;误报率低于10%
- 播报卡每日18:05准时推送:允许±2分钟误差
- 周报生成耗时不超过15分钟:从触发到推送完成
- 周报数据可追溯:标注【来源:姓名,日期日报】
7. 出错了怎么办?(失败排查)
| 错误类型 | 触发条件 | 处理方式 |
|---|---|---|
| 日报缺失 | 18:05某成员未提交 | 自动@提醒 |
| 格式错误 | 日报无法解析 | 标记【待确认】附原因 |
| AI服务故障 | API调用失败 | 重试3次,失败降级到模板手工评分 |
| 评分争议 | 成员不认可评分 | 回复”复核评分”触发人工处理 |
| 协作误报 | ”感谢@“被识别为协作 | 回复”非协作请求”反馈优化 |
人工介入条件:【待确认】>5个、P0风险出现、评分争议>3次/周。
8. 以后能自动吗?(升级路径)
Agent化潜力评估
| 维度 | 评分 | 说明 |
|---|---|---|
| 频率 | 5/5 | 每天18:05 |
| 稳定性 | 4/5 | 输出固定三段:评分表/清单/JSON |
| 数据依赖 | 4/5 | 仅依赖群消息文本,少量配置项 |
| 风险等级 | 3/5 | 误报会影响协作,但可人工复核 |
四象限结论:高频 × 高风险——半自动,人工审批后执行
一句话建议:先自动生成草稿与@提醒,P0/P1风险必须人工确认后再群播报;连续2周误报率低于10%后再逐步放权。
高手心法
心法一:风险发现的价值 = 提前量 × 影响面
日报自动化的本质不是”省时间”,是把风险发现时间从周五复盘前置到当天18:05。提前2天发现一个P1阻塞,省下的不是2天工时,是整条依赖链的连锁延期。
心法二:好提示词是从”烂case的吐槽”翻译出来的
好约束条件是”愤怒的翻译”——把你对烂日报的每一句吐槽,翻译成一条扣分规则。
心法三:新工具推广先找”最挑剔的人”做压力测试
第一周让3个最爱提意见的人试用。他们能找到的问题,上线后100个人也会遇到。你需要的是在可控范围内暴露缺陷,不是在全员面前翻车。
扩展资源:自动化部署方案(可选)
如需全自动化部署(每日18:00自动触发、周五生成周报),可参考以下技术方案:
| 阶段 | 内容 | 耗时 |
|---|---|---|
| Day 1 | 创建数据表 + 准备10条样本日报 | 6小时 |
| Day 2 | 选大模型API + 创建Bot + 测试样本 + 配置定时触发 | 8小时 |
| Day 3 | 全流程测试 + 影子模式运行3天 + 正式上线 | 4小时 |
技术与成本:
- 大模型API:DeepSeek/通义千问/文心一言/Kimi
- 成本:≤¥50/月(30条×500tokens/条×¥0.001/1K tokens×30天)