三天半做完一个评分系统，我重新理解了产品经理和 AI 协作

周二中午，事情突然变成三天半

这可能是我做产品经理以来，节奏最赶的一次项目。

复杂度不算夸张。真要说，评分、汇总、去掉最高最低分、算平均分，这些规则单看都不吓人。

吓人的是时间。

上周二中午快 12 点，我突然收到一个会议邀请。点进去以后，屏幕上是一页 PPT，标题大概是 AI 大赛评分规则明细。

这个 AI 大赛在公司内部已经预热了一段时间，前一天我还在飞书上刷到过相关推送，所以一开始我以为只是同步比赛规则。

听了一会儿才反应过来，不是。

我们要给下周三上午的决赛做一个评分系统。

业务希望周六就能开始试用和测试。算上当天，留给我们的时间只有三天半。

那一瞬间，我脑子里没有太多宏大想法，也来不及想什么 AI 驱动研发、产品提效、协作模式变革。很朴素，就一个念头，这东西如果真要跑起来，不能只当成一个 H5 页面做。

业务最开始说的是 H5 评分页。评委到时候用手机或者 iPad 打分。评分规则在 PPT 上，一共四大项，每个大项下面还有几个小项，加起来 100 分。领导打完分以后，后台要实时看到每个领导、每个项目的分数，知道谁打了，谁没打。最后按规则自动算总分，去掉一个最高分，去掉一个最低分，再算平均分。

第一眼，它像一个页面。

真做进去，它至少是一个轻量 Web 应用。

评委端只是前台。后面还得有后台配置参赛项目、评委、评分规则，还要让工作人员实时看打分情况。现场如果评委没及时打分，要不要提醒？评委不小心退出来，回来以后数据还在不在？比赛结束前，已经提交的分数能不能改？参赛项目临时调整，前台页面怎么同步？

这些问题不先问清楚，后面一定会漏。

所以那场会我没有花太多时间纠结能不能做完。我当时更在意的是，先把问题往下挖。

会后项目经理问我多久能出方案，我保守说下午晚点，或者明天上午。

说实话，这个时间也挺离谱。

但没办法，比赛日期摆在那里，系统要么跑起来，要么现场靠人工硬算。

周二下午，先把坑挖出来

周二中午吃完饭，我坐在工位上，先用手机和 ChatGPT 简单聊了一轮。

这一步不是让它直接写 PRD。

如果一上来就让 AI 写文档，它当然能写，而且写得还挺像那么回事。但这类需求麻烦的地方，从来不是页面上放几个评分项。

麻烦的是，那些现场才会炸出来的问题，最好在写需求的时候就先闻到一点味儿。

我先让 ChatGPT 帮我拆需求。

评委端要做什么，后台要做什么，数据从哪里来，状态怎么流转，哪些地方在现场最容易出问题。聊着聊着，问题很快就从做一个 H5 评分页，变成了一堆具体到有点烦人的细节。

比如评分活动状态怎么定义。

比赛没开始时，评委能不能提前进入评分页？评分中能不能暂停？评分结束以后，是完全不能登录，还是可以登录查看但不能继续提交？正式比赛前做过一轮测试，测试数据怎么清掉？活动锁定以后，后台还能不能再改配置？

比如评分活动和参赛项目的关系。

这次比赛里有团队、个人、不同赛道，系统里到底要不要做组别和赛道字段？同一个活动下是不是只有一套评分规则？团队和个人要不要分开排名？奖项是不是按不同组别分配？

再比如评委到底给哪些项目打分。

是每位评委都给所有项目打分，还是只给自己负责的赛道打分？外部评委和内部评委的分数权重是否一致？如果某个评委临时不能参加，之前是否影响全部提交的判断？如果某个项目临时下架，还要不要继续要求评分？

还有草稿和提交的边界。

评委填到一半退出了，后台算不算提交？评分页需不需要自动保存？提交时要不要二次确认？提交后在锁定前能不能再修改？如果评委只是打开了某个项目，填了几项分数但没提交，系统该怎么处理？

这些问题都很碎。

碎到不像什么产品亮点。

评分系统最怕的就是碎处漏水。页面做出来以后，让人抓狂的往往不是按钮放左边还是右边，而是系统不知道什么叫全部提交，不知道临时停用的评委还算不算，不知道同分时到底该不该给出最终排名。

我也在这个过程中发现，有些东西问出来以后，答案反而是这次不做。

比如同分后的最终名次。系统可以把分数算出来，也可以按分数排序，但最终名次如果涉及人工确认、奖项分配和现场展示，就不适合在这次开发里做重。

Excel 导出也是这样。

按一个完整系统的想法，导出可以做得很细，评分汇总、评分明细、提交进度、评分规则都能放进去。但越往下想越清楚，这不是三天半里最该花时间的地方。后面范围继续收口时，这个功能也被删掉了。

这些问题先被摊开，我心里才有了一个比较清楚的架子。

下午上班后，我把之前常用的 PRD 模板喂给 ChatGPT，把这次不需要的章节删掉，让它围绕这个评分系统生成一版更贴近当前任务的需求文档。中间我继续补充现场场景、评分规则、后台配置、评委端流程、异常情况，让它把细节往下写。

那天下午到 16 点半左右，我输出了一份比较完整的需求文档，里面还带了页面设计图，先当成原型用。

这版当然不完美。

甚至有点大。

但那时候我需要的不是一份优雅的 PRD，而是一份能让大家对着开刀的东西。先把盘子摆出来，哪里不做，为什么不做，大家可以现场砍。如果一开始只写几行需求，很多问题会在开发时才冒出来。

下午 17 点半左右，我和项目经理、开发同事一起过了一遍。

这次讨论里有两个调整挺关键。

一个是登录方案。

我一开始考虑把它做成飞书工作台应用，用飞书身份认证解决评委登录问题。这个方案更正规，也不用额外做账号密码。

但同事提醒，现场可能有外部评委，有些人没有公司飞书，甚至可能没有微信。

这句话一下子把方案从会议室拉回了比赛现场。

正式，不一定稳。

后来我们把它改成扫码进入 H5，选择评委姓名，输入活动密码。这样不依赖飞书，也不依赖微信，外部评委也能用。

另一个调整是后台页面。

最开始后台有点像一个完整管理系统，活动配置、评分进度、评分明细、评分结果、日志都有。开发同事建议把页面从较重的表单页简化成列表页，我脑子里马上出现了类似的画面。

现场工作人员不需要一个五脏俱全的平台。

他们要的是一眼看明白，谁交了，谁没交，哪个项目分数出来了。

周三，需求和开发一起往前挪

周三上午，项目经理一边在组会上和业务同步方案，我一边继续改设计图和需求说明。

这一天我们继续砍范围。

业务曾经提过，能不能在后台直接显示排名，并且投出来给大家看。我最后没有建议这样做。

不是做不了。

是不划算。

如果系统要直接投屏展示排名，就要考虑同分怎么办，最终排名怎么确认，展示页面好不好看，结果是否能锁定，现场切屏是否稳定。每多一层，就多一块开发和测试压力。

三天半的周期里，这个功能不该挤进来。

我建议业务从后台拿到分数后，现场用 PPT 做最终结果展示。系统只负责分数统计和排序，保证工作人员能拿到准确数据。展示效果交给 PPT，反而更稳。

这也是这次项目里反复出现的判断，不要什么都系统化。

能用现场办法解决的，就别急着写成系统功能。

周三上午到下午，我开始用一种更适合当时节奏的方式更新需求。

在云文档里按页面拆开，一边改设计图，一边在图上方补充页面逻辑。哪个页面完成了，开发同事就可以先看哪个页面。

这和传统的先写完整 PRD，再进入下一步不太一样。

我现在做需求，本来也不是先埋头写完整 PRD，再去补原型。更多时候会先和 AI 把逻辑梳清楚，把场景、边界、状态、异常先问一轮，再出原型或页面参考，最后把讨论结果沉淀成 PRD。

这次只是节奏更紧。

逻辑梳理、页面设计、需求说明、业务确认、开发理解，几件事没有办法一段一段排队，只能在同一两天里交叠着做。

当然，这种方式有前提。

第一版方案必须聊得足够细，系统边界不能散。否则边写边改就会变成一锅粥，谁都觉得自己在忙，最后谁也不知道系统到底该长什么样。

到周三下午四五点，需求基本收口。

后台最后保留两个核心菜单，活动配置和评分管理。活动配置里放基本信息、组别或赛道、评分规则、参赛项目、评委管理。评分管理页收成一张表，看每个项目的提交进度、各评委分数，以及去高去低后的平均分。

评委端也压到最核心的三步，登录页、评分首页、项目评分页。

周五晚上，系统基本跑起来

周五晚上加完班，系统基本做完了。

这次开发有两个前端同事、两个后端同事。为了赶时间，大家基本都在用 AI 辅助开发。

如果放在以前，我可能会觉得三天半做出这个东西有点玄学。

但这次回头看，速度不是某一个环节突然开挂。

前面我们先把系统边界、页面范围、评分规则、状态流转和现场风险尽量摊开；前后端同事在很短时间内把页面实现、接口逻辑、联调问题一块块处理掉；中间每个人都在用 AI，但也都没有把判断完全交出去。

它不是一个人带着 AI 单骑闯关。

更像是整个团队接受了一个现实，时间不够，就不能等所有东西都完美以后再进入下一步。该先讨论的先讨论，该先开发的先开发，该砍掉的就砍掉，该用现场办法解决的就不要硬做进系统。

我给开发同事的也不只是一份文字需求。

它有页面设计图，有字段和状态说明，有登录方式，有评分计算逻辑，也有这次明确不做的边界。

这些东西能让大家更快对齐。

开发同事用 AI 辅助实现时，也不是拿一句做个评分系统去赌。前面的页面、规则和边界越清楚，后面的实现越不容易跑散。反过来，开发过程中提出的简化建议，也会继续影响需求收口。

这次比较明显的一点是，AI 没有让团队协作消失。

它把协作的间隔压短了。

我、项目经理、前端和后端之间，不再是按阶段一个个交出去，而是在很短的时间里不断互相补位。哪里要做，哪里别做，哪个方案现场更稳，哪个方案开发成本太高，哪个问题现在必须解决，哪个问题可以交给现场流程处理。

这些判断连在一起，系统才从一个紧急需求变成了能跑的东西。

周一周二，补齐上线和现场细节

周一周二主要是推进安全检查、外网发布，以及准备现场使用。

这里又冒出一个很真实的问题。

我们最开始为了方便领导登录，考虑过一个简单密码，比如 123456。这个方案很快在渗透测试里被否掉了。后来提出几个变体，也被判定为弱密码。最后只能改成复杂密码。

复杂密码安全了，现场使用又麻烦了。

评委如果不小心退出页面，重新登录时不知道密码怎么办？总不能每次都找工作人员问。现场一忙起来，这种事最容易变成连环追问，一个人问，三个人等，工作人员还得低头翻记录。

这时已经确认现场会给每位评委发一台 iPad，也确认了设备型号，前端可以做适配。我突然想到一个办法，把每个人的登录信息做成 iPad 壁纸。

用户名就是评委姓名，密码写在壁纸上。

同事又补了一刀，把登录页添加到桌面快捷方式。这样评委如果误退出，点桌面图标就能回来，密码也在壁纸上。

这个办法一点也不高级。

但它适合现场。

如果为了这个问题再去做找回密码、短信验证、账号体系，开发成本和现场风险都会上去。壁纸这个办法土是土了点，但稳。

后来做壁纸的时候也有一个小调整。

因为当时有 10 位评委，我本来可以让 image-2 一次生成 10 张图，但试了一下，细节很难完全统一。后面评委名单还有可能调整，如果每次都让 AI 重新生成一整批图，也很浪费时间。

我最后让 AI 先生成一张空背景，再在 PS 里自己做图层。需要哪个评委，就改对应文字导出。

后面确实有评委调整。

这一下省了不少事。

很多现场问题就是这样，最后不一定靠更完整的系统解决，可能靠一张壁纸、一个快捷方式、一句更清楚的提示。产品经理如果只盯着系统功能，很容易把事情做复杂。

比赛结束后，我们补了一次复盘

比赛当天系统顺利使用。

我当时确实松了一口气。

大赛结束后，我们还做了一次团队复盘。因为这算是我们第一次在真实项目里这么深地使用 AI，产品用 ChatGPT 梳理需求，用 image-2 出页面参考和现场素材；开发基本全程使用 AI 辅助；中间又不断由人来判断范围、改方案、补风险。

复盘时大家也意识到，如果以后还要继续这样做，不能只靠个人经验和临场发挥。

团队后来整理了一版 AI 驱动开发的操作手册雏形，里面有几条我觉得很实际。

项目仓库里要提前准备 AI 可读的规范文件。让 AI 写代码前，先让它输出计划。计划要由人审核。代码也要经过 AI 预审和人工审查。如果一个 bug 连续两次让 AI 修不好，就别继续在同一个坑里耗，应该人工接管核心逻辑，再让 AI 做外围整理。

这些像流程。

但经历过这次项目以后，我反而能理解它们为什么必要。

AI 可以把速度拉上来，速度越快，质量控制越不能靠感觉。否则你只是更快地生成了一堆看似完成、没人敢真正放心用的东西。

这次之后，我多了一点产品心得

我以前也会用 AI 写文档、改文案、生成原型参考。但这次和之前不太一样。

它不是某一个环节用了 AI。

从需求澄清、页面设计、开发实现、现场素材，到最后复盘方法，AI 都参与了一遍。

这让我对产品经理的价值有了一个更具体的感受。

AI 没有让我从项目里退出来。

相反，它让很多判断更早发生。

我需要更快判断，这到底是一个 H5 页面，还是一个轻量系统。飞书认证是不是适合现场。后台结果展示要不要做重。评分规则写死还是可配置。哪些地方该做系统能力，哪些地方用一张 iPad 壁纸更合适。

这些判断都不是什么惊天动地的大判断。

但它们决定了这个项目能不能在三天半里活下来。

如果范围一路往外长，AI 再快也没用。反过来，如果边界足够清楚，团队又愿意用 AI 把执行时间压短，这种以前会让人头皮发麻的内部系统，确实可以更快跑出来。

所以这次我最深的感受，不是 AI 让我少干了很多活。

更接近一种重新分工。

AI 把产品交付链路压短了，团队要在更短的距离里一起做判断。

以前很多判断可以等需求评审、原型评审、开发联调、测试验收时慢慢暴露。

这次不行。

周二中午接到需求，周二下午就要拿出能被讨论的方案。周三要边改边让开发往前走。周五晚上系统要基本完成。周一周二还要处理上线、安全、现场使用这些问题。

整个过程中，AI 一直在帮忙。

但每一个关键转弯，还是人来判断。

这可能也是 AI 时代产品经理最需要适应的地方。别把自己训练成只会给 AI 下指令的人。更好的状态，是把需求、设计、开发、现场之间的距离看得更近一点。

距离一近，很多过去分开的东西会挤到一起。

你要更快想清楚边界，也要更快砍掉不该做的东西。你要给 AI 足够明确的上下文，也要能看出它哪里跑偏。你要懂一点开发的执行方式，也要懂现场的人到底会怎么用。

这次项目结束的时候，我确实有一种完结撒花的感觉。

但更让我记住的，是中间那些不断转弯的时刻。

飞书认证很正规，最后被我们拿掉了。后台大屏很完整，最后变成了一张表。Excel 导出一开始也被讨论过，后来还是删掉了。密码管理像是系统问题，最后用 iPad 壁纸解决了。

这些小判断连在一起，才是这个评分系统能在三天半里做完的原因。

当然，这也不是我一个人的项目。

项目经理一直在中间协调节奏，前端和后端同事用很高的投入把系统赶出来。最后几轮测试，也是开发同事和我一起一遍遍跑流程、看页面、对规则，确认现场能不能顺利用起来。

这次能按时交付，不是因为某一个人突然变强，也不是因为 AI 自动把事情做完了。

更像是一个小 team 在很短时间里，把需求、开发、测试、现场使用这些事拧到了一起。

AI 把速度抬起来。

方向、边界和最后落地，还是人一起守住的。