返回文章列表
2026.05.22

三天半做完一个评分系统,我重新理解了产品经理和 AI 协作

三天半做完一个评分系统以后,我更清楚地感觉到:AI 把速度抬起来,但方向、边界和最后落地,还是人一起守住的。

周二中午,事情突然变成三天半

这可能是我做产品经理以来,节奏最赶的一次项目。

复杂度不算夸张。真要说,评分、汇总、去掉最高最低分、算平均分,这些规则单看都不吓人。

吓人的是时间。

上周二中午快 12 点,我突然收到一个会议邀请。点进去以后,屏幕上是一页 PPT,标题大概是 AI 大赛评分规则明细。

这个 AI 大赛在公司内部已经预热了一段时间,前一天我还在飞书上刷到过相关推送,所以一开始我以为只是同步比赛规则。

听了一会儿才反应过来,不是。

我们要给下周三上午的决赛做一个评分系统。

业务希望周六就能开始试用和测试。算上当天,留给我们的时间只有三天半。

那一瞬间,我脑子里没有太多宏大想法,也来不及想什么 AI 驱动研发、产品提效、协作模式变革。很朴素,就一个念头,这东西如果真要跑起来,不能只当成一个 H5 页面做。

业务最开始说的是 H5 评分页。评委到时候用手机或者 iPad 打分。评分规则在 PPT 上,一共四大项,每个大项下面还有几个小项,加起来 100 分。领导打完分以后,后台要实时看到每个领导、每个项目的分数,知道谁打了,谁没打。最后按规则自动算总分,去掉一个最高分,去掉一个最低分,再算平均分。

第一眼,它像一个页面。

真做进去,它至少是一个轻量 Web 应用。

评委端只是前台。后面还得有后台配置参赛项目、评委、评分规则,还要让工作人员实时看打分情况。现场如果评委没及时打分,要不要提醒?评委不小心退出来,回来以后数据还在不在?比赛结束前,已经提交的分数能不能改?参赛项目临时调整,前台页面怎么同步?

这些问题不先问清楚,后面一定会漏。

所以那场会我没有花太多时间纠结能不能做完。我当时更在意的是,先把问题往下挖。

会后项目经理问我多久能出方案,我保守说下午晚点,或者明天上午。

说实话,这个时间也挺离谱。

但没办法,比赛日期摆在那里,系统要么跑起来,要么现场靠人工硬算。

周二下午,先把坑挖出来

周二中午吃完饭,我坐在工位上,先用手机和 ChatGPT 简单聊了一轮。

这一步不是让它直接写 PRD。

如果一上来就让 AI 写文档,它当然能写,而且写得还挺像那么回事。但这类需求麻烦的地方,从来不是页面上放几个评分项。

麻烦的是,那些现场才会炸出来的问题,最好在写需求的时候就先闻到一点味儿。

我先让 ChatGPT 帮我拆需求。

评委端要做什么,后台要做什么,数据从哪里来,状态怎么流转,哪些地方在现场最容易出问题。聊着聊着,问题很快就从做一个 H5 评分页,变成了一堆具体到有点烦人的细节。

比如评分活动状态怎么定义。

比赛没开始时,评委能不能提前进入评分页?评分中能不能暂停?评分结束以后,是完全不能登录,还是可以登录查看但不能继续提交?正式比赛前做过一轮测试,测试数据怎么清掉?活动锁定以后,后台还能不能再改配置?

比如评分活动和参赛项目的关系。

这次比赛里有团队、个人、不同赛道,系统里到底要不要做组别和赛道字段?同一个活动下是不是只有一套评分规则?团队和个人要不要分开排名?奖项是不是按不同组别分配?

再比如评委到底给哪些项目打分。

是每位评委都给所有项目打分,还是只给自己负责的赛道打分?外部评委和内部评委的分数权重是否一致?如果某个评委临时不能参加,之前是否影响全部提交的判断?如果某个项目临时下架,还要不要继续要求评分?

还有草稿和提交的边界。

评委填到一半退出了,后台算不算提交?评分页需不需要自动保存?提交时要不要二次确认?提交后在锁定前能不能再修改?如果评委只是打开了某个项目,填了几项分数但没提交,系统该怎么处理?

这些问题都很碎。

碎到不像什么产品亮点。

评分系统最怕的就是碎处漏水。页面做出来以后,让人抓狂的往往不是按钮放左边还是右边,而是系统不知道什么叫全部提交,不知道临时停用的评委还算不算,不知道同分时到底该不该给出最终排名。

我也在这个过程中发现,有些东西问出来以后,答案反而是这次不做。

比如同分后的最终名次。系统可以把分数算出来,也可以按分数排序,但最终名次如果涉及人工确认、奖项分配和现场展示,就不适合在这次开发里做重。

Excel 导出也是这样。

按一个完整系统的想法,导出可以做得很细,评分汇总、评分明细、提交进度、评分规则都能放进去。但越往下想越清楚,这不是三天半里最该花时间的地方。后面范围继续收口时,这个功能也被删掉了。

这些问题先被摊开,我心里才有了一个比较清楚的架子。

下午上班后,我把之前常用的 PRD 模板喂给 ChatGPT,把这次不需要的章节删掉,让它围绕这个评分系统生成一版更贴近当前任务的需求文档。中间我继续补充现场场景、评分规则、后台配置、评委端流程、异常情况,让它把细节往下写。

那天下午到 16 点半左右,我输出了一份比较完整的需求文档,里面还带了页面设计图,先当成原型用。

这版当然不完美。

甚至有点大。

但那时候我需要的不是一份优雅的 PRD,而是一份能让大家对着开刀的东西。先把盘子摆出来,哪里不做,为什么不做,大家可以现场砍。如果一开始只写几行需求,很多问题会在开发时才冒出来。

下午 17 点半左右,我和项目经理、开发同事一起过了一遍。

这次讨论里有两个调整挺关键。

一个是登录方案。

我一开始考虑把它做成飞书工作台应用,用飞书身份认证解决评委登录问题。这个方案更正规,也不用额外做账号密码。

但同事提醒,现场可能有外部评委,有些人没有公司飞书,甚至可能没有微信。

这句话一下子把方案从会议室拉回了比赛现场。

正式,不一定稳。

后来我们把它改成扫码进入 H5,选择评委姓名,输入活动密码。这样不依赖飞书,也不依赖微信,外部评委也能用。

另一个调整是后台页面。

最开始后台有点像一个完整管理系统,活动配置、评分进度、评分明细、评分结果、日志都有。开发同事建议把页面从较重的表单页简化成列表页,我脑子里马上出现了类似的画面。

现场工作人员不需要一个五脏俱全的平台。

他们要的是一眼看明白,谁交了,谁没交,哪个项目分数出来了。

周三,需求和开发一起往前挪

周三上午,项目经理一边在组会上和业务同步方案,我一边继续改设计图和需求说明。

这一天我们继续砍范围。

业务曾经提过,能不能在后台直接显示排名,并且投出来给大家看。我最后没有建议这样做。

不是做不了。

是不划算。

如果系统要直接投屏展示排名,就要考虑同分怎么办,最终排名怎么确认,展示页面好不好看,结果是否能锁定,现场切屏是否稳定。每多一层,就多一块开发和测试压力。

三天半的周期里,这个功能不该挤进来。

我建议业务从后台拿到分数后,现场用 PPT 做最终结果展示。系统只负责分数统计和排序,保证工作人员能拿到准确数据。展示效果交给 PPT,反而更稳。

这也是这次项目里反复出现的判断,不要什么都系统化。

能用现场办法解决的,就别急着写成系统功能。

周三上午到下午,我开始用一种更适合当时节奏的方式更新需求。

在云文档里按页面拆开,一边改设计图,一边在图上方补充页面逻辑。哪个页面完成了,开发同事就可以先看哪个页面。

这和传统的先写完整 PRD,再进入下一步不太一样。

我现在做需求,本来也不是先埋头写完整 PRD,再去补原型。更多时候会先和 AI 把逻辑梳清楚,把场景、边界、状态、异常先问一轮,再出原型或页面参考,最后把讨论结果沉淀成 PRD。

这次只是节奏更紧。

逻辑梳理、页面设计、需求说明、业务确认、开发理解,几件事没有办法一段一段排队,只能在同一两天里交叠着做。

当然,这种方式有前提。

第一版方案必须聊得足够细,系统边界不能散。否则边写边改就会变成一锅粥,谁都觉得自己在忙,最后谁也不知道系统到底该长什么样。

到周三下午四五点,需求基本收口。

后台最后保留两个核心菜单,活动配置和评分管理。活动配置里放基本信息、组别或赛道、评分规则、参赛项目、评委管理。评分管理页收成一张表,看每个项目的提交进度、各评委分数,以及去高去低后的平均分。

评委端也压到最核心的三步,登录页、评分首页、项目评分页。

周五晚上,系统基本跑起来

周五晚上加完班,系统基本做完了。

这次开发有两个前端同事、两个后端同事。为了赶时间,大家基本都在用 AI 辅助开发。

如果放在以前,我可能会觉得三天半做出这个东西有点玄学。

但这次回头看,速度不是某一个环节突然开挂。

前面我们先把系统边界、页面范围、评分规则、状态流转和现场风险尽量摊开;前后端同事在很短时间内把页面实现、接口逻辑、联调问题一块块处理掉;中间每个人都在用 AI,但也都没有把判断完全交出去。

它不是一个人带着 AI 单骑闯关。

更像是整个团队接受了一个现实,时间不够,就不能等所有东西都完美以后再进入下一步。该先讨论的先讨论,该先开发的先开发,该砍掉的就砍掉,该用现场办法解决的就不要硬做进系统。

我给开发同事的也不只是一份文字需求。

它有页面设计图,有字段和状态说明,有登录方式,有评分计算逻辑,也有这次明确不做的边界。

这些东西能让大家更快对齐。

开发同事用 AI 辅助实现时,也不是拿一句做个评分系统去赌。前面的页面、规则和边界越清楚,后面的实现越不容易跑散。反过来,开发过程中提出的简化建议,也会继续影响需求收口。

这次比较明显的一点是,AI 没有让团队协作消失。

它把协作的间隔压短了。

我、项目经理、前端和后端之间,不再是按阶段一个个交出去,而是在很短的时间里不断互相补位。哪里要做,哪里别做,哪个方案现场更稳,哪个方案开发成本太高,哪个问题现在必须解决,哪个问题可以交给现场流程处理。

这些判断连在一起,系统才从一个紧急需求变成了能跑的东西。

周一周二,补齐上线和现场细节

周一周二主要是推进安全检查、外网发布,以及准备现场使用。

这里又冒出一个很真实的问题。

我们最开始为了方便领导登录,考虑过一个简单密码,比如 123456。这个方案很快在渗透测试里被否掉了。后来提出几个变体,也被判定为弱密码。最后只能改成复杂密码。

复杂密码安全了,现场使用又麻烦了。

评委如果不小心退出页面,重新登录时不知道密码怎么办?总不能每次都找工作人员问。现场一忙起来,这种事最容易变成连环追问,一个人问,三个人等,工作人员还得低头翻记录。

这时已经确认现场会给每位评委发一台 iPad,也确认了设备型号,前端可以做适配。我突然想到一个办法,把每个人的登录信息做成 iPad 壁纸。

用户名就是评委姓名,密码写在壁纸上。

同事又补了一刀,把登录页添加到桌面快捷方式。这样评委如果误退出,点桌面图标就能回来,密码也在壁纸上。

这个办法一点也不高级。

但它适合现场。

如果为了这个问题再去做找回密码、短信验证、账号体系,开发成本和现场风险都会上去。壁纸这个办法土是土了点,但稳。

后来做壁纸的时候也有一个小调整。

因为当时有 10 位评委,我本来可以让 image-2 一次生成 10 张图,但试了一下,细节很难完全统一。后面评委名单还有可能调整,如果每次都让 AI 重新生成一整批图,也很浪费时间。

我最后让 AI 先生成一张空背景,再在 PS 里自己做图层。需要哪个评委,就改对应文字导出。

后面确实有评委调整。

这一下省了不少事。

很多现场问题就是这样,最后不一定靠更完整的系统解决,可能靠一张壁纸、一个快捷方式、一句更清楚的提示。产品经理如果只盯着系统功能,很容易把事情做复杂。

比赛结束后,我们补了一次复盘

比赛当天系统顺利使用。

我当时确实松了一口气。

大赛结束后,我们还做了一次团队复盘。因为这算是我们第一次在真实项目里这么深地使用 AI,产品用 ChatGPT 梳理需求,用 image-2 出页面参考和现场素材;开发基本全程使用 AI 辅助;中间又不断由人来判断范围、改方案、补风险。

复盘时大家也意识到,如果以后还要继续这样做,不能只靠个人经验和临场发挥。

团队后来整理了一版 AI 驱动开发的操作手册雏形,里面有几条我觉得很实际。

项目仓库里要提前准备 AI 可读的规范文件。让 AI 写代码前,先让它输出计划。计划要由人审核。代码也要经过 AI 预审和人工审查。如果一个 bug 连续两次让 AI 修不好,就别继续在同一个坑里耗,应该人工接管核心逻辑,再让 AI 做外围整理。

这些像流程。

但经历过这次项目以后,我反而能理解它们为什么必要。

AI 可以把速度拉上来,速度越快,质量控制越不能靠感觉。否则你只是更快地生成了一堆看似完成、没人敢真正放心用的东西。

这次之后,我多了一点产品心得

我以前也会用 AI 写文档、改文案、生成原型参考。但这次和之前不太一样。

它不是某一个环节用了 AI。

从需求澄清、页面设计、开发实现、现场素材,到最后复盘方法,AI 都参与了一遍。

这让我对产品经理的价值有了一个更具体的感受。

AI 没有让我从项目里退出来。

相反,它让很多判断更早发生。

我需要更快判断,这到底是一个 H5 页面,还是一个轻量系统。飞书认证是不是适合现场。后台结果展示要不要做重。评分规则写死还是可配置。哪些地方该做系统能力,哪些地方用一张 iPad 壁纸更合适。

这些判断都不是什么惊天动地的大判断。

但它们决定了这个项目能不能在三天半里活下来。

如果范围一路往外长,AI 再快也没用。反过来,如果边界足够清楚,团队又愿意用 AI 把执行时间压短,这种以前会让人头皮发麻的内部系统,确实可以更快跑出来。

所以这次我最深的感受,不是 AI 让我少干了很多活。

更接近一种重新分工。

AI 把产品交付链路压短了,团队要在更短的距离里一起做判断。

以前很多判断可以等需求评审、原型评审、开发联调、测试验收时慢慢暴露。

这次不行。

周二中午接到需求,周二下午就要拿出能被讨论的方案。周三要边改边让开发往前走。周五晚上系统要基本完成。周一周二还要处理上线、安全、现场使用这些问题。

整个过程中,AI 一直在帮忙。

但每一个关键转弯,还是人来判断。

这可能也是 AI 时代产品经理最需要适应的地方。别把自己训练成只会给 AI 下指令的人。更好的状态,是把需求、设计、开发、现场之间的距离看得更近一点。

距离一近,很多过去分开的东西会挤到一起。

你要更快想清楚边界,也要更快砍掉不该做的东西。你要给 AI 足够明确的上下文,也要能看出它哪里跑偏。你要懂一点开发的执行方式,也要懂现场的人到底会怎么用。

这次项目结束的时候,我确实有一种完结撒花的感觉。

但更让我记住的,是中间那些不断转弯的时刻。

飞书认证很正规,最后被我们拿掉了。后台大屏很完整,最后变成了一张表。Excel 导出一开始也被讨论过,后来还是删掉了。密码管理像是系统问题,最后用 iPad 壁纸解决了。

这些小判断连在一起,才是这个评分系统能在三天半里做完的原因。

当然,这也不是我一个人的项目。

项目经理一直在中间协调节奏,前端和后端同事用很高的投入把系统赶出来。最后几轮测试,也是开发同事和我一起一遍遍跑流程、看页面、对规则,确认现场能不能顺利用起来。

这次能按时交付,不是因为某一个人突然变强,也不是因为 AI 自动把事情做完了。

更像是一个小 team 在很短时间里,把需求、开发、测试、现场使用这些事拧到了一起。

AI 把速度抬起来。

方向、边界和最后落地,还是人一起守住的。