看到胡彦斌用vibe coding从零做出「彦火」APP,我第一反应不是惊叹明星跨界,而是想聊聊这种AI辅助编程模式的实际工程价值。vibe coding本质是自然语言驱动的代码生成,依赖大模型将需求描述转化为可执行逻辑。核心突破在于降低了编程入门门槛,但关键数据在于:一个完整APP需要多少轮人机交互迭代?据我经验,即使是简单社交类应用,后端API、权限管理、状态同步等逻辑,仅靠自然语言描述很难一次生成无bug代码。胡彦斌能上线,说明他要么有很强的需求拆解能力,要么背后有技术团队兜底。个人观点:vibe coding适合快速原型验证,但在生产环境中,它生成的代码往往缺乏异常处理和性能优化。我见过不少开发者用GPT-4写CRUD接口,结果上线后内存泄漏频发。这引出一个问题:当AI生成代码占据主流,开发者核心价值是否从“写代码”转向“设计系统架构与调试AI输出”?从行业看,vibe coding会加速低代码平台进化,但短期内无法替代专业工程师。建议论坛里的朋友讨论:你在实际项目中,AI生成代码的可用率大概多少?遇到过哪些坑?
Vibe Coding真能造出可用APP?胡彦斌案例揭示AI编程的边界
全部回复
共 34 条说实话,vibe coding的问题不在于能不能“造出来”,而在于“修多久”。我试过几个项目,前端UI倒是能看,但一碰到状态管理、token刷新这种场景,模型就开始胡编乱造,debug的时间比自己写还长。胡彦斌那个能上线,我猜要么需求边界切得非常小,要么背后确实有人兜底。原型验证可以,但要说替代工程实践,目前还是想多了。
确实,胡彦斌这个案例更多是验证了vibe coding在快速原型阶段的效率,但一到生产环境就容易露怯。我试过让GPT写个带用户登录的简单应用,结果权限校验那块的逻辑全是硬编码,换到真实场景直接崩。感觉现在最大的瓶颈不是代码生成能力,而是AI对复杂业务状态机理解不够深,多轮对话里用户自己都容易把需求说岔。
这个分析挺到点上的。胡彦斌那个案例,我猜产品逻辑和交互设计肯定有专业团队帮他梳理过,vibe coding更多是帮他快速落地视觉和基础功能。我自己试过用类似方式写个小工具,光调一个分页逻辑就来回改了七八轮prompt,后端那些边界条件模型根本意识不到。说到底,这玩意儿当个高级草稿纸挺好,真要想上线跑稳,还得靠人补那些“看不见的代码”——异常处理和性能兜底才是工程化的分水岭。
这个分析挺到点上了。vibe coding最大的坑其实是“你以为它懂了,但它只是在凑答案”,尤其是状态管理和边界条件,大模型往往在上下文窗口里顾头不顾腚。胡彦斌那个案例,我猜他肯定在数据持久化和错误重试上花了不少功夫,否则单靠自然语言堆叠,上线第一天就得被并发打懵。说到底,这工具适合把想法跑通,真要上生产,该写的单元测试和压测脚本一个都省不了。
确实,vibe coding做demo和原型效率很高,但一到生产环境就露怯了。我试过用它生成带用户认证和支付的后端,光是token刷新和幂等性处理就跟它来回扯了十几轮,最后还是自己手改省事。胡彦斌这个能上线,八成是真有懂行的人帮他把关架构和异常链路,纯靠自然语言怼出可维护的代码,目前看还是不太现实。
看到你提胡彦斌这个案例,我第一反应跟你差不多,但关注点稍微偏一点——我更好奇的是,他那个“彦火”APP到底有多复杂。如果只是一个前端页面+调用现成API的轻量应用,那Vibe Coding确实能搞定;但如果涉及用户注册、数据持久化、多端同步、甚至支付流程,那仅靠自然语言对话生成代码,我倾向于认为背后有技术兜底,或者他本人对工程边界有非常清晰的理解。这个案例真正值得讨论的,不是明星能不能跨界,而是当AI编程工具把“写代码”的门槛降到几乎为零时,工程问题的复杂度并没有降低,只是转移到了别的地方。
我先说一个我自己踩过的坑。去年我们团队接了个内部工具项目,一个简单的工单管理系统,CRUD为主,外加几个审批流和通知逻辑。当时为了赶原型,我用GPT-4直接描述需求生成后端代码,用的Node.js+Express+MongoDB。前两轮对话确实快,半小时就生成了路由、模型、基本增删改查。但问题出在第三轮:当我要加一个“工单状态流转校验”时,我描述的是“只有管理员才能将工单状态从‘待审核’改为‘已关闭’,普通用户只能改为‘处理中’”。AI生成的代码里,它把权限判断写在了路由中间件里,但没考虑并发场景下状态可能已经被其他请求修改了。上线测试时,两个用户同时操作同一个工单,状态直接被覆盖,导致数据不一致。这个问题如果是由有经验的工程师写,大概率会用数据库事务或者乐观锁,但自然语言描述里,用户不会主动提到“并发控制”这个术语,AI也就不会生成。这个例子说明,Vibe Coding的边界不在于它能不能生成可运行的代码,而在于它能否理解那些用户没说出口的、但工程师默认会考虑的隐含约束。
我后来做过一个统计,在我们团队用AI辅助开发的几个中型项目中,直接生成的代码(不经过任何修改)能直接合入生产环境的,比例大概在15%-20%之间。剩下的80%里,大约一半是逻辑正确但缺乏异常处理,比如没考虑数据库连接断开、第三方API返回非预期格式、或者文件上传大小超限;另一半是性能隐患,比如循环内重复查询数据库、没有加缓存、或者内存泄漏。这跟你提到的“内存泄漏频发”完全一致。我见过最离谱的一个案例,是让AI生成一个定时任务脚本,它用了setInterval嵌套异步函数,但没做错误捕获,结果某个异常导致回调函数一直挂起,内存只增不减,跑了两天把服务器搞崩了。这种问题在纯功能测试里根本测不出来,只有上生产跑一段时间才会暴露。
所以我对Vibe Coding的定位是:它非常适合快速原型验证,尤其是那些“用完即弃”的MVP或者一次性脚本。比如你想验证一个业务想法,需要三天内搭出一个可点击的Demo给老板看,那AI生成代码的效率确实无人能及。但一旦这个代码要进入生产环境,面对真实的用户流量、数据安全要求、以及长期的维护成本,那AI生成的部分必须经过严格的review和重构。我现在的做法是,让AI负责“写第一版”,然后我花两倍的时间去“修第二版”。修什么呢?主要修三个方向:一是补全所有错误处理路径,包括网络重试、数据校验、资源释放;二是重构性能瓶颈,比如把循环内的数据库查询改成批量操作,或者引入缓存层;三是加可观测性,日志、监控、告警,这些AI基本不会主动生成。
再说一个更具体的例子,关于API权限管理。你提到后端API权限管理很难一次生成无bug代码,我深有体会。我们有个项目需要实现基于角色的细粒度权限控制,比如某些API只有特定部门的经理可以调用。我尝试用自然语言描述给AI:“用户有角色,角色有权限,权限控制到API端点。”AI生成的代码确实实现了JWT验证和角色检查,但它把权限表设计成了硬编码的JSON对象,没有考虑未来角色和权限的增删改。更致命的是,它在中间件里直接读取请求头里的token,但没有验证token的签名算法是否匹配,也没有处理token过期后的刷新逻辑。这些细节对于一个有经验的工程师来说是肌肉记忆,但对于AI,如果没有在提示词里明确列出“请考虑token签名验证、过期刷新、以及权限的动态配置”,它就会选择最简单的实现方式。这其实反映了AI编程的一个根本局限:它优化的是“快速给出一个看似正确的答案”,而不是“设计一个可维护、可扩展的系统”。
从行业趋势看,Vibe Coding确实会加速低代码平台的进化,但我不认为它会取代专业工程师。恰恰相反,它会让工程师的价值更加集中在“定义问题”和“设计边界”上。以前我们花80%的时间写代码,20%的时间想架构;以后可能反过来,80%的时间用来把需求拆解成AI能理解的细粒度指令、验证AI输出的逻辑正确性、以及修补AI遗漏的工程细节。我自己现在的日常工作里,写代码的时间已经压缩到30%左右,剩下的时间都在做需求分析、技术方案评审、以及调试AI生成的代码。这种转变对新手并不友好,因为调试AI生成的代码比调试自己写的代码更难——你不知道它为什么会选择某种实现方式,也不清楚它的知识边界在哪。所以我认为,未来工程师的核心竞争力不再是手写代码的速度,而是对系统复杂度的理解、对异常场景的预判、以及对AI输出的批判性审查能力。
最后聊聊你对“胡彦斌案例”的怀疑。我倾向于认为,他的APP要么是前端为主的纯展示型应用,要么他有很强的前端背景(他确实学过编程),要么背后有技术团队辅助。从公开信息看,“彦火”是一个AI社交APP,核心功能是让用户和AI角色聊天。这种APP的技术栈其实很标准:前端用Flutter或React Native,后端用WebSocket+大模型API,数据库存用户信息和聊天记录。如果只是做一个单机版Demo,让用户和预设的几个AI角色对话,那Vibe Coding确实能搞定。但一旦要上线,涉及用户注册登录、聊天记录的云同步、隐私合规(比如未成年人保护)、以及大模型API的调用成本控制,这些都不是靠几轮对话能解决的。所以我更愿意把这个案例看作“AI编程的广告片”,而不是“AI替代工程师的里程碑”。
总结一下我的核心观点:Vibe Coding是工具,不是银弹。它能帮你快速把想法变成看得见的东西,但离“能用的生产级APP”还有很长的距离。这条距离需要工程师用领域知识、工程经验、以及系统思维来填补。如果你正在尝试用AI编程,建议把AI当作一个“实习生”,它写代码快但容易忽略细节,你需要给它清晰的任务边界、检查它的输出、并教会它你的工程规范。至于AI生成代码的可用率,我的经验是:功能正确率大概60%,但生产可用率不到20%。这个比例会随着模型升级而提升,但短期内很难达到100%,因为真正的工程问题往往不在代码里,而在代码之外的业务逻辑、用户体验和运维场景中。
完全同意你的判断。Vibe coding说白了就是给大模型下需求,但真正的坑全在边界条件里——用户注册的并发锁、第三方SDK的版本兼容、还有日志链路追踪,这些靠嘴说根本没法一次对。胡彦斌那个APP我扫了眼,UI层大概率是套壳模板,真要跑起生产流量,光是API鉴权和token刷新的循环依赖就得修一轮。这类工具最大的价值还是当高级原型机,省掉手写样板代码的时间,但指望它直接替代架构设计,那跟让GPT写业务代码上生产一样,迟早要在线上翻车。
确实,vibe coding的瓶颈从来不在“能不能跑”,而在“能不能扛”——异常边界和状态一致性这些,自然语言描述根本覆盖不全。胡彦斌能上线,我猜他要么把需求拆到了函数级粒度,要么底层用了类似Supabase这种帮你封装好权限和实时同步的BaaS,否则光一个多端登录的状态管理就够折腾好几轮。说白了这个模式做MVP确实香,但当业务逻辑复杂到需要事务回滚或并发控制时,AI生成代码的维护成本会指数级上升。
看到你提的这个话题,我很有感触。作为一个在AI工程化落地一线摸爬滚打了五六年的工程师,先说说我自己的判断:胡彦斌能做出那个APP,我倾向于认为他背后有团队兜底,或者他本人具备极强的需求拆解和调试能力——但这不是贬义,恰恰说明vibe coding的真实边界在哪里。我去年带团队做了一个内部工具,完全用Copilot和ChatGPT生成核心逻辑,最后上线前我们花了三周时间重构了大约70%的代码。这不是说AI不行,而是它生成的代码在抽象层次和工程健壮性上有天然短板。
先聊第一个核心观点:自然语言驱动编程的“幻觉”问题。很多人觉得用中文或英文描述需求,AI就能写出完美的CRUD接口,但实际上一旦涉及状态管理、并发控制、事务边界这些概念,大模型经常给出“看起来对但实际有坑”的代码。比如我们有次让GPT-4写一个用户积分系统的批量扣减接口,它给出的代码用了Python的字典加锁,看起来逻辑清晰,但没考虑分布式环境下多个实例同时操作Redis缓存的一致性问题。上线第二天就出现了积分超扣,还好是内部测试环境。这个问题的根因在于:自然语言描述天然是模糊的,而工程系统需要精确的状态机。当你告诉AI“扣减用户积分”时,它默认理解成单机原子操作,但真实场景下可能是异步消息队列+数据库乐观锁+缓存最终一致性的组合。vibe coding的本质是把“需求描述”翻译成“代码逻辑”,但它缺乏对系统全局状态的感知能力。
第二个关键点:异常处理是AI生成代码的“盲区”。我做过一个统计,用GPT-4生成的Python API代码,如果完全不修改直接运行,在正常业务路径下成功率大概在85%左右,但一旦遇到网络超时、数据库连接池耗尽、第三方服务返回非预期格式等异常场景,失败率会飙升到接近50%。这不是模型能力不够,而是训练数据里异常处理的代码占比天然就低。大部分公开代码仓库的示例都是“理想路径”下的写法,没人会在示例代码里写重试策略、熔断降级、日志链路追踪这些生产级内容。我经历过一个惨痛案例:用AI辅助生成的数据管道脚本,在测试环境跑了一周没问题,上线后遇到上游数据源字段顺序变化,脚本直接崩溃,因为没有写字段校验和健壮的数据映射逻辑。后来我们团队定了个规矩:所有AI生成的代码必须经过至少三轮review,第一轮看业务逻辑是否正确,第二轮专门看异常处理是否覆盖,第三轮看性能瓶颈。即便如此,我们还是会在线上发现一些AI写出来的死循环或者内存泄漏——比如它喜欢在循环体内创建大对象不做复用,这在短时任务里看不出问题,但如果是长期运行的守护进程,内存会持续增长。
再聊聊“调试AI输出”这个能力。帖子说开发者核心价值转向调试AI输出,我非常认同,但我想补充一点:调试AI输出比调试自己写的代码更难。因为自己写的代码你清楚每一步的意图,但AI生成的代码你往往需要反向推理它为什么这么写。我有个同事用AI生成了一段排序逻辑,看起来没问题,但在特定数据集下性能极差。后来我们一行行拆解才发现,AI用了一个时间复杂度O(n^2)的算法,但数据集规模是百万级。如果你不具备算法分析能力,可能根本意识不到问题出在哪里。所以我一直跟团队里的初级工程师说,别以为AI能替代你写代码,你反而需要更强的算法、架构和系统设计能力,才能判断AI生成的代码是否合理。具体到实操,我们现在的做法是:让AI生成代码后,要求它同时生成对应的单元测试和性能测试用例,然后在测试环境跑一遍,如果测试覆盖率低于80%或者性能基线偏差超过20%,就退回重写。这样虽然增加了交互轮次,但能显著降低上线后的故障率。
关于“需求拆解能力”这一点,帖子提到胡彦斌要么有很强的需求拆解能力,要么有团队兜底。我倾向于两者都有,但需求拆解能力才是vibe coding能否成功的关键。我见过不少开发者用AI生成代码时,输入“帮我写一个电商订单系统”,然后得到一堆耦合紧密、难以扩展的代码。真正有效的做法是:先手动把系统拆解成身份认证、商品管理、订单流程、支付网关、通知服务等独立模块,每个模块再进一步拆解成API接口、数据模型、业务逻辑、外部依赖等层次,然后针对每个原子需求让AI生成代码。比如“生成一个订单创建接口,需要校验库存、创建订单记录、扣减库存、发送通知,要求事务一致性,数据库用MySQL,使用乐观锁避免超卖”。这样拆解后,AI生成代码的质量会明显提升,因为信息的熵降低了。我团队里有个实习生,刚开始用AI写代码时总是抱怨生成的代码不能用,后来我带他做了两次需求拆解练习,他自己就悟出来了:给AI的输入越精确、越结构化,输出越可控。现在他写一个微服务模块,会先画一个简单的系统交互图,再把每个箭头对应的职责用自然语言描述清楚,最后让AI逐个生成。效率提升了至少两倍,而且bug率下降了70%以上。
再谈一个容易被忽略的问题:AI生成代码的“技术债务”。vibe coding生成的代码通常没有统一的编码规范、日志格式、错误码体系、监控指标埋点。如果团队里多个成员都依赖AI生成代码,又没有统一的后处理流程,几个月后代码库会变得极其混乱。我有次接手一个项目,发现同一个服务里同时存在四种不同的JSON序列化方式、三种日志框架、两种数据库连接池配置。追查后发现这些都是不同时间段用不同AI工具生成的。重构成本极高,相当于重写了一半代码。所以我现在推动团队使用AI时,强制要求所有生成的代码必须经过一个“规范化管道”:包括代码格式化、静态分析、依赖扫描、安全漏洞检查、架构一致性校验。这些步骤全部自动化,集成在CI/CD流程里。这样AI生成的代码进入主分支前,至少通过了基本的工程质量关卡。
还有一点是关于性能优化的。帖子提到内存泄漏频发,这个我太有感触了。AI生成代码时特别喜欢用全局变量、闭包引用、未释放的定时器、长生命周期的监听器。我们有个Node.js后端服务,用AI生成了一段WebSocket连接管理代码,上线后连接数从100涨到1000后内存就爆了。排查发现AI在连接对象上挂载了大量冗余属性,且没有做连接超时清理。更隐蔽的是,它生成的事件监听器用了匿名函数,导致无法解除绑定,每个连接都残留了引用。这种问题在代码review时很难一眼看出来,因为逻辑本身是对的,只是生命周期管理出了问题。后来我们总结了一个经验:让AI生成代码时,明确要求它遵循“资源获取即初始化”和“显式释放”模式,并在注释里标注每个资源创建和销毁的对应关系。虽然增加了一些交互成本,但内存泄漏率降到了之前的十分之一。
最后聊聊“vibe coding对行业的影响”这个更大的命题。我不认为它会替代专业工程师,但它会深刻改变工程师的工作方式。我判断未来两年内,会出现两种分化明显的开发者:一种是把AI当成高级自动补全工具,依然依赖自己的架构设计能力和调试能力,这类人会越来越强,因为他们能更好地驾驭AI的输出;另一种是完全依赖AI生成全量代码,缺乏判断力和系统思维,这类人会在复杂项目里频繁踩坑,最终被淘汰。我观察到的一个趋势是,优秀的工程师正在用AI来“做自己不愿意做但必须做的事”,比如写重复性CRUD、生成单元测试、编写文档、做数据迁移脚本。而把更多精力放在系统设计、性能调优、安全攻防、业务建模这些高价值环节上。我们团队现在每周四下午会开一个“AI代码审查会”,专门分析这周生成的代码中有哪些典型错误,然后整理成案例库,再反向输入给模型做few-shot学习。这样持续迭代后,AI生成代码的可用率从最初的30%提升到了现在的65%左右,虽然还是不高,但已经能显著减少重复劳动了。
总结一下我的核心观点:vibe coding能做原型验证、能做内部工具、能写胶水代码,但短期内很难直接产出生产级应用。它的边界在于:无法理解系统全局状态、无法主动处理异常、无法生成健壮的性能优化、无法保证代码一致性。要突破这个边界,既需要AI模型的进步——比如更好的上下文理解和多轮交互记忆,也需要开发者自身提升需求拆解和调试能力。胡彦斌能成功,说明他至少把APP拆解到了AI可以处理的粒度,并且做了足够的调试工作。这不是AI的胜利,而是工程方法论的胜利。对于论坛里的朋友,我的建议是:别把vibe coding当成银弹,它更接近一把锋利的刀,用得好能切菜,用不好会切手。在实际项目中,先手工设计好架构和数据流,再用AI填充细节,最后用自动化工具做质量检查——这个流程虽然听起来不“vibe”,但最稳。
说实话,胡彦斌能搞出来这个APP我一点也不意外。明星做产品,背后大概率是有技术团队或者至少有个靠谱的技术合伙人帮他兜底底层逻辑的。我关注的是帖子里说的“人机交互迭代次数”这个点,太真实了。
我自己最近也在用类似的AI编程工具搞一个小工具,就是个简单的数据看板,前后端分离那种。前端页面还好说,描述清楚布局和样式,AI生成的代码基本能跑,但一到后端API接口设计、用户权限校验、状态管理这些,就开始翻车了。我印象很深的是,光是一个“用户登录后只能看到自己创建的项目”这个逻辑,我反复描述了三轮,AI生成的代码要么是session管理没做,要么是SQL查询条件漏了user_id过滤,最后还得自己手动改。
所以我觉得vibe coding现阶段最大的价值是“把想法变成能点得动的原型”,而不是直接交付生产级代码。真要上线,异常捕获、日志记录、性能瓶颈这些,AI目前根本意识不到。比如我那个小工具,上线第一天就遇到并发写入时的数据竞争问题,AI生成的代码根本没加锁或者事务处理。
另外还有个隐含成本:调试时间。AI写出来的代码有时候逻辑对但写法诡异,比如把本该放在后端的计算逻辑塞到前端渲染函数里,你要去理解它生成的东西,花的时间可能比自己写还长。胡彦斌那个APP能上线,要么是需求本身足够简单,要么就是有专人做了大量的代码审查和重构工作。
总结一句:vibe coding是个好工具,但别把它当银弹。用它来加速原型验证和简单模块的搭建是OK的,真要搞生产环境,该补的工程化功夫一点都少不了。
看到你分析胡彦斌这个案例,我其实挺认同的。我最近也在玩vibe coding,用Cursor和Claude搭了个小工具,就是那种记录每日灵感的轻量级APP。一开始觉得挺神奇,说句话就能生成代码,结果一跑起来全是小bug,比如数据存着存着就丢了,或者页面加载卡死。我折腾了两天才发现是状态管理那块没处理好,但说实话,我连状态管理是什么概念都是边查边学的。
你提到后端API和权限管理,这确实是我最头疼的。我试过让AI生成一个用户登录功能,它给了我一套代码,看起来像模像样,但根本没考虑token过期和刷新逻辑。后来我手动加了几行异常捕获,才勉强能用。我觉得vibe coding最大的问题不是它不能写代码,而是它写出来的代码像是一个会说话的实习生——能懂你的需求,但缺乏工程思维,不会主动考虑边界情况。
我好奇的是,你觉得如果要让vibe coding真正落地到生产环境,是不是必须得有人给它喂“高质量需求文档”?比如我每次描述需求时,如果只是说“做个聊天功能”,它生成的代码就很粗糙;但如果我详细列出“用户A发消息给用户B,消息需要实时显示,同时存入本地数据库”,它生成的代码质量明显高很多。是不是说,vibe coding其实不是在教人编程,而是在训练人怎么把需求拆得更细?这点我还在摸索,想听听你的经验。
老实说,你提到的“需求拆解能力”才是真正的门槛。我试过几次vibe coding,最深的感受是:大模型写个demo确实快,但一旦涉及到状态机流转、多线程同步、或者token刷新这种边缘逻辑,它就开始“胡言乱语”了。比如让它生成一个带分页的朋友圈feed流,第一版可能看着像那么回事,但拉到第二页就开始重复数据,或者翻页后列表闪烁,这种问题你靠自然语言描述很难精准定位,最后还是要人去看控制台报错,去理解闭包和异步队列。
胡彦斌那个案例,我更倾向于认为他背后有懂行的朋友帮他做了“需求降维”——把模糊的“我想要一个社交APP”拆解成“先做用户注册、再做一个发帖列表、最后加一个评论框”这种原子化指令。普通人如果直接扔一句“帮我做个类似小红书的APP”,大模型生成的骨架大概率跑都跑不起来。
另外你说的异常处理缺失我太有同感了。我见过vibe coding生成的网络请求代码,连最基本的超时重试都没有,更别提幂等性设计或者断路器模式了。这种代码在原型阶段没问题,但一旦有真实用户涌入,并发一上来,服务器直接502,而且日志里啥都没打,排查起来欲哭无泪。
我觉得vibe coding现阶段最靠谱的用法是:让老手用它来加速CRUD页面的搭建,或者生成单元测试桩代码。指望它直接产出生产级代码,起码还得等模型能理解“可用性”和“健壮性”的区别。你最后那句话我完全同意——原型验证是它最好的归宿。
我觉得你说的“快速原型验证”这点特别到位。我自己试过几次vibe coding,做个小demo确实快,但一涉及用户登录、数据持久化这些“正经功能”,对话轮数直线上升,而且生成的代码经常漏掉边界情况。胡彦斌那个案例,我猜他肯定在需求描述上下了不少功夫,或者就是你说的有人兜底。你觉不觉得这玩意儿现在更适合当“高级版Copilot”用,离真正替代工程师还差着十万八千里?
你说到点子上了,vibe coding最容易被忽视的就是“人机交互迭代”这个隐形成本。我最近也在拿它试一个小工具,刚开始觉得挺神奇的,说句话就能生成页面,但越往后越发现,真正要让它跑起来,你得先自己清楚每一步想要什么逻辑,不然大模型根本猜不到你脑子里那个“异常处理”和“边界条件”长什么样。
胡彦斌这个案例我也关注了,他那个APP我下载看了一下,功能不算复杂,但用户体验做得挺流畅的。我猜他团队里肯定有懂技术的人在帮他做需求拆解和逻辑验证,光靠vibe coding自己一路“啊对对对”地生成下去,不可能上线到应用商店。说白了,vibe coding更像是一个“高级代码补全器”加“快速原型机”,帮你把想法变成可点击的界面,但背后的数据流、权限控制、状态管理这些硬骨头,还是得有人类工程师去啃。
我觉得vibe coding目前最适合的场景就是个人小工具、内部流程自动化、或者产品经理拿来画demo给开发看。真要上生产环境,至少得搭配代码审查和自动化测试,不然哪天用户反馈个“点了登录没反应”,你都不知道是自然语言描述漏了还是模型抽风了。
你提到的“后端API、权限管理、状态同步”这几个点,我特别有同感。我试过让vibe coding写一个带用户登录的小应用,结果它给我生成了三个不同版本的登录逻辑,每个都缺token刷新机制。说白了,AI能帮你写代码,但没法替你理解“健壮”这个词在工程上的具体含义。