AI替代程序员的现实性,还是有段距离。

本帖于 2025-08-04 21:41:20 时间, 由普通用户 加州lalin 编辑

越来越多的公司开始宣称多少代码由AI生成。我们合作最多的一家 out sourcing 公司也在商讨利用AI完成一定的代码生成。但是,在现实应用中的代码转换需求测试中,AI代码生成和转化和Ai做微积分一样还不成熟。这篇论文挺有意思的。 https://arxiv.org/pdf/2405.11514

测试结果显示,各大基于LLM上的代码翻译器的完美度都低于50%,而且完美度随着变量参数的增加,和fiction的调用次数增加而下降,几乎不可用。而比赛或者刷题环境和现实应用场景相差甚远,以考试或者竞赛题来判断Ai的成熟度,明显是不够的。

现在language之间的转换,需要一个更有效的工具。个人保留意见,还是不认为基于LLM的 Marovian 基础思维还不是推理智能的功能。 

所以,基于LLM上的AI大概率停留在recommendation的功能上。

所有跟帖: 

基于LLM上的AI大概率停留在recommendation的功能上。CS就业不会一直不好。 -加州lalin- 给 加州lalin 发送悄悄话 加州lalin 的博客首页 (0 bytes) () 08/04/2025 postreply 21:42:25

主要是学得人多了,基数大造成的吧。需求赶不上求需的。娃现在有朋友从物理转CS. 还有一个打算DS转CS -zaocha2002- 给 zaocha2002 发送悄悄话 zaocha2002 的博客首页 (0 bytes) () 08/04/2025 postreply 23:22:22

中等以下码工的工作几乎完全可以被 AI取代了,可以质疑但心存侥幸是要不得的。 -Knight_2024- 给 Knight_2024 发送悄悄话 (0 bytes) () 08/05/2025 postreply 00:04:47

你有没有亲自做做?我的经验是提高了效率,但不能取代 -12度圆缺- 给 12度圆缺 发送悄悄话 12度圆缺 的博客首页 (0 bytes) () 08/05/2025 postreply 06:33:10

你用的什么模型呀?是1Mtoken输入输出的吗? -ClearCase- 给 ClearCase 发送悄悄话 ClearCase 的博客首页 (0 bytes) () 08/05/2025 postreply 06:48:00

AI coding现在还替代不了高级程序员,但是比绝大多数初级中级程序员强。 -ClearCase- 给 ClearCase 发送悄悄话 ClearCase 的博客首页 (0 bytes) () 08/05/2025 postreply 06:46:00

取代是通过提高效率,即使不能end to end,也会大大减少人的数量。你的文章是2018年的?那时根本没llm -风景线2- 给 风景线2 发送悄悄话 (273 bytes) () 08/05/2025 postreply 07:12:59

四月17日,2025年的paper。他提出的关键问题是LLM是否可以是可靠的code转换器,引深问题基于LLM的AI是否 -加州lalin- 给 加州lalin 发送悄悄话 加州lalin 的博客首页 (49 bytes) () 08/05/2025 postreply 10:29:34

我记得仅仅一年多前很多程序员还对用copilot嗤之以鼻,认为是弱鸡的表现。现在估计不会用AI辅助编程的估计都被layoff光了 -ClearCase- 给 ClearCase 发送悄悄话 ClearCase 的博客首页 (0 bytes) () 08/05/2025 postreply 07:25:00

程序一旦出错, 抓虫子是最烦人最耗时的事情 -枪迷球迷- 给 枪迷球迷 发送悄悄话 枪迷球迷 的博客首页 (347 bytes) () 08/05/2025 postreply 08:02:01

现在都能自己生成测试。 -加州lalin- 给 加州lalin 发送悄悄话 加州lalin 的博客首页 (0 bytes) () 08/05/2025 postreply 13:36:59

真希望是这样啊, -糯米粥- 给 糯米粥 发送悄悄话 糯米粥 的博客首页 (491 bytes) () 08/05/2025 postreply 09:26:59

早年程序员是一行行写,后来有各种工具调用,现在有Ai生成结构。都是工具的提高,效率的提高。 -加州lalin- 给 加州lalin 发送悄悄话 加州lalin 的博客首页 (0 bytes) () 08/05/2025 postreply 10:24:43

请您先登陆,再发跟帖!