国外现在能看到的AI应用基本都是to C,而且基本都是AIGC,更注重「生成」「创造性」结果,不(重点)追求「准确性」、「正确性」、「可靠性」、「可重复性」、「可解释性」,也没有真正落地有产出的杀手级应用,浪费手里大把的算力在陪人聊天、写作文 / 代码、画图、生成视频上。而华为盘古很明显一开始的规划就是to B / G的,利用有限的算力通过专业知识库训练,切实解决各个垂直细分行业的痛点问题,追求「准确」、「正确」且「高效」,比如应用在中长期气象预测的气象大模型(https://www.huaweicloud.com/news/2023/20230706011424580.html),应用在C919大飞机设计验证阶段的流体风洞模拟大模型。这些才是AI(或者说算力)应该深耕、造福、甚至最后替代人类,最让人类害怕的地方。而AIGC只是盘古里面的一个拼图,而且还(可能)是最不重要的那一块……
总结来说就是盘古是to B / G的,务实,但普通老百姓感知少、话题少,因为行业性、专业性太强,受众太窄;其它AI(基本)都是to C的,娱乐向,更容易引起话题(圈钱)。因此我个人认为在战略层面华为已经赢了,至少方向是对的,接下来就看怎么攒更多的算力、专业训练数据和行业专家经验,做各个垂直细分领域的专家模型的迭代,落地更多的应用场景 / 行业,最后一飞冲天了
大方向对了,遥遥领先只是时间问题
补一(2024.3.28):现阶段在我看来(略极端):
1)任何对结果的局部不能进行微调的AI都是玩具。这点本质是生成结果的不可重复,即相同的提示词每次生成的结果是不一样的。如果是激发灵感的创造性场景,这是个好事,比如「再给我讲个笑话」。但在需要对结果局部进行微调的场景,这是不可接受的(想想给甲方爸爸出第N版设计稿的设计师们)。比如给出以下连续的提示词:“画一幅人物肖像,男性少年,亚洲人,卡通风格” -> “把发型改成三七分,其余画面不变” -> “把头发分界线往左偏一点,其余画面不变” -> “下巴微抬一点,其余画面不变”,我不觉得现有(以及中短期以后)的AI能够完成。更不用说要微调一个生成视频里的某一小段画面,修改后还能融入原视频了;
2)任何不能确保结果正确性的代码生成AI,都是玩具。试想,你让AI写一段强逻辑性的代码,比如快速排序算法,结果发现代码有bug,包括但不限于:a)结果错,b)参数边界未检查,极端边界下出错,c)时间 / 空间性能未达需求,d)后续无法扩展(比如未范型化)。此时你大概有三个选择:a)(由于前述1),AI(目前可能)无法微调自己写的代码)让AI重写,但由于前车之鉴,你会review一遍生成结果,还可能会自己补上完整的测试代码;b)通读生成的代码,但过程中没有人给你解释实现思路与内在逻辑(最低效的单向code review),人工debug,修复代码;c)自己重写;哦,可能还有更糟的,d)完全没有发现bug,代码直接上线。这四个选项哪个谈得上解放生产力?或者再极端一点,AI生成的代码有数百上千行,而且是一个复杂的业务逻辑?
补二(2024.3.28,感谢三哥抛砖引玉):现在的算力之争,底层逻辑其实是能源之争。如果不久的将来全球算力需求全面爆发,现在的传统能源刨去保障全人类日常生活需要的基本电量,剩下的恐怕根本不够用。那咱们的第四代可控核聚变,未来一旦商业化,将是另一个国之重器,而且是大杀器。各国手里的算力和背后的能源都是有限的,把有限的算力到底是投在好玩的toC还是真正有用toB / G上,是此消彼长的。只能说目前来看,咱们向toB / G倾斜算力,战略上是更务实的,也是能走得更远的
-- EOF --
除非注明(如“转载”、“[zz]”等),本博文章皆为原创内容,转载时请注明: 「转载自程序员的信仰©」
本文链接地址:有关最近AI热的一些想法
Today on history:
【2009】测试与Live Spaces同步
【2005】子曰[子曰]
发表回复