“自然语言将成为新的通用编程语言,只要会说话,就可以成为一名开发者。“这是百度创始人、董事长兼首席执行官李彦宏在4月16日深圳开幕的“百度AI开发者大会”上做出的新判断。李彦宏认为,未来开发应用就像拍短视频一样简单,人人都可以是开发者。
3月,李彦宏在央视节目中就曾表示,“程序员”职业将消失。并引发三六零周鸿祎等加入这一话题的论剑。
今天这场演讲,是李彦宏2024年首秀。他这种判断的根源在于从去年开始爆火的AIGC。李彦宏认为:“大模型和生成式AI,将彻底改变开发者这个群体。过去,开发者用代码改变世界;未来,自然语言将成为新的通用编程语言。你只要会说话,就可以成为一名开发者,用自己的创造力改变世界”。
大会上,李彦宏连发多款AI开发工具,给出“开源模型会越来越落后“的判断,同时他透露,百度大模型产品文心一言用户数突破2亿,API日均调用量也突破了2亿。
一、连发多个开发工具
“因为有了强大的基础大模型,有了很多低门槛,甚至零门槛的开发工具,开发者的生产力大大提高了。“李彦宏举例说,比如,基于文心大模型的智能代码助手Comate,不仅支持100多种语言和所有主流IDE平台,可以推荐代码、生成代码注释、查找代码缺陷、给出优化方案,还可以深度解读代码库、关联私域知识生成新的代码。百度每天新增的代码中,已经有27%是由Comate生成的。”
在大会上,李彦宏与百度连发多项开发工具。
首先,智能体开发工具AgentBuilder。
李彦宏让认为,智能体可能是未来离每个人最近、最主流的大模型使用方式,基于强大的基础模型,智能体可以批量生成,应用在各种各样的场景。百度文心智能体平台已经有3万多个智能体被创建、5万多名开发者和上千家企业入驻。
值得注意的是,有上市公司已经与百度此项业务有所合作。其中索菲亚有效用户线索成本降低了30%。
其次,百度AppBuilder,用自然语言三步开发一个AI原生应用
具体来看,在AppBuilder上面,百度提前封装和预置了开发AI原生应用所需的各种组件和框架,大幅降低开发门槛。最快只需三步,开发者就可以用自然语言开发出一个AI原生应用,并且能够便捷地发布、集成到各种各样的业务环境中。
第三,各种尺寸模型定制工具ModelBuilder
这是更适合专业开发者使用的工具,具备“高效低价生产模型的能力”,可以根据开发者的需求定制任意尺寸的模型,并根据细分场景对模型进一步精调。
现场,李彦宏展示了教育行业作文批改的案例,经过数据处理、模型精调后的“作文批改助手”,不仅可以拥有更专业的老师点评思维、做到格式遵循,而且相比未精调模型,精调后的模型打分与真实的老师点评分数更为接近。
二、“百度踩了无数坑”
李彦宏分享开发AI原生应用的具体思路和工具:“这是我们踩了无数的坑、交了高昂的学费换来的“。
"大模型本身并不直接创造价值,基于大模型开发出来的AI应用才能满足真实的市场需求。这是我们百度根据过去一年的实践,踩了无数的坑,交了高昂的学费换来的。"李彦宏表示。
第一是MoE。李彦宏认为,未来大型的AI原生应用基本都是MoE的,指的是大小模型的混用,不依赖一个模型来解决所有问题。
第二是小模型。小模型推理成本低,响应速度快,在一些特定场景中,经过精调后的小模型,它的使用效果可以媲美大模型。这是百度发布Speed,Lite、Tiny三个轻量模型的原因。“我们通过大模型,压缩蒸馏出来一个基础模型,然后再用数据去训练,这比从头开始训小模型,效果要好很多,比基于开源模型训出来的模型效果更好,速度更快,成本更低。”
第三是智能体。李彦宏解释说,智能体机制,包括理解、规划、反思和进化,它让机器像人一样思考和行动,可以自主完成复杂任务,在环境中持续学习、实现自我迭代和进化。在一些复杂系统中,还可以让不同的智能体互动,相互协作,更高质量地完成任务。
李彦宏明确,这些智能体能力,百度已经开发出来了,并且向开发者全面开放。
三、开源模型会越来越落后
李彦宏在AI开发者大会上直怼“开源”,他认为,开源模型会越来越落后。
“因为有了最强大的基础模型文心4.0,我们可以根据需要,兼顾效果、相应速度,推理成本等各种考虑,剪裁出适合各种场景的更小尺寸模型,并且支持精调和post pretrain。这样通过降维剪裁出来的模型,比直接开源模型调出来的模型,同等尺寸下效果明显更好,同等效果下,成本明显更低。所以开源模型会越来越落后。”李彦宏这样解释说。
同日,李彦宏还明确了百度AI和大模型的新动向。
首先,文心一言用户数突破2亿,API日均调用量突破2亿。
李彦宏透露,文心一言从去年3月16日发布,到今天是一年零一个月的时间。用户数突破了2亿,API日均调用量也突破了2亿,服务客户数达到了8.5万,利用千帆平台开发的AI原生应用数超过了19万。
第二,百度正式发布文心大模型4.0工具版。
文心大模型4.0的工具版可以体验代码解释器功能,通过自然语言交互,就能实现对复杂数据和文件的处理与分析,还可以生成图表或文件,能够快速洞察数据中的特点、分析变化趋势、为后续的决策提供支撑。
李彦宏表示,相比一年前,文心大模型的算法训练效率提升到了原来的5.1倍,周均训练有效率达到98.8%,推理性能提升了105倍,推理的成本降到了原来的1%。也就是说,客户原来一天调用1万次,同样成本现在可以调用100万次。
“未来,必将是一个由开发者一起创造出来的未来。“在发布会最后,李彦宏表示,“此时此刻,我站在这里,其实也是一个开发者、一个创业者,跟大家一样兴奋。今天的中国,有10亿互联网用户,有强大的基础大模型,有足够多的AI应用场景,有全球最完备的产业体系,国家也在大力鼓励和支持‘人工智能+’行动,每一个人,每一家企业,只需要充分利用这些工具,就可以释放无限的创造力和生产力。”
责编:彭勃
校对:王锦程