(原标题:大模型祛魅,AI应用时代脚步临近)
21世纪经济报道记者杨清清 北京报道
大模型的未来会怎样?大幕已徐徐拉开。但个中不仅是喧哗,也有疑虑。
从产业界而言,无疑是热闹的。大模型火爆几近两年,技术以前所未有的速度迭代。头部芯片厂商和云厂商吃到红利的背后,各大科技企业纷纷推出各自的大模型产品。与此同时,AI创企成为风投竞相追逐的目标。在这个过程中,无论是大公司、创业者或是投资方,都挤破脑袋寄希望于寻找到“超级应用”,无远弗届。
然而两年过去,众所期待的超级应用,并未出现。这也为过去这24个月的全球大模型狂热画上了一个问号:这一切,究竟是新的技术革命?还是又一场非理性的AI泡沫?
目前业界未有定论,但百度集团董事长兼CEO李彦宏心中,自有标尺。“今年5月,也就是6个月前,我在和高管们讨论大模型怎么就叫成了的时候,我当时说,如果我们(文心大模型)日均调用量一年内涨10倍,我认为就成了。”11月12日,在2024年百度世界大会上,李彦宏回忆道。
彼时,百度文心大模型的日均调用量为2亿次,而据李彦宏会上最新披露的数据,如今文心大模型的日均调用量超过15亿次,半年内增长了7.5倍。相较于一年前首次披露的5000万次的数据而言,更是增长约30倍。
陡峭的增长曲线,暗示着过去两年内中国大模型应用的爆发。但百度在做的事,还有更多。
消除大模型幻觉“过去24个月,AI行业发生的最大变化是什么?是大模型基本消除了幻觉。”李彦宏指出。
背后所依赖的,是检索增强生成(Retrieval-augmented Generation,RAG)。由于大模型是概率模型,生成的内容具有不确定性,但采用RAG技术后,大模型会利用检索信息来指导生成文本,从而极大提升内容的质量与准确性。这也让AI从“一本正经的胡说八道”变得可依赖。
搜索出身的百度,RAG原本是自身特色,但在过去两年的时间内,RAG逐渐从百度特色转为行业共识。不过与此同时,尽管文字层面的RAG已经相当出色,基本消除了大模型的幻觉,但在图像等多模态方面仍结合度不够,文生图的过程中大模型依然难免张冠李戴,闹出笑话。
“今年年初,我们决定要解决图像生成的幻觉问题。”李彦宏表示。就此,百度开发了检索增强的文生图技术iRAG(image based RAG),将百度搜索的亿级图片资源跟强大的基础模型能力相结合,可以生成各种超真实的图片。
李彦宏现场展示了一幅由文心大模型生成的大众揽巡汽车飞跃长城的图片。通过文心iRAG技术,无论是这款特定型号汽车的车型车标、还是作为背景的长城,均未出现错误或变形的幻觉问题。同时展示的“爱因斯坦环游世界”图片中,爱因斯坦和各个背景景点的结合也与真实世界高度相似,质感接近照片。
李彦宏指出,iRAG技术能够极大提高AI生成图片的可用性。比如在品牌宣传上,以前拍一组海报动辄大几十万,但现在的创作成本接近于0。简单而言,文心iRAG的商业价值体现在:无幻觉、超真实、没成本,立等可取。此外,在影视作品、漫画作品、连续画本、海报制作等应用场景中,iRAG都可以大幅降低创作成本。
需要注意的是,大模型幻觉的消除,也成为AI应用爆发的基础。“今天,基础模型能力就绪,我们即将迎来AI应用的群星闪耀时刻。”李彦宏表示。
智能体迎接爆发点技术准备就绪,应用的方向是什么?李彦宏给出的答案之一,是智能体。
“我们认为,智能体是AI应用的最主流形态,即将迎来它的爆发点。”李彦宏指出,“做智能体很像在PC时代做网站,或者是移动时代做自媒体账号。不同之处是智能体更像人,更智能,更像你的销售,像你的客服,像你的助理。智能体可能会变成AI原生时代,内容、信息和服务的新载体。”
在他看来,一方面,智能体的门槛极低,甚至在百度智能体平台上,有11岁的小学生在创造智能体。另一方面,智能体的天花板足够高,能做出非常强大的应用。多个智能体协作,还能解决更为复杂的问题。
以公司智能体为例。在传统的PC官网模式下,企业只能静态地展示公司介绍、产品参数,但缺失主动推荐、及时响应和一对一服务能力;而公司智能体则可以根据顾客的需求推荐相应产品,在服务方面,也能更直接、快速地响应需求,能大幅地提升互动营销的效率。
根据大会现场披露的数据,比亚迪的官方智能体上线后,销售转化率提升119%,联想AIPC智能体的9月互动率提升89%。
除了公司官网场景外,智能体还可以发挥角色、工具等功能,并在不同行业拥有不同的使用场景。
例如,百度文库和百度网盘联合打造的工具类智能体“自由画布”,可以让用户在一块类似“画布”的界面上自由拖拽文档、音视频等富媒体素材,迅速生成多模态内容。而法律智能体“法行宝”,已回答用户1660万个法律问题,不仅能如律师般专业解答,并能计算赔偿金额、撰写法律文书并推荐适配律师。据介绍,目前文心智能体平台已吸引了15万家企业和80万名开发者。
此外,李彦宏还发布了无代码工具“秒哒”。该工具涵盖无代码编程、多智能体协作以及多工具调用等特点。李彦宏表示,这是“迄今为止人类历史上最复杂的多智能体协作工具”。
而对于用户而言,使用门槛极低。用户只需说说话,就能构建出各种应用。通过自然语言交互,就可以完成一套系统的搭建。这也意味着,每个人自己就能指挥多个智能体来协同完成任务。
“只要有想法,你就可以心想事成,我们将迎来一个前所未有的,只靠想法就能赚钱的时代。”李彦宏表示。
提速产业应用大模型的应用方向不仅停留于C端用户,自然还有广阔的B端产业市场。
“大模型正在从技术变革走向产业变革。无数的AI原生应用,正在重新定义我们与数字世界乃至物理世界的交互方式。”百度集团执行副总裁、百度智能云事业群总裁沈抖指出。
甚至,大模型在B端的落地,比想象中的还要显著。据介绍,目前百度智能云拥有中国最大的大模型产业落地规模。超过六成的央企和大量的民营企业,正在联合百度智能云进行AI创新。百度智能云千帆大模型平台已经帮助客户精调了3.3万个模型、开发了77万个企业应用、文心大模型日均调用量超过15亿次。
沈抖表示,AI应用正率先在B端爆发。由企业级大模型工程平台、异构算力平台组成的新型AI基础设施,将替代传统云计算,为大模型应用在企业生产力场景中的规模落地提供关键支撑。
而在本次大会上,百度智能云千帆大模型平台正式发布“工作流Agent”功能,旨在帮助企业快速开发出面向复杂对话场景的AI应用,快速拥有专业水平的“数字员工”。通过学习各种企业流程与规范,工作流Agent能够适应不同岗位职责,快速规模化复制,大幅提升企业运转效率。
沈抖指出,无数的AI应用,正在重新定义人与数字世界、物理世界之间的交互方式。现在,这些应用已经深入到企业“研产供销服”的各个环节,并成为企业提升竞争力的关键要素。
“围绕着由大模型平台和算力平台组成的新型AI基础设施,我们打造了‘人工智能’全栈技术服务体系。”沈抖表示,“我们相信,AI原生应用一定会在B端大爆发,而且这个时刻已经到来。”