“大模型不是一个新技术,而是一个新世界。”

三年前,蚂蚁集团在上海举办了第一届外滩大会,通过这场以金融科技为底色的峰会,蚂蚁尝试刷新自己的大众认知。


三年后,在 2023 年 9 月 7 日开幕的上海外滩大会,AI、大模型、算力、智能……我看到所有人好像都在关注、讨论大模型和生成式 AI,就算是在财富管理行业的见解论坛上,也能听到演讲者和观众谈论大模型已经或者有望带来的改变。


这种定调从主论坛的安排上也能看出,关于大模型的主题演讲和圆桌对话,基本占据了大会最重要也最多的时间。蚂蚁集团董事长兼 CEO 井贤栋在大会开始也透露,蚂蚁将在次日发布纯自研、全栈布局的大模型。


9 月 8 日下午,我们终于等到了这个被井贤栋提前预告的蚂蚁金融大模型。


IMG20230908161520.jpg

图/雷科技


蚂蚁金融大模型基于蚂蚁自研基础大模型,针对金融产业深度定制,底层算力集群达万卡规模,目前已在蚂蚁集团的财富、保险平台上全面内测。同时,蚂蚁还发布了基于金融大模型能力的两款产品:个人金融助理「支小宝2.0」和专家业务助手「支小助」。其中「支小宝2.0」已内测近半年,计划在完成相关备案工作后正式上线。


无论如何都可以看出,在这个备受关注的金融科技峰会上,AI 大模型是当之无愧的「焦点」。


其实并不奇怪,就在同日举办 2023 腾讯全球数字生态大会上,腾讯集团高级执行副总裁、云与智慧产业事业群 CEO 汤道生正式发布了腾讯混元大模型,大模型同样也是这次大会的重中之重。


所有人都明白大模型的革命性意义。井贤栋挪用了电影《奥本海默》里的那句「(原子弹)不是一种新武器,而是一个新世界」,认为大模型的出现,「不是一个新技术,而是一个新世界」。


学界、产业界的专家领袖几乎都提到了大模型面对的诸多挑战,但无一例外,他们也都相信这个「新世界」的颠覆与必然。


外滩搭台,技术唱戏


第一届外滩大会上,原蚂蚁集团 CEO 胡晓明说,蚂蚁的基因不是金融,而是科技,在蚂蚁 16 年的发展历史上,科技每一次都扮演了最重要的角色,驱动着蚂蚁业务不断进化。


「面向未来,蚂蚁最重要的事是投技术。我们将进一步提升自主创新能力,投入资金用于强化科技研发实力,增强产品和技术创新,为长期战略发展夯实技术基础。」


过去三年间蚂蚁集团和外滩大会都会有了不小的变化,但对于技术的重视还是没变。


IMG20230907113232.jpg

图/雷科技


在本届外滩大会上,我们可以看到蚂蚁集团和英伟达、美国运通中国合资公司、众安保险、复旦大学、同济大学等众多企业,在科技展览区展示了人工智能、区块链、隐私计算、6G、脑机操控交互等前沿技术,以及技术如何深入农业、宠物、养老、出行、饮食,与每一个人息息相关。此外,蚂蚁集团还展示了大量与大模型相关的技术,包括生成数字分身、AI 拍照、AIGC 内容识别和对齐等。


今年大会更是打出了「科技,创造可持续未来」的口号,井贤栋继续强调,蚂蚁把科技作为最核心的竞争力,最重要的生产力,发展根本的驱动力,对大模型高度重视,全情投入。


这是情理之中。ChatGPT 被广泛视为 AI 的 iPhone 时刻,而其背后的 GPT-3.5 和大模型技术,更是成为了今年以来全球最大最重要的技术「焦点」。


IMG20230907135805.jpg

钱锋院士,图/雷科技


在外滩大会·见解论坛上,中国工程院院士、CAAI 监事/ Fellow 钱锋指出,AI 作为新一轮科技革命和产业变革的核心力量,是新时代经济发展的新引擎。按照麦肯锡的预测,AI 对全球经济的潜在收益将达到 25 万亿美元,是当前所有企业最重要的赛道之一,「但这个时代刚刚开始。」麦肯锡中国区主席、全球资深董事合伙人倪以理说。


大模型落地,所有人都在面对的难题


从 ChatGPT 开始,以大语言模型为代表的生成式 AI 引领人工智能浪潮,国内外大模型的研发呈现爆发式增长。但与此同时,生成式 AI 的产业落地仍然面临不少挑战。


ChatGPT 无法确定自身所生成的内容,没有办法对「不确定性」进行量化。2007 年图灵奖获得者、中国科学院外籍院士 Joseph Sifakis,美国三院院士、加州大学伯克利分校教授迈克尔·乔丹都在外滩大会上强调了 AI 大模型当前面临的「不确定性」问题。迈克尔·乔丹更是明确指出,这是现在最应该着重解决的。


IMG20230907093505.jpg

迈克尔·乔丹教授,图/雷科技


在克劳德·香农构建的信息论中,信息的本质是消除不确定性,但大模型的「不确定性」问题却持续困扰着用户、企业与研究者。很多人可能深有体会,一旦发现 AI 生成的回答存在严重的错误,自然而然就会降低对 AI 生成内容的信任度,信任度降低到一定程度,用户就会随之放弃使用。


个人用户如此,企业用户更甚,而且这对于金融科技更是至关重要的,因为「金融科技归根结底就是消除不确定性的技术。」迈克尔·乔丹提出,AI 的本质是集体而非个体,我们应该通过群体智能的设计使其更加公平、可扩展和稳定。


包括清华大学计算机科学与技术系副教授刘知远也认为,在走向通用智能 AGI 的未来之路上,群体智能是人工智能的必经之路。


另一方面,现在我们都知道,大模型的大参数直接导致了智能的涌现,但同时在训练和推理阶段都带来了海量的算力需求和巨大的成本。而随着我们对数据、算力的要求越来越大,落地的成本也会越来越高。此外,大模型的大算力需求也推高了其部署难度,进而限制了大模型更广泛的应用场景,尤其是在智能手机等便携个人设备上。


所以,大模型的轻量化不意外成为了从学界到产业界的共识。欧洲科学院院士、清华大学大数据智能研究中心主任朱文武就谈到大模型轻量化的必然趋势,同时还总结了大模型轻量化的三个主要方向:一是在轻量化的过程中保持大模型的智能涌现能力;二是大模型与小模型的协同;三是在垂直领域大模型的轻量化。


IMG20230907144101.jpg

朱文武院士,图/雷科技


但还有一个问题困扰着不少 AI 公司,那就是投入与收益的严重不匹配,更深层则是商业模式发展的滞后。


小冰公司 CEO 李笛指出,传统按 API 调用次数的商业模式并不能体现生成式 AI 创造的价值,「与其期待算力成本下降,不如通过为用户提供高附加值的服务消除成本问题。」为此他们探索了「收入共享」的新模式,在与 Netflix 联手完成动画短片《犬与少年》的合作中,通过更深度的服务合作以此获得项目分成收益。


不过李笛也提到了,大模型作为一种新技术范式还处在技术创新震荡期,大部分产品应用还未证伪,最适合的商业模式也远未确立,我们处在「类似于孟德尔刚发现遗传学规律的时刻」。


我们应该如何看待 AI


还记得 ChatGPT 最早风靡全球的时候,所有人都在担心 AI 会替代人类,从程序员到美术师,再到文字和图片记者。而在外滩大会上,我反复听到了一种判断,即人类与 AI 走向协作与交融。


Kevin_Kelly,_Wired_(25163989050).jpg

凯文·凯利,图/ Wikimedia Commons


这种理念并不陌生。技术哲学家、《连线》杂志创始人凯文·凯利(更为人知的名字是 KK)在 KK 三部曲(《失控》《科技想要什么》《必然》)中就有表达,他认为技术与人类的共生发展几乎是一种必然。前文提到的美国三院院士、机器学习泰斗迈克尔·乔丹也在外滩大会的演讲中说:


AI 不会替代人,我们应该把人类和 AI 视作一个集体的智能体。


在 AI 大模型火热的当下,有一个问题始终困扰着很多学者、研究者,那就是「对齐」。大模型的对齐指生成式 AI 要与人类的价值观、用意保持一致,符合系统设计者本身的利益与意见,不做危害社会与人类的事情,「如果把人工智能看作西游记里的孙悟空,对齐就是唐僧口中的紧箍咒。」中国科学院院士何积丰说。


但只有「紧箍咒」并不能真正解决问题,何积丰院士认为人机双向对齐,即不仅是机器向人类对齐,人类同时也要向机器对齐,他还讲到了计算机科学之父、人工智能之父阿兰·图灵的一个小故事:


> 1951 年,图灵在与朋友的交流中提到他在做一些简单的机器学习工作,他发现教机器学习很难,要么做错了,要么做得很慢,要么什么都没做(没回应)。他的朋友提了一个问题——到底谁在学习?


是机器在学习,还是人在学习?图灵意识到,在机器学习的过程中,人和机器两方都在学习,人类在帮助机器变得更加智能,同时人类也在慢慢学习如何指导和使用,才能让机器能够符合人类需要的目标。


72 年后,机器学习迎来了新一轮前所未有的爆发,但人类与机器之间的关系,或许终究还是会走向相互学习和共生。