群“模”大战:打的是什么?谁更有机会?
“百模大战”开打,未来谁将脱颖而出?
在今年的世界人工智能大会上,大模型占据当仁不让的C位,国内外总计30余款大模型集体亮相,据记者不完全统计,其中既有来自企业巨头华为、百度、阿里、京东等推出的通用大模型,也有来自清华、复旦等学院派大模型,还有包括出门问问、第四范式等创业公司入局,“厮杀”尤为激烈。
从起初的算法、算力,到如今的应用场景、商业空间,业界对于对大模型的争论,逐渐从方向前景向应用现实层面靠拢。
腾讯副总裁汤道生提到了“通用大模型”和“行业大模型”两条不同路径,如何在最低成本下实现大模型的最优选择,创业公司如何在巨头裹挟中找到生存机会,成为今年产业界的热议焦点。
入局大模型的两种范式,有多烧钱?
所谓人工智能大模型,通常指的是经过大规模数据训练后,能够适应一系列任务的模型。
大模型的“烧钱”已成为业内共识。此前,华为云人工智能领域首席科学家田奇曾在公开演讲中表示,大模型可能收编高度定制化的小模型,导致市场向大公司集中,其资本门槛高,大模型开发和训练一次1200万美元。
昆仑万维此前也在公告中表示,大模型市场已经进入10家左右中大型公司,打3-5年持久战的格局,要做好这件事情,需要长期储备至少10亿美金以上的资金。
作为行业人士,网易伏羲预训练及生成式人工智能平台负责人赵增向记者介绍,目前企业入局大模型主要分为两种范式:第一种是着力于通用能力的基础大模型,这也是成本最高、最为昂贵的大模型。另一种则是基于基础大模型的行业垂直大模型,以大部分创业公司为例。
基础大模型以国外的OpenAI,国内的阿里、百度等为例,据浙商证券分析师陈杭此前发布报告,一片英伟达顶级GPU成本为8万元,GPU服务器成本通常超过40万元,“对于ChatGPT而言,支撑其算力基础设施至少需要上万颗英伟达GPU A100,一次模型训练成本超过1200万美元。”
行业垂直大模型则以腾讯和大部分创业公司为例。据腾讯高级执行副总裁汤道生表示,基础通用大模型可以在100个场景中,解决70%-80%的问题,但未必能100%满足企业某个场景的需求。基于行业大模型构建自己的专属模型,虽然参数比通用大模型少,但是训练和推理的成本更低,优化也更容易,可能是性价比更高的选择。
“实际上,并不是所有的大模型研发都需要耗费很大的成本。”赵增向记者透露,具体还是要看其具体的切入点,以及结合具体场景的应用价值、是否使用开源模型等等。
值得注意的是,关于垂直大模型的成本究竟高不高,目前行业内也有不同说法。京东探索研究院院长、京东科技智能服务与产品部总裁何晓冬向记者坦言,目前垂直行业模型的训练成本和难度并不低,因为行业模型是建立在通用模型基础上的。如果只用行业数据进行训练,会缺乏常识,以电商退换货为例,比如客户需要出门,无法在当天进行退换货,如果过于垂直的行业模型可能无法准确的理解客户的意图,难以进行有效沟通并完成针对性的后续任务。
巨头公司PK创业公司
据记者不完全统计,在今年人工智能大会发布的近30个大模型中,有近十个大模型来源于中小企业,其中不乏创业公司,包括云天励飞旗下的“云天天书”、星环科技旗下的“星环无涯”、第四范式旗下的“式说”等,和大厂面对面掰手腕,初创公司的机会在哪里?
“在国内,大模型研发本质不是钱和资源的问题,而是切入点和场景的问题。有很多公司可以通过融资获得研发的第一桶金,门槛并不算特别高。”第四范式副总裁涂威威向记者坦言。“大厂的规模大,团队也多,不同团队之间可能出现赛马竞争,浪费资源,而创业公司的优势就是能集中大量资源,花费在某个具体模型上的投入未必逊色于大厂。”
他举例说,大模型就像造工厂,如果建造工厂只为了造一辆车,那确实成本很高,但如果在工厂建成后源源不断地生产车辆,对每辆车的成本而言并不是很高。目前,各大厂商,包括创业公司,都还处于“造工厂”的阶段,但随着生态的不断完善,未来的成本必然会显著降低。
“ChatGPT太强大了,对创业公司很不友好。创业公司基于ChatGPT能够创造的价值非常单薄。”此前,知名投资人朱啸虎曾经和猎豹移动 CEO傅盛在朋友圈就创业公司该不该入局大模型互怼。朱啸虎认为,大模型摧毁了创业,因为模型、算力和数据,三大支柱都向大厂集中,看不到创业公司的机会,且直接在大模型上做应用护城河太低。
傅盛却认为,大模型催生了很多新的架构在大模型之上的创业机会,包括直接在大模型上搭建的不同应用和由于数据私有带来的垂直领域的大模型等等。行业大模型以及基于大模型的应用开发,才是大部分创业者真正能够抓住的机会。
从资本角度来看,哪怕是大模型“先行者”OpenAI都处于连年亏损的状态,甚至亏损额还在逐年增加。据外媒报道,OpenAI去年亏损额度翻倍,达到5.4亿美元左右。OpenAI首席执行官山姆·奥特曼(Sam Altman)曾私下表示,公司可能会在未来几年筹集至多1000亿美元资金以进一步开发人工智能的能力。
也有业内人士看好创业公司的机遇。一位大厂技术负责人私下透露,实际上,在生成式AI赛道,目前表现亮眼的都是“小厂”的产品,而大公司的产品往往中规中矩,缺少亮点,相比大厂,创业公司的思路更灵活,对新的理念接受也更快,容易诞生有创新和革命性的模式。而且目前较为常规的通用大模型成本已经在可控制的范围内,并没有外界想的那么高。
尽管大模型赛道确实有资金门槛,但其商业前景受到业内的一致认可,不少业内人士向记者透露,目前大模型赛道已经催生出大量商业机会,其盈利空间是明确的。
“现在各行各业都结合大模型的技术,落地场景非常丰富,既有通用场景,也有行业场景。此前,腾讯已经将大模型的能力融入到旗下企点智能客服、数智人等产品中,也在尝试云上代码助手,在普适性的场景下有很多应用,同时,各种行业客户也带来了大量的需求。”腾讯云副总裁、腾讯云智能负责人吴运声告诉记者。
吴运声认为,目前仍然是大模型发展的早期阶段,呈现出“百花齐放”的状态,只有更多尝试和更多投入,才能拥有更多可能性,目前判断大模型数量太多或太少,还为时过早。
“哪怕就在当下,行业大模型的应用已经被证明是可行的。”赵增坦言,以网易游戏的美术设计为例,随着AI大模型的应用,原先的生产力得到释放,可以快速缩短原来所需的设计流程,实现生产效率的大幅提升。
而据昆仑万维CEO方汉预测,在未来3-5年内,大模型将产生更多的端到端内容制作工具,彻底改变文学、音乐、漫画、动画、短视频、长视频和影视等行业的内容生产形式和流程。这将使更多人无门槛地进入内容创作领域,丰富娱乐生活。
在今年大会上,启明创投发布报告称,三年内颠覆式的AI应用的核心驱动力来自于底层模型的创新,模型的作用将大于产品设计的作用。目前,生成式AI仍然处于技术主导的早期阶段,未来将存在诞生千亿美元市值的平台型企业机会。
责任编辑:刘德宾
外交部发言人就菲律宾向仁爱礁运补答记者问
新京报讯据外交部消息,外交部发言人就菲律宾向仁爱礁运补答记者问。问:3月23日,中国海警对菲律宾向仁爱礁运补实施拦阻。发言人对此有何评论?答:3月23日,菲律宾不顾中方坚决反对,执意派1艘运补船和2艘海警船擅自闯入中国南沙群岛仁爱礁邻近海域,企图向仁爱礁非法“坐滩”军舰运送建筑物资,对该军舰进行维修加固。中国海警依法在海上采取必要维权举措,坚决拦阻菲方船只,成功挫败菲方图谋。新京报2024-03-23 18:35:380000频繁修法“泛化国家安全”?国家安全部发文驳斥
10月23日,国家安全部官微发文称,今年4月《反间谍法》修订通过以来,境内外舆论高度关注,绝大多数声音尊重和支持中国正当的立法活动,但其中也有一些误读,甚至是恶意攻击抹黑。为正本清源、以正视听,有必要用事实和数据说话,对一些典型的错误言论予以回应和驳斥,推动各方全面了解和正确理解中国新修订的《反间谍法》。错误观点:《反间谍法》2014年才制定,2023年又修改,中国通过频繁修法“泛化国家安全”。0000台盟中央常务副主席李钺锋接受国家监委监察调查
中央纪委国家监委网站讯台盟中央常务副主席李钺锋涉嫌严重职务违法,目前正接受国家监委监察调查。相关资料:李钺锋,男,台湾中坜人,1958年7月出生于重庆市渝中区,1976年6月参加工作,2001年11月加入台盟。重庆大学经济与工商管理学院EMBA高级工商管理专业毕业,在职研究生学历,工商管理硕士,二级高级律师,国家二级大检察官。0000青海省科学技术厅原厅长莫重明等人被决定逮捕
新京报讯据最高检官微消息,检察机关依法分别对莫重明、杨彦康、高斌、吴查决定逮捕。青海检察机关依法对莫重明决定逮捕青海省科学技术厅原党组书记、厅长莫重明(正厅级)涉嫌受贿一案,由青海省监察委员会调查终结,移送检察机关审查起诉。日前,青海省人民检察院依法以涉嫌受贿罪对莫重明作出逮捕决定。该案正在进一步办理中。山西检察机关依法对杨彦康决定逮捕0000中美外交官员在华盛顿举行工作磋商
2023年7月31日,外交部美大司司长杨涛在华盛顿同美国国务院亚太事务助理国务卿康达和白宫国安会中国事务高级主任贝莎兰举行工作磋商,双方围绕中美关系和共同关心的国际地区问题坦诚、深入、建设性交换了意见。杨涛阐述了中方在台湾问题上的严正立场。责任编辑:刘光博0000