互联网云大厂围攻ChatGPT,军备赛打响
近几个月,随着微软、谷歌、亚马逊等硅谷大厂纷纷公布大模型及AIGC进展,通过AI搜索引擎、AI办公软件等一系列应用打响AI竞赛,国内互联网云大厂也陆续全军出击了。
以百度、阿里、腾讯、华为为第一梯队玩家,360、京东、网易、知乎等为第二梯队玩家,以及字节跳动、快手、小红书等为潜力玩家,互联网/云大厂已经在大模型、算力设施、AIGC应用产品、生态等各方面展开了明争暗斗。
互联网/云大厂推出大模型的情况
众所周知,打响应战ChatGPT第一枪的互联网大厂是百度,今年3月面世的文心一言(ERNIE Bot)是百度在2021年12月推出的百度·文心(ERNIE 3.0 Titan)迭代而来的细分模型,百度创始人李彦宏称将用其重构百度所有的应用。而后,首个跳出来硬刚百度的是阿里。4月11日,阿里云推出通义千问大语言模型(LLM),阿里董事会主席兼CEO张勇宣布,阿里所有产品将接入大模型全面升级。阿里的大模型进展公开可追溯到2021年10月的云栖大会。
阿里云推出通义千问大语言模型(LLM)
随着百度、阿里参战,互联网云大厂AI竞赛开始变得硝烟四起。
4月9日,360集团基于360GPT大模型的“360智脑”落地搜索场景内测;
同日,京东透露京东言犀大模型预训练参数达到千亿级,2月言犀平台曾官宣推出“产业版ChatGPT”:ChatJD;
4月13日,知乎和面壁科技合作推出中文大模型“知海图AI”,落地“热榜摘要”开启内测;
近日,短视频厂商字节跳动、快手,以及生活方式平台小红书都已筹备大模型团队或透露出大模型计划。
华为和腾讯仍未在这波大模型浪潮正式推新,但已经从局部领域围而攻之。
比如,华为于2021年4月就推出了盘古系列大模型,并在2022年推出了矿山、气象、金融OCR等行业大模型。4月17日,华为云旗下的智能编程助手CodeArts Snap在深圳一场“华为代码大模型的方案与应用”活动中露面;再看看腾讯这边,其也在2022年12月推出了万亿参数的中文NLP预训练模型“混元”(HunYuan-NLP-1T),但至今未正式披露类ChatGPT应用的新进展。4月14日,腾讯云推出大模型算力集群;5月15日,腾讯云副总裁、腾讯云智能平台负责人李学朝透露:“具体的大模型腾讯内部正在做……具体进度后续会统一对外公布。”
华为云AI领域首席科学家田奇4月讲解盘古大模型
当然,仍有一些互联网大厂表现得比较谨慎。比如搜狐董事局主席兼CEO张朝阳近日接受媒体采访时称,搜狐现在对大模型仍是观望,应该会从应用角度来看一看,相对还是比较谨慎一点,但在整个GPT的应用方面搜狐已经开始在产品里逐渐渗透了。
通用大模型之战是大厂的大型军备竞赛。
市面上大厂推出的大模型,大多是基于Transformer架构进行开发的通用大模型,这是一场算法、算力和数据以及应用落地、生态合作的全面比拼。这边,百度刚刚宣布文心一言接入企业超700家;那边,阿里云宣布全系产品史上最大规模降价,发起规模战进行攻击;看似按兵不动的华为则加速在行业“圈地”,抢占大模型落地先机。
合作成为BATH以外的互联网企业的选择。比如360集团和知名AI大模型企业智谱AI于5月宣布了战略合作,共同研发千亿级大模型“360GLM”,借鉴“微软+OpenAI”组合的分工模式。5月24日,云知声也宣布了与360集团的战略合作,双方将积极推动山海大模型在各领域的落地应用。
在打法上,互联网云大厂大多“两条腿走路”:一边通过提供大模型MaaS,获取平台服务费用;一边通过出租算力和推训平台,赚取大模型企业的租金。两种方式都有望成为云服务业务的新增长点,并带来新的云服务范式。
尽管战争仍在初期,大厂之间已经开始明着较量,阵势不小。