11月7日凌晨,OpenAI在美国旧金山举办首届开发者大会。Sam Altman和他的同事,用时45分钟,发布了改变大模型产业游戏规则的重磅产品。微软CEO纳德拉应邀出席活动。
有媒体发现Sam Altman邀请纳德拉上台,简短寒暄后,Sam问纳德拉:微软现在如何看待与OpenAI的合作关系?纳德拉,出乎意料地笑了3秒钟,才回答:我很爱你们,能和你们合作感觉很梦幻。整个对话,本为了强调合作关系,但却弥漫着距离感。
不过,在Sam Altman的“追问”下,透露出许多信息点。
第一,微软怎么看两者的合作关系。
Nadella提到两点:首先是工作负载,两公司一起从电力到数据中心,再到机架和加速器,乃至网络,共同构建系统,以支持 OpenAI 正在建立的模型。微软的目标是建造最好的系统,以便 OpenAI 能够构建最佳的模型,并将其提供给开发者。
其次,微软本身也是一个开发者,正在构建产品。Nadella 提到,他首次见到 GitHub Copilot 和 GPT 后,对这整代基础模型的信念完全改变了。他们致力于在 OpenAI 的 API 之上构建自己的产品,并希望将GitHub Copilot企业版提供给在场的所有与会者试用。
第二,未来合作。
Altman询问Nadella 对两家公司未来合作关系的看法。Nadella提到,微软全力投入于提供所需的系统和计算资源,以支持 OpenAI 在其路线图上大踏步向前。他们致力于提供最佳的训练和推理系统,以及最多的计算资源,不断推动 OpenAI向前发展。
第三,使命一致。
Nadella 认为,AI 的真正价值在于赋能其他人。这与 OpenAI 和微软的使命相一致——赋能地球上的每个人、每个组织。
与OpenAI合作是微软围绕大模型的布局之一。资料显示,除了与OpenAI 有着深度的合作关系,共同开发了一系列高性能的大模型,如GPT-3、GPT-4、Codex、DALL-E 等之外,微软还通过 Azure OpenAI 服务,将这些大模型提供给企业和开发者,帮助他们构建应用程序和解决方案。微软还针对不同的行业场景,推出了一些基于大模型的创新服务,如面向零售电商、制造业、数字原生等行业的Azure全球创新行业场景,以及面向聊天集成和定制的企业级 ChatGPT。微软在大模型领域的布局,体现了其对人工智能的长期愿景和战略投入,也展示了它在全球基础设施等方面的优势和竞争力。
双方是竞合关系。合作方面,一如Nadella在开发者大会所提及的,微软是 OpenAI 的最大投资者之一,自 2019 年以来已向其投入了数十亿美元,以支持 OpenAI 的 AI 研究和产品开发。 微软也是 OpenAI 的独家云服务提供商,为其提供高性能的计算资源和基础设施,例如专为 OpenAI 设计的超级计算机。微软和 OpenAI 有着共同的愿景,即推动安全、有益、普及的人工智能,为各行各业的组织和开发者提供最先进的 AI 技术和工具,例如 Azure OpenAI 服务。
但也不能忽视两者微妙的竞争关系。显而易见,微软和 OpenAI 都是大模型的领导者和创新者,拥有各自的核心技术和产品。微软和 OpenAI 都需要在保持独立性和开放性的同时,实现商业化和盈利,这可能会导致双方的利益冲突和战略分歧 。
而且他们的组合要面对谷歌+DeepMind、Meta、亚马逊等的竞争压力。以谷歌+DeepMind为例,Google在云计算、数据基础设施和人工智能硬件方面具有强大的优势,这能够为DeepMind的大规模模型研究和部署提供强大的支持。DeepMind在自然语言处理、计算机视觉、强化学习和生成模型等方面成就显著。两者结合将大规模模型应用于各种产品和服务,比如Google 搜索、Google Assistant、YouTube、Gmail 和 Google Cloud,并惠及各种行业和领域,如医疗保健、教育、娱乐和环境。
分析人士认为,从技术水平上看,截至目前,“谷歌+DeepMind”组合在技术水平上可能略微领先于“微软+OpenAI”组合。理由之一是它们开发了一些不可忽视的大模型,如AlphaGo, AlphaFold, WaveNet等。此外,它们在一些重要的AI领域,如自然语言处理、计算机视觉、强化学习和生成模型,取得了更多的突破和创新。但也有人更看好“微软+OpenAI”组合的商业价值。因为该组合提供了更多的可用、实用的大模型产品与服务,如Azure OpenAI Service, GitHub Copilot, OpenAI Playground等。
另外,也不能马斯克在AI领域的布局。不久前,马斯克公布xAI首款 AI 聊天模型产品Grok。他正在构建以特斯拉(数据)+推特(数据)+Neuralink(在人类大脑植入芯片)+Optimus(人形机器人)+Dojo(使用数百万条视频训练人工神经网络来模拟人类大脑的超级计算机)为核心的系列布局,也如一条“鲶鱼”将为大模型领域的竞争带来新的变量。
总的来看,目前,微软+OpenAI合作大于竞争。且利同道合的合作与外部竞争,让他们深深绑定在一起,成为密不可分的利益共同体。
以下为OpenAI首届开发者大会上发布的重磅内容:
(1)GPT-4 Turbo
会上,OpenAI发布了比GPT-4更强的——GPT-4 Turbo。所有付费开发者可以通过在API中发送gpt-4-1106-preview来尝试GPT-4 Turbo。未来几周内,OpenAI将发布稳定的准生产模型。
GPT-4 Turbo具有128K上下文,相当于可一次性输入300多页文本内容10万汉字;训练数据知识截止至2023年4月;价格方面,GPT-4 Turbo与GPT-4相比,输入便宜3倍,输出便宜2倍。
GPT-4 Turbo还对函数调用和指令、JSON模式进行了调优。
函数调用更新:OpenAI发布了多项函数改进,包括在单个消息中调用多个函数的能力,用户可以发送一次请求多个操作的消息,例如“打开车窗并关闭空调”,这在以前需要与模型进行多次往返。
OpenAI还改进了函数调用的准确性,GPT-4 Turbo更有可能返回正确的函数参数。
指令遵循JSON模式:与其他模型相比,GPT-4 Turbo在需要仔细遵循指令的任务上表现更好,例如“始终以XML格式响应”。
支持OpenAI最新的JSON模式,该模式确保模型将响应有效的JSON。
新的API参数response_format使模型能够限制其输出以生成语法正确的JSON对象。JSON模式对于开发人员在函数调用之外,在聊天完成 API 中生成 JSON 非常有用。
(2)自定义GPT
推出了自定义GPT版本,可以帮助金融、医疗、法律、教育、日常工作、幼儿教育等任何行业。目前,OpenAI已经内置了很多定义GPT版本,用户可以直接选择使用或者自行构建。
用户在构建自定义GPT时无需任何代码,全程支持可视化点击操作,只需要给ChatGPT对话指令或额外的知识数据,然后选择是否需要网络搜索、数据分析和图片生成等多模态功能即可。
用户构建的自定义GPT助手可以共享给其他人使用,目前该功能面向ChatGPT Plus和企业版用户。
可以将GPT助手集成在其他应用中:开发人员可以通过向 GPT 提供一个或多个 API 来定义自定义操作。
和插件一样,允许 自定义GPT 集成外部数据或与现实世界交互。将 GPT 连接到数据库,将其集成在电子邮件或成为购物助手。
GPT商店:本月晚些时候,OpenAI将会推出GPT商店功能,主要用于分享用户构建的自定义GPT助手,例如,法律助手、家庭常识助手、客服助手等。
一旦你构建的GPT助手审核通过进入GPT商店,就可以被其他人搜索到并且可能会登上排行榜。这意味着,用户可以通过构建自定义GPT助手赚钱了,就像苹果的APP商店一样。
ChatGPT Plus训练数据更新:现在,ChatGPT Plus的训练数据截至 2023 年 4 月,可以回答更多最新的内容了。
此外,用户无需进行频繁的DALL·E-3、网络浏览和高级数据分析的功能切换了ChatGPT将自行完成。支持用户上传文件,例如PDF、txt等,并基于文件内容进行提问、搜索。
(3)带视觉功能的GPT-4 Turbo
GPT-4 Turbo可以接受图像作为聊天完成API中的输入,从而实现生成标题、详细分析现实世界图像以及阅读带有图片的文档等。例如,BeMyEyes已经使用这项技术帮助盲人或弱视人士完成日常任务。
开发者可以通过在API中使用gpt-4-vision-preview来尝试此功能。OpenAI计划在GPT-4 Turbo模型正式发布时,将视觉功能集成在里面。定价取决于输入图像的大小。
(4)DALL·E 3 API
现在,开发人员可以通过API将文本生成图像模型DALL·E 3 直接集成到应用程序和产品中,价格从每张图像0.04美元起。DALL·E 3 API集成了内置的内容审核功能,以帮助开发者防止其应用程序被滥用。
(5)Assistants API
OpenAI发布了Assistants API,将允许开发者在自己的应用程序中构建 AI 助手,包括指令,可以利用模型、工具和知识来响应用户查询。
目前Assistants API支持三种类型的工具:代码解释器、检索和函数调用。未来,OpenAI计划发布更多构建的工具,并允许开发者在其平台上提供自己的工具。
安全方面,开发者传递到 OpenAI API 的数据和文件永远不会用于训练模型,可以随时随地删除数据。
(6)更低的价格
GPT-4 Turbo输入代币比GPT-4便宜3倍,为0.01美元;输出代币便宜2倍,为0.03 美元。
最新款GPT-3.5 Turbo 输入代币比之前的16K型号便宜3倍,价格为 0.001 美元;输出代币便宜 2倍,价格为 0.002 美元。
经过微调的 GPT-3.5Turbo 4K 模型输入代币减少了 4 倍,价格为 0.003 美元,输出代币便宜了 2.7 倍,价格为0.006 美元。(本文综合自OpenAI 官网、腾讯科技、AIGC开放社区、腾讯科技、甲子光年、钛媒体等。)
*本号系数智云科旗下人工智能领域垂直号。黑智,人工智能领域产业服务平台,专注AI行业报道,探讨AI商业价值。
人工智能领域垂直号黑智
了解更多AI产业资讯
👇👇👇