当前位置:首页|资讯|腾讯|清华|GPT-4|AIGC

腾讯研究院AI速递 20240417

作者:腾讯研究院发布时间:2024-04-17

原标题:腾讯研究院AI速递 20240417

生成式AI

一、 全球大模型牌桌上又多一名高端玩家,最新多模态大模型Reka Core

1. Reka AI团队,由前DeepMind、Google Brain和FAIR成员组成,发布了与GPT-4匹敌的多模态大模型Reka Core;

2. Reka Core支持图像、视频和音频的混合输入,展现出比Gemini Ultra更强的多模态性能;

3. 团队规模小但高效,由22人组成,成员多为远程办公,涵盖清华北航校友参与在内的多元背景。

https://mp.weixin.qq.com/s/PHgZWjc8jBqa6Bu6kpIYEw

二、 OpenAI推出针对开发者的Batch API,24小时内半价批量处理!

1. OpenAI发布了针对大量数据处理的Batch API,提供24小时内的处理结果;

2. Batch API特色在于处理成本为常规同步API的一半,并支持多种状态显示以追踪进展;

3. 该API支持包括GPT-3.5-turbo和GPT-4在内的多个模型,适用于文本生成至数据分析等多种场景。

https://mp.weixin.qq.com/s/jw5gvziKqJfuNDHXn-MdEA

三、 Sora加入Adobe全家桶,Adobe PR全新版本的更新计划公布

1. Adobe宣布将在Premiere Pro中集成第三方AI视频生成模型如OpenAI的Sora,提供高级生成式AI视频创作能力;

2. 新工具支持自动生成视频内容,包括扩展镜头长度和增加背景元素,强化了视频编辑的灵活性和创造力;

3. Adobe将推出一套全新的生成式AI工作流程,包括文本到视频的转换和视频中对象的智能检测与编辑。

https://mp.weixin.qq.com/s/Da3lY-344jUFGqEfV8B_Qg

四、 OpenAI开设日本办公室!亚洲第一个办事处,拓展多元化收入

1. OpenAI在东京设立了新办公室,标志着其首次进入亚洲市场,旨在与日本政府和企业合作开发安全AI工具;

2. 为服务日本市场,OpenAI推出了优化日语的GPT-4定制模型,提升了翻译和文本总结性能,运行速度快3倍;

3. 日本的领先企业和地方政府已开始采用OpenAI的服务,如ChatGPT Enterprise,以提高业务流程的自动化和公共服务效率。

https://mp.weixin.qq.com/s/L1IFZY-w4q7MNG1trfZtgA

五、 国产大模型问鼎港股AIGC第一股!连续2年盈利,营收10个亿

1. 出门问问计划于4月24日在香港交易所主板上市,股票代码为「2438」,标志其作为大模型赛道上的第一家上市公司;

2. 公司拥有强大的国际投资背景和地方国资支持,且在大模型商业化领域中率先盈利,连续两年实现正的经调整净利润;

3. 出门问问的全球化战略成功,海外营收占比近一半,产品如智能手表TicWatch在国际市场广受欢迎。

https://mp.weixin.qq.com/s/xddHpfnT3KaMAiwSnY1LvA

六、 极长序列、极快速度:面向新一代高效大语言模型的LASP序列并行

1. LASP(Linear Attention Sequence Parallelism)提出,可在128卡A100 80G GPU上将序列长度扩展至4M,极大超过传统序列并行方法;

2. 与Linear Attention方法兼容,支持多种序列建模方法如Lightning Attention和State Space Modeling,提升了计算效率和模型性能;

3. 实现了高效通信和数据分发,通过优化的通信机制,支持高达数百卡的GPU并行,且与各种数据并行方法兼容。

https://mp.weixin.qq.com/s/wPJsmgSAYgh3Si2eZ0_HzA

前沿科技

七、 人工智能一大感官再次增强,嗅觉数字化!Osmo通过AI还原记忆中的味道

1. Osmo实现了气味的远程传送技术,能够在一地捕捉气味并在另一地释放,向数字世界引入嗅觉感知;

2. 气味传送利用环保分子技术,通过气相色谱质谱仪和AI模型捕捉并分析气味分子,再用专用打印机重现气味;

3. 该技术的商业应用前景广阔,能够为用户在全球任何地方重现地域特有或个人记忆中的气味。

https://mp.weixin.qq.com/s/dZZhUJzGu44mVpd4aKbIPA

八、 AI助力脑机接口研究,纽约大学突破性神经语音解码技术,登Nature子刊

1. 新型的可微分语音合成器:使用轻型卷积神经网络将语音编码为可解释的参数,如音高、响度,然后通过合成器重合成语音;

2. 高度可解释的神经语音解码系统:适用于小数据量,能够生成自然且贴近原声的语音,增强了模型的泛化能力;

3. 实时应用的因果模型:研究展示了因果和非因果模型的比较,强调因果模型在实时脑机接口应用中的重要性。

https://mp.weixin.qq.com/s/FqVnWMiIQVVqnRL9L0e-oQ

报告观点

九、 1.2万字实录,Sam Altman & Brad Lightcap 最新专访:哪些公司会被 OpenAI 碾压?

1. Sam Altman认为持续进步策略很重要,尽管许多初创企业选择基于当前AI性能的策略,但更应信赖模型将持续改进的策略;

2. OpenAI角色和使命方面,Brad Lightcap从一开始的财务角色到关键执行官的变迁,反映了OpenAI快速适应和成长的能力;

3. Altman特别强调计算资源的重要性,认为这是关键资源,是推动AI普及的关键,企业需要为未来技术迭代做好准备。

https://mp.weixin.qq.com/s/jWaDVmimkWBMT64h6wXCEA

十、 李飞飞团队年度报告揭底大模型训练成本:Gemini Ultra是GPT-4的2.5倍

1. Gemini Ultra的训练成本是GPT-4的2.5倍,显著提升了开发前沿AI模型的财务负担;

2. AI技术在加速发展,特别是在多模态能力方面,但AI的可解释性和社会影响的问题仍未得到有效解决;

3. 尽管全球企业对AI的投资有所下降,但生成式AI依然吸引了巨额资金,显示出其市场潜力。

https://mp.weixin.qq.com/s/-XIRaTujUH2poNSu0H_1tQ

👇订阅下方合集,获取每日推送


Copyright © 2025 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1