当前位置:首页|资讯|腾讯|生成式AI|大语言模型

腾讯研究院AI速递 20240402

作者:腾讯研究院发布时间:2024-04-02

原标题:腾讯研究院AI速递 20240402

生成式AI

一、 国产LLM新玩家「阶跃星辰」一年肝出万亿参数MoE!霸榜多模态

1. 阶跃星辰发布了三个大模型:千亿参数语言大模型、千亿参数多模态大模型、万亿参数MoE语言大模型,国内初创公司首次达到万亿参数级别;

2. 公司深信Scaling Law,通过模型规模扩大提升性能,目标是实现人工通用智能(AGI);

3. 阶跃星辰在算力、数据、算法和系统上取得突破,展现了其在大模型训练及应用方面的能力。

https://mp.weixin.qq.com/s/JDGDUe26bdjlpkFjgZyx3A

二、 可编辑的DALL·E 3要来了?一句话就能PS图片,网友放出预览版本

1. OpenAI即将推出可编辑的DALL・E 3,支持用户选择图像区域并进行文本描述来编辑图像;

2. 新功能集成进ChatGPT,允许添加、删除和更新图像的特定部分,具备撤销、恢复和清除选择的操作;

3. 尽管还未正式发布,预览版本已展示出操作流程和编辑器界面,预示用户很快就能体验到这一功能。

https://mp.weixin.qq.com/s/4vn-KA0Y_2_sv_JMzgWg1A

三、 谷歌力推的JAX性能超越Pytorch等,或成GPU推理训练最快选择

1. JAX在最新基准测试中性能超越Pytorch和TensorFlow,谷歌背后支持;

2. 测试非TPU环境下完成,JAX在7项指标中排名第一,未来可能成为大模型训练与推理首选;

3. Keras 3性能普遍超过PyTorch标准实现,提供优于Keras 2的「开箱即用」性能,无需复杂优化。

https://mp.weixin.qq.com/s/aHn83H_zw33J0HwsEv-lhw

四、 微软Azure发布9款逼真AI语音,全面升级Azure AI语音服务

1. 微软Azure语音服务推出9款新逼真AI语音,涵盖英语、德语、法语、中文普通话;新语音采用最新神经网络语音合成技术,提高了语音体验的自然流畅度;

2. 其中,中文语音非常惊艳,几乎听不出来AI感;除了新增语音外,微软还对现有英语语音进行了优化,包括发布Ryan多语种语音、升级Jenny为JennyMultilingualV2版本等。

https://mp.weixin.qq.com/s/vx4XFXAG3lQAKTqERAQk-Q

五、 LISA,比LoRA还快50%的微调方法来了!一张3090性能超越全参调优

1. LISA算法超越LoRA和全参数微调,在指令微调任务上表现优异,同时空间消耗低;

2. LISA通过始终更新底层embedding和顶层linear head,随机更新少量中间层,实现高效微调;

3. LISA的实现LMFlow已开源,支持简单命令实现微调,旨在降低大模型微调的门槛。

https://mp.weixin.qq.com/s/7s8NNGYlq4JWeln0TkOKmQ

六、 AI现在可以理解人类的情感了?Hume AI推出情感智能的语音AI

1. Hume AI推出首款情感智能AI产品EVI,能理解和表达23种不同的情绪;

2. EVI基于全球数百万人类对话训练,能实时优化响应以适应用户情绪状态;

3. 产品可能应用于机器人、医疗保健等领域,旨在提高人类福祉和使人工智能交互更自然。

https://mp.weixin.qq.com/s/ERaZh975DeDPMJIq-4f4gw

七、 手机变身ChatGPT实体机器人,只需一个配件,能说话还会做梦

1. LOOI是一款集成ChatGPT的智能桌面机器人,能进行复杂对话、理解人类情感,并通过视觉模块感知周围环境;

2. 利用手机作为其大脑和屏幕,支持多种情绪表达和照片分析以展示情绪,实现成本节约;

3. 目前仅支持英文,电池续航约10小时,未来计划增加更多语言支持和功能,期待人机和谐共生的未来。

https://mp.weixin.qq.com/s/WL3pTa49ZuOT9fQwasriAw

前沿科技

八、 “大模型+机器人”的现状和未来,斯坦福、普林斯顿、英伟达、DeepMind等联合发布综述

1. 基础模型在机器人学中提供了先验知识和泛化能力,特别是在感知、决策、规划和控制方面有显著应用;

2. 大型语言模型、视觉Transformer模型、视觉-语言模型、具身多模态语言模型和视觉生成模型等都被有效应用于机器人技术;

3. 尽管取得了进展,基础模型在实时性、鲁棒性、可解释性和综合系统集成方面仍面临挑战,未来研究需进一步探索。

https://mp.weixin.qq.com/s/YEo3FMNTHRHBOBsO7HD2tw

报告观点

九、 Mistral CEO红杉分享:五年后任何人都能创建 AI 自主代理,开发者与用户界限变模糊

1. 在未来五年内,任何人都将能够创建AI自主代理,使开发者与用户之间的界限变得模糊;

2. AI技术的普及将依靠自然语言交互,使得个性化AI助手工具的创建变得更加容易和普遍;

3. LLM的应用和部署将向更多状态化形式演进,与数据和上下文更紧密地关联,开源模型的整合将促进整个行业的发展。

https://mp.weixin.qq.com/s/Ch12eEOcgqDRkr6y7BmjBg

十、 AIGC尽头除了电力还有铜?摩根士丹利:AI数据中心就是“吞铜兽”,今年铜价或再涨18%

1. AI数据中心的铜需求增长将成为推动铜价上涨的新动力,预计2024年四季度铜价将上涨18%至10500美元/吨;

2. 全球AI数据中心对铜的需求将从2023年的每年20万吨增至2027年的50万吨至120万吨,年复合增长率达到26%;

3. AI数据中心对铜的需求到2027年可能占全球铜需求的3.3%,其中铜主要用于电力分配设备和接地与互联。

https://mp.weixin.qq.com/s/dl2J8vO9ljwMfeeu6eHwHA

点击下方#腾讯研究院AI速递合集 查看往期内容


Copyright © 2025 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1