生成式AI
一、 国产LLM新玩家「阶跃星辰」一年肝出万亿参数MoE!霸榜多模态
1. 阶跃星辰发布了三个大模型:千亿参数语言大模型、千亿参数多模态大模型、万亿参数MoE语言大模型,国内初创公司首次达到万亿参数级别;
2. 公司深信Scaling Law,通过模型规模扩大提升性能,目标是实现人工通用智能(AGI);
3. 阶跃星辰在算力、数据、算法和系统上取得突破,展现了其在大模型训练及应用方面的能力。
https://mp.weixin.qq.com/s/JDGDUe26bdjlpkFjgZyx3A
二、 可编辑的DALL·E 3要来了?一句话就能PS图片,网友放出预览版本
1. OpenAI即将推出可编辑的DALL・E 3,支持用户选择图像区域并进行文本描述来编辑图像;
2. 新功能集成进ChatGPT,允许添加、删除和更新图像的特定部分,具备撤销、恢复和清除选择的操作;
3. 尽管还未正式发布,预览版本已展示出操作流程和编辑器界面,预示用户很快就能体验到这一功能。
https://mp.weixin.qq.com/s/4vn-KA0Y_2_sv_JMzgWg1A
三、 谷歌力推的JAX性能超越Pytorch等,或成GPU推理训练最快选择
1. JAX在最新基准测试中性能超越Pytorch和TensorFlow,谷歌背后支持;
2. 测试非TPU环境下完成,JAX在7项指标中排名第一,未来可能成为大模型训练与推理首选;
3. Keras 3性能普遍超过PyTorch标准实现,提供优于Keras 2的「开箱即用」性能,无需复杂优化。
https://mp.weixin.qq.com/s/aHn83H_zw33J0HwsEv-lhw
四、 微软Azure发布9款逼真AI语音,全面升级Azure AI语音服务
1. 微软Azure语音服务推出9款新逼真AI语音,涵盖英语、德语、法语、中文普通话;新语音采用最新神经网络语音合成技术,提高了语音体验的自然流畅度;
2. 其中,中文语音非常惊艳,几乎听不出来AI感;除了新增语音外,微软还对现有英语语音进行了优化,包括发布Ryan多语种语音、升级Jenny为JennyMultilingualV2版本等。
https://mp.weixin.qq.com/s/vx4XFXAG3lQAKTqERAQk-Q
五、 LISA,比LoRA还快50%的微调方法来了!一张3090性能超越全参调优
1. LISA算法超越LoRA和全参数微调,在指令微调任务上表现优异,同时空间消耗低;
2. LISA通过始终更新底层embedding和顶层linear head,随机更新少量中间层,实现高效微调;
3. LISA的实现LMFlow已开源,支持简单命令实现微调,旨在降低大模型微调的门槛。
https://mp.weixin.qq.com/s/7s8NNGYlq4JWeln0TkOKmQ
六、 AI现在可以理解人类的情感了?Hume AI推出情感智能的语音AI
1. Hume AI推出首款情感智能AI产品EVI,能理解和表达23种不同的情绪;
2. EVI基于全球数百万人类对话训练,能实时优化响应以适应用户情绪状态;
3. 产品可能应用于机器人、医疗保健等领域,旨在提高人类福祉和使人工智能交互更自然。
https://mp.weixin.qq.com/s/ERaZh975DeDPMJIq-4f4gw
七、 手机变身ChatGPT实体机器人,只需一个配件,能说话还会做梦
1. LOOI是一款集成ChatGPT的智能桌面机器人,能进行复杂对话、理解人类情感,并通过视觉模块感知周围环境;
2. 利用手机作为其大脑和屏幕,支持多种情绪表达和照片分析以展示情绪,实现成本节约;
3. 目前仅支持英文,电池续航约10小时,未来计划增加更多语言支持和功能,期待人机和谐共生的未来。
https://mp.weixin.qq.com/s/WL3pTa49ZuOT9fQwasriAw
前沿科技
八、 “大模型+机器人”的现状和未来,斯坦福、普林斯顿、英伟达、DeepMind等联合发布综述
1. 基础模型在机器人学中提供了先验知识和泛化能力,特别是在感知、决策、规划和控制方面有显著应用;
2. 大型语言模型、视觉Transformer模型、视觉-语言模型、具身多模态语言模型和视觉生成模型等都被有效应用于机器人技术;
3. 尽管取得了进展,基础模型在实时性、鲁棒性、可解释性和综合系统集成方面仍面临挑战,未来研究需进一步探索。
https://mp.weixin.qq.com/s/YEo3FMNTHRHBOBsO7HD2tw
报告观点
九、 Mistral CEO红杉分享:五年后任何人都能创建 AI 自主代理,开发者与用户界限变模糊
1. 在未来五年内,任何人都将能够创建AI自主代理,使开发者与用户之间的界限变得模糊;
2. AI技术的普及将依靠自然语言交互,使得个性化AI助手工具的创建变得更加容易和普遍;
3. LLM的应用和部署将向更多状态化形式演进,与数据和上下文更紧密地关联,开源模型的整合将促进整个行业的发展。
https://mp.weixin.qq.com/s/Ch12eEOcgqDRkr6y7BmjBg
十、 AIGC尽头除了电力还有铜?摩根士丹利:AI数据中心就是“吞铜兽”,今年铜价或再涨18%
1. AI数据中心的铜需求增长将成为推动铜价上涨的新动力,预计2024年四季度铜价将上涨18%至10500美元/吨;
2. 全球AI数据中心对铜的需求将从2023年的每年20万吨增至2027年的50万吨至120万吨,年复合增长率达到26%;
3. AI数据中心对铜的需求到2027年可能占全球铜需求的3.3%,其中铜主要用于电力分配设备和接地与互联。
https://mp.weixin.qq.com/s/dl2J8vO9ljwMfeeu6eHwHA
点击下方#腾讯研究院AI速递合集 查看往期内容