生成式AI
一、 英伟达开源3400亿巨兽,98%合成数据训出最强开源通用模型!
1. 英伟达发布开源模型Nemotron-4 340B,使用合成数据挑战传统LLM训练方法,有望改变行业依赖真实数据的现状;
2. Nemotron-4 340B在性能上超越多个现有模型,与GPT-4相当,展示了合成数据在开发高性能特定领域模型中的潜力;
3. 模型结构支持多语种与编程语言,优化使用TensorRT-LLM,适应不同行业需求,商业许可友好,推动合成数据生成的广泛应用.
https://mp.weixin.qq.com/s/TTU387lxT_MgcCmxmrqy7A
二、 OpenAI董事会新成员,美国前国安局长任职历史引发网友退订产品
1. Paul M. Nakasone加入OpenAI董事会,引发用户对数据隐私和非法监控的担忧;
2. Nakasone历史上扩大了非法监控计划,包括购买美国人的敏感数据,监控互联网活动;
3. 公众对Nakasone加盟反应强烈,担心OpenAI产品的安全性,有用户表达取消服务的意向.
https://mp.weixin.qq.com/s/Qj6nJqizPus5Zsr_8KAbJg
三、 智源研究院推出大模型「全家桶」及全栈开源技术基座全新版图
1. 智源研究院公布了在大语言模型、多模态、具身智能、生物计算等领域的最新研究进展;
2. 推出了支持异构计算和多模态集成的全栈开源技术基座FlagOpen 2.0和大模型“操作系统”FlagOS,支持广泛的开发和研究应用;
3. 通过全面开源和技术分享,智源研究院加速了AI技术的商业应用和学术交流.
https://mp.weixin.qq.com/s/5yEpbBaYm8GlQ6zIXCEmrw
四、 端侧自动化手机操作能力备受关注,Mobile-Agent-v2版本更新
1. Mobile-Agent-v2维持了基于纯视觉的操作策略,引入多智能体协作架构,强化了跨应用操作和多语言处理能力;
2. 新版本具体改进包括任务拆解能力,增强了跨应用和多语言场景下的自动化手机操作效率;
3. Mobile-Agent-v2集成进ModelScope-Agent,通过实际演示证明了其在自动化服务中的应用潜力,特别是对老人及视障人群的帮助.
https://mp.weixin.qq.com/s/Q9zp01s2ZvORmpgAdBDsxw
五、 北大快手提出VideoTetris视频框架,轻松生成各种细节,代码将开源
1. VideoTetris框架成功定义并实现了组合视频生成任务,包括多物体和多场景的复杂长视频生成;
2. 利用时空组合扩散方法,框架在不同视频帧上进行精确的时间和空间维度解构和组合,提升视频内容一致性和细节保留;
3. 该团队开发的参考帧注意力机制优化了长视频的生成质量,使得视频在复杂指令下表现出更好的动感和自然度.
https://mp.weixin.qq.com/s/nsSTckp5xsk1VhyV--t_Sw
六、 AutoStudioAI画连环画角色更一致了!人物间的复杂互动也能处理
1. AutoStudio采用多智能体协同框架,提高连环画中角色和场景的一致性及处理复杂互动;
2. 结合大语言模型和基于扩散模型的Drawer,有效生成高质量且细节一致的连环画图像;
3. 经过定量和定性评估,AutoStudio表现优于现有方法,即将开源代码加速技术共享与应用.
https://mp.weixin.qq.com/s/fjJF1LfyW49EHmmetiSQLQ
前沿科技
七、 从ALOHA迈向Humanplus,斯坦福开源人形机器人,「高配版人类」上线
1. 斯坦福团队开发的人形机器人HumanPlus展现了多功能性,执行包括叠衣服、搬运货物、演奏钢琴等复杂任务;
2. HumanPlus利用RGB摄像头和增强的动作追踪技术,能够实现高度自主的任务执行和人体动作模仿;
3. 斯坦福团队提供了完全开源的研究包括论文、代码、机器人材料列表和数据集,强调科学研究的开放性和可访问性.
https://mp.weixin.qq.com/s/yCT4hoxClSFd2v1Xk_deaw
报告观点
八、 马斯克:人形机器人初创公司不妙,特斯拉是天选之子;Figure AI 反驳
1. 马斯克强调特斯拉在人形机器人制造上的优势,指出其具备必要的工程、制造和AI技术能力,而普通初创公司面临巨大挑战;
2. Figure AI CEO Brett Adcock反驳,比较人形机器人与消费电子而非汽车,强调机器人的简易性和可制造性;
3. 马斯克对特斯拉未来的宏大计划表示信心,而Adcock则强调初创公司在机器人领域的潜力和必要的制造创新.
https://mp.weixin.qq.com/s/XL-x-hfLzs9nzVFUeBze0Q
九、 陶哲轩最新采访:AI将颠覆数学界!用Lean规模化,百千条定理一次秒杀
1. 陶哲轩认为AI能显著提升数学研究效率,通过将数学证明形式化为Lean语言和生成LaTeX文件来协助数学家;
2. AI在数学中的应用将改变合作方式,使数学家能在更大项目上合作而不需逐一核实每部分;
3. 尽管技术尚未完善,陶哲轩乐观看待AI在未来数学证明中的作用,尤其是在减轻数学家繁琐工作的同时提高创造性任务的关注度。
https://mp.weixin.qq.com/s/WRR8Fv6o2_LCnWFwuR8X3Q
十、 奥特曼谈AI的机遇、挑战与人类自我反思:中国将拥有独特的大语言模型
1. 奥特曼强调AI技术在提升生产力方面已显现积极作用,同时也带来了网络安全等问题;
2. 预测未来全球将存在10到20个大语言模型,其中中国将发展出具有本土特色的大语言模型;
3. 讨论了AI技术对人类自我认知的影响,认为AI的发展可能使人类对自身在宇宙中的位置有更多的谦卑与反思。
https://mp.weixin.qq.com/s/_b9xJlHu7deylH3Bw5UQ-A
👇订阅下方合集,获取每日推送