腾讯研究院AI速递 20240617

作者：腾讯研究院发布时间：2024-06-17

腾讯英伟达生成式AI 编程

生成式AI

一、英伟达开源3400亿巨兽，98%合成数据训出最强开源通用模型！

1. 英伟达发布开源模型Nemotron-4 340B，使用合成数据挑战传统LLM训练方法，有望改变行业依赖真实数据的现状;

2. Nemotron-4 340B在性能上超越多个现有模型，与GPT-4相当，展示了合成数据在开发高性能特定领域模型中的潜力;

3. 模型结构支持多语种与编程语言，优化使用TensorRT-LLM，适应不同行业需求，商业许可友好，推动合成数据生成的广泛应用.

https://mp.weixin.qq.com/s/TTU387lxT_MgcCmxmrqy7A

二、 OpenAI董事会新成员，美国前国安局长任职历史引发网友退订产品

1. Paul M. Nakasone加入OpenAI董事会，引发用户对数据隐私和非法监控的担忧;

2. Nakasone历史上扩大了非法监控计划，包括购买美国人的敏感数据，监控互联网活动;

3. 公众对Nakasone加盟反应强烈，担心OpenAI产品的安全性，有用户表达取消服务的意向.

https://mp.weixin.qq.com/s/Qj6nJqizPus5Zsr_8KAbJg

三、智源研究院推出大模型「全家桶」及全栈开源技术基座全新版图

1. 智源研究院公布了在大语言模型、多模态、具身智能、生物计算等领域的最新研究进展;

2. 推出了支持异构计算和多模态集成的全栈开源技术基座FlagOpen 2.0和大模型“操作系统”FlagOS，支持广泛的开发和研究应用;

3. 通过全面开源和技术分享，智源研究院加速了AI技术的商业应用和学术交流.

https://mp.weixin.qq.com/s/5yEpbBaYm8GlQ6zIXCEmrw

四、端侧自动化手机操作能力备受关注，Mobile-Agent-v2版本更新

1. Mobile-Agent-v2维持了基于纯视觉的操作策略，引入多智能体协作架构，强化了跨应用操作和多语言处理能力;

2. 新版本具体改进包括任务拆解能力，增强了跨应用和多语言场景下的自动化手机操作效率;

3. Mobile-Agent-v2集成进ModelScope-Agent，通过实际演示证明了其在自动化服务中的应用潜力，特别是对老人及视障人群的帮助.

https://mp.weixin.qq.com/s/Q9zp01s2ZvORmpgAdBDsxw

五、北大快手提出VideoTetris视频框架，轻松生成各种细节，代码将开源

1. VideoTetris框架成功定义并实现了组合视频生成任务，包括多物体和多场景的复杂长视频生成;

2. 利用时空组合扩散方法，框架在不同视频帧上进行精确的时间和空间维度解构和组合，提升视频内容一致性和细节保留;

3. 该团队开发的参考帧注意力机制优化了长视频的生成质量，使得视频在复杂指令下表现出更好的动感和自然度.

https://mp.weixin.qq.com/s/nsSTckp5xsk1VhyV--t_Sw

六、 AutoStudioAI画连环画角色更一致了！人物间的复杂互动也能处理

1. AutoStudio采用多智能体协同框架，提高连环画中角色和场景的一致性及处理复杂互动;

2. 结合大语言模型和基于扩散模型的Drawer，有效生成高质量且细节一致的连环画图像;

3. 经过定量和定性评估，AutoStudio表现优于现有方法，即将开源代码加速技术共享与应用.

https://mp.weixin.qq.com/s/fjJF1LfyW49EHmmetiSQLQ

前沿科技

七、从ALOHA迈向Humanplus，斯坦福开源人形机器人，「高配版人类」上线

1. 斯坦福团队开发的人形机器人HumanPlus展现了多功能性，执行包括叠衣服、搬运货物、演奏钢琴等复杂任务;

2. HumanPlus利用RGB摄像头和增强的动作追踪技术，能够实现高度自主的任务执行和人体动作模仿;

3. 斯坦福团队提供了完全开源的研究包括论文、代码、机器人材料列表和数据集，强调科学研究的开放性和可访问性.

https://mp.weixin.qq.com/s/yCT4hoxClSFd2v1Xk_deaw

报告观点

八、马斯克：人形机器人初创公司不妙，特斯拉是天选之子；Figure AI 反驳

1. 马斯克强调特斯拉在人形机器人制造上的优势，指出其具备必要的工程、制造和AI技术能力，而普通初创公司面临巨大挑战;

2. Figure AI CEO Brett Adcock反驳，比较人形机器人与消费电子而非汽车，强调机器人的简易性和可制造性;

3. 马斯克对特斯拉未来的宏大计划表示信心，而Adcock则强调初创公司在机器人领域的潜力和必要的制造创新.

https://mp.weixin.qq.com/s/XL-x-hfLzs9nzVFUeBze0Q

九、陶哲轩最新采访：AI将颠覆数学界！用Lean规模化，百千条定理一次秒杀

1. 陶哲轩认为AI能显著提升数学研究效率，通过将数学证明形式化为Lean语言和生成LaTeX文件来协助数学家;

2. AI在数学中的应用将改变合作方式，使数学家能在更大项目上合作而不需逐一核实每部分;

3. 尽管技术尚未完善，陶哲轩乐观看待AI在未来数学证明中的作用，尤其是在减轻数学家繁琐工作的同时提高创造性任务的关注度。

https://mp.weixin.qq.com/s/WRR8Fv6o2_LCnWFwuR8X3Q

十、奥特曼谈AI的机遇、挑战与人类自我反思：中国将拥有独特的大语言模型

1. 奥特曼强调AI技术在提升生产力方面已显现积极作用，同时也带来了网络安全等问题;

2. 预测未来全球将存在10到20个大语言模型，其中中国将发展出具有本土特色的大语言模型;

3. 讨论了AI技术对人类自我认知的影响，认为AI的发展可能使人类对自身在宇宙中的位置有更多的谦卑与反思。

https://mp.weixin.qq.com/s/_b9xJlHu7deylH3Bw5UQ-A

👇订阅下方合集，获取每日推送

近期资讯

一加 Ace 5 系列手机发布，售价 2299 / 3399 元起

IT之家12月26日消息，一加Ace5系列手机今日正式发布，系列新机分别搭载高通骁龙8Gen3/至尊版处理器，配备旗舰同款索尼IMX906主摄，售价2299/3399元起（12GB+256GB）。新机延续三段式按键设计、拥有AcePerformance专属标识、配备OPPO晶盾玻璃、使用直角金属中框设计、并提供陶瓷机身版本。

IT之家 2024-12-26

如何轻松上传音乐到酷狗平台，分享你的创作与热情

上传自己的音乐到酷狗是一件很酷的事情，不仅可以让更多的人听到你的作品，还能与其他音乐爱好者互动。今天，我就来详细聊聊这个过程，让你轻松上手。在开始之前，首先要确保你有一首准备好的音乐作品。可以是自己创作的歌曲，或者是翻唱的曲目。无论是什么类型，只要是你认为值得分享的音乐，都可以尝试上传。

新报观察 2024-12-26

性能新标杆，一加Ace5正式发布：第三代骁龙8，2299元的性能野兽

终于，在万众期待中，一加Ace5正式发布，这款新机不仅继承了一加Ace系列的高性能基因，更在硬件配置和技术创新上实现了新的突破。它搭载了第三代骁龙8移动平台，这款芯片以其强大的性能和高效的功耗控制而闻名。

小米地瓜 2024-12-26

解码新质生产力｜山东日照：创新“出海” 行业争先

近日，在刚刚结束的第八届巴基斯坦工业展会上，日照惠明机械设备有限公司携带多款自主研发的雕刻机、加油机、充电桩参展，凭借较强的工业设计能力和精准的售后服务，公司产品被客户争相订购。“这是我们销往迪拜的一台五轴铝型加工中心，该产品我们自主研发，并且已经申请专利，产品已经销往全世界六七十个国家。”

金台资讯 2024-12-26

站在风口的AI玩具：价格不菲仍卖爆，是儿童“新宠”还是智商税

“让葫芦娃和孙悟空，在山头一起大战白骨精。”用户可将该产品以挂件的形式佩戴在任何玩偶身上，该挂件可提供知识问答、生成式故事以及唱儿歌等功能。

新京报 2024-12-26

如何在苹果手机上轻松为照片添加马赛克以保护个人隐私

苹果手机作为一款广受欢迎的智能设备，提供了一些简单易用的工具，可以帮助我们轻松地对照片进行马赛克处理。那么，具体该怎么操作呢？

新报观察 2024-12-26

金融界 2024-12-26

RTX 5090 GB202 GPU芯片首次现身：744平方毫米史上第三大

快科技12月26日消息，刚刚看过RTX5090非公版的PCB裸板谍照，GPU核心照又第一次出现在我们面前，就是大名鼎鼎的GB202。从照片可以证实，完整的核心编号为GB202-300-A1，与传闻相符。

驱动之家 2024-12-26

腾讯研究院AI速递 20240617

推荐体验

相关资讯

腾讯研究院AI速递 20240304

近期资讯

一加 Ace 5 系列手机发布，售价 2299 / 3399 元起

如何轻松上传音乐到酷狗平台，分享你的创作与热情

性能新标杆，一加Ace5正式发布：第三代骁龙8，2299元的性能野兽

解码新质生产力｜山东日照：创新“出海” 行业争先

站在风口的AI玩具：价格不菲仍卖爆，是儿童“新宠”还是智商税

如何在苹果手机上轻松为照片添加马赛克以保护个人隐私

阶跃星辰发布 Step-1X-Medium 模型创作能力提升

荣耀Magic7系列升级大王影像后，荣耀罗巍称手机拍照只有2家友商可比

榆笙媞申请面向干细胞培养的数据分析方法及系统专利，能提高预测的精度与准确性

RTX 5090 GB202 GPU芯片首次现身：744平方毫米史上第三大

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响