当前位置:首页|资讯|腾讯|生成式AI

腾讯研究院AI速递 20240729

作者:腾讯研究院发布时间:2024-07-29

生成式AI

一、 CPU、GPU互连1米飙至100米,英特尔:你相信光吗?

1. 英特尔推出业界首款全集成光学计算互连(OCI)芯片,使用光学I/O替代电气I/O,实现更远的数据传输距离和更低的功耗;

2. OCI芯片支持最长100米的光纤传输,单向支持64个32Gbps通道,适用于大规模AI模型和数据中心;

3. 硅光子技术使得OCI芯片在晶圆级集成激光器和光放大器,提高了数据传输速度和稳定性,同时降低了功耗。

https://mp.weixin.qq.com/s/4C7Ar1P4zuho_OmSv9yLNg

二、 OpenAI的SearchGPT第一波评测!响应速度超快还没广告

1. SearchGPT提供快速响应和直观的搜索结果展示,如天气预报和地点推荐,且无广告干扰;

2. 该平台支持多媒体内容直接展示,如图片和视频,增强用户体验;

3. OpenAI的SearchGPT可能对谷歌构成竞争,尤其在无广告和直观数据展示方面具有优势。

https://mp.weixin.qq.com/s/_yReQrPvhOGkCkWQvw8Mrg

三、 为什么AI数不清Strawberry里有几个 r ?Karpathy来解释

1. AI模型在处理单词"Strawberry"时因Tokenization将其分为多个部分,导致难以正确计数字母'r';

2. Karpathy通过表情包形式的小程序展示了模型如何视觉化处理文本,揭示了模型处理简单问题的不足;

3. 提出模型应具备“认知自我知识”,通过后训练技术让模型仅回答其确信的问题,提高回答质量。

https://mp.weixin.qq.com/s/c52Ca4g0USzSIRXSEq-t4w

四、 不止卖铲子:英伟达配合Llama3.1推出定制模型、推理服务

1. 英伟达推出NVIDIA AI Foundry和NVIDIA NIM推理微服务,提供从数据管理到模型部署的全流程AI服务;

2. 合作使用Meta的Llama 3.1模型,提供定制化生成式AI模型和加速部署,提高模型运行效率和吞吐量;

3. 引入NeMo工具套件,支持数据集准备、模型微调、自动评估和安全护栏设置,增强模型的定制性和安全性。

https://mp.weixin.qq.com/s/i1zEzVTN53qyeYw7BFKZqw

五、 智谱AI视频模型「清影」:免费使用,轻松制作6秒搞笑视频

1. 智谱AI发布了名为“清影”的视频生成模型,允许用户通过文本或图片输入生成高清6秒视频,服务对所有用户免费开放;

2. 清影模型基于CogVideoX,具备深度学习和多模态学习能力,能够理解视频内容并预测事件发展;

3. 用户可自定义视频风格、情感氛围,并添加背景音乐,但需付费下载带音乐的视频版本。

https://mp.weixin.qq.com/s/xnPEULpYpIQz2nij-UuvvQ

六、 DeepMind混合大模型获重大突破,首次拿下国际奥数银牌

1. 谷歌DeepMind的AlphaProof和AlphaGeometry 2模型在2024年国际数学奥林匹克竞赛中获得银牌,展示了AI在数学推理能力上的进步;

2. AlphaGeometry 2利用神经符号框架和证明搜索技术,能自动解决几何问题并生成合成定理和证明,提高了问题解决的效率和范围;

3. AlphaProof结合预训练语言模型和AlphaZero强化学习算法,使用形式语言Lean进行数学证明,增强了模型在形式数学推理上的能力。

https://mp.weixin.qq.com/s/7XD1fT9hlnj_Jx7NlLxCWg

七、 Suno更有危机感了,Udio更新v1.5版本,是认真想做音乐

1. Udio发布v1.5版本,增加了多语言支持和音质提升至48kHz立体声,提高了音乐生成的层次感和专业性;

2. 新版本引入调性控制和音频生成音频功能,增强了对专业音乐人和普通用户的可用性和创作灵活性;

3. Udio专注于音乐生成,使用大语言模型处理复杂的音乐信息,尽管技术先进但仍难以完全替代真人表演。

https://mp.weixin.qq.com/s/cVVEG5I3mu870QDm9PGz8w

前沿科技

八、 无需任何系统的物理知识,美国阿贡国家实验室AI制造材料「指纹」

1. 美国阿贡国家实验室开发了一个无监督深度学习框架,能够自动从X射线光子相关光谱数据中识别和分类材料的松弛动力学,无需依赖物理知识;

2. 该技术通过神经网络生成材料的“指纹”,使科学家能够访问以前无法获取的信息,加速大型数据集的探索和样本识别;

3. 研究使用自动编码器技术创建材料指纹,并通过无监督学习方法将相似特征的指纹聚类,提高了材料结构和动力学变化的理解。

https://mp.weixin.qq.com/s/VEu2-Gtfwlwz62XDhMp1yw

报告观点

九、 Llama 4训练开启!MetaMeta科学家揭秘Llama 3.1是如何炼成的

1. Llama 3.1的开发考虑了多种因素如scaling law、训练时间、硬件限制,并使用了合成数据和后训练技术来优化模型性能;

2. Llama 4的研发已启动,聚焦于agent技术,旨在提高模型的智能操作能力和实用性;

3. Meta科学家Thomas Scialom强调了开源社区的重要性,并期待社区能够帮助优化和运行大规模模型,如Llama 3.1。

https://mp.weixin.qq.com/s/2q3jTMM45AJAZjF5AdXzow

十、 对话智谱AI张鹏:对标OpenAI发布视频模型,这是AGI必要一环

1. 张鹏认为视频生成技术是实现多模态人工智能和通向AGI(人工通用智能)的必要步骤;

2. 视频生成不仅是技术展示,而是整个产品和技术发展路线的一部分,重要性在于其在多模态路径中的作用;

3. 对于视频生成模型的商业化和市场反馈,张鹏表示当前的策略是初步尝试,目的是探索市场和用户需求,将根据反馈进行调整。

https://mp.weixin.qq.com/s/c9NiQPHPtoAsEwmS5GJiTA

👇订阅下方合集,获取每日推送


Copyright © 2025 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1