生成式AI
一、 CPU、GPU互连1米飙至100米,英特尔:你相信光吗?
1. 英特尔推出业界首款全集成光学计算互连(OCI)芯片,使用光学I/O替代电气I/O,实现更远的数据传输距离和更低的功耗;
2. OCI芯片支持最长100米的光纤传输,单向支持64个32Gbps通道,适用于大规模AI模型和数据中心;
3. 硅光子技术使得OCI芯片在晶圆级集成激光器和光放大器,提高了数据传输速度和稳定性,同时降低了功耗。
https://mp.weixin.qq.com/s/4C7Ar1P4zuho_OmSv9yLNg
二、 OpenAI的SearchGPT第一波评测!响应速度超快还没广告
1. SearchGPT提供快速响应和直观的搜索结果展示,如天气预报和地点推荐,且无广告干扰;
2. 该平台支持多媒体内容直接展示,如图片和视频,增强用户体验;
3. OpenAI的SearchGPT可能对谷歌构成竞争,尤其在无广告和直观数据展示方面具有优势。
https://mp.weixin.qq.com/s/_yReQrPvhOGkCkWQvw8Mrg
三、 为什么AI数不清Strawberry里有几个 r ?Karpathy来解释
1. AI模型在处理单词"Strawberry"时因Tokenization将其分为多个部分,导致难以正确计数字母'r';
2. Karpathy通过表情包形式的小程序展示了模型如何视觉化处理文本,揭示了模型处理简单问题的不足;
3. 提出模型应具备“认知自我知识”,通过后训练技术让模型仅回答其确信的问题,提高回答质量。
https://mp.weixin.qq.com/s/c52Ca4g0USzSIRXSEq-t4w
四、 不止卖铲子:英伟达配合Llama3.1推出定制模型、推理服务
1. 英伟达推出NVIDIA AI Foundry和NVIDIA NIM推理微服务,提供从数据管理到模型部署的全流程AI服务;
2. 合作使用Meta的Llama 3.1模型,提供定制化生成式AI模型和加速部署,提高模型运行效率和吞吐量;
3. 引入NeMo工具套件,支持数据集准备、模型微调、自动评估和安全护栏设置,增强模型的定制性和安全性。
https://mp.weixin.qq.com/s/i1zEzVTN53qyeYw7BFKZqw
五、 智谱AI视频模型「清影」:免费使用,轻松制作6秒搞笑视频
1. 智谱AI发布了名为“清影”的视频生成模型,允许用户通过文本或图片输入生成高清6秒视频,服务对所有用户免费开放;
2. 清影模型基于CogVideoX,具备深度学习和多模态学习能力,能够理解视频内容并预测事件发展;
3. 用户可自定义视频风格、情感氛围,并添加背景音乐,但需付费下载带音乐的视频版本。
https://mp.weixin.qq.com/s/xnPEULpYpIQz2nij-UuvvQ
六、 DeepMind混合大模型获重大突破,首次拿下国际奥数银牌
1. 谷歌DeepMind的AlphaProof和AlphaGeometry 2模型在2024年国际数学奥林匹克竞赛中获得银牌,展示了AI在数学推理能力上的进步;
2. AlphaGeometry 2利用神经符号框架和证明搜索技术,能自动解决几何问题并生成合成定理和证明,提高了问题解决的效率和范围;
3. AlphaProof结合预训练语言模型和AlphaZero强化学习算法,使用形式语言Lean进行数学证明,增强了模型在形式数学推理上的能力。
https://mp.weixin.qq.com/s/7XD1fT9hlnj_Jx7NlLxCWg
七、 Suno更有危机感了,Udio更新v1.5版本,是认真想做音乐
1. Udio发布v1.5版本,增加了多语言支持和音质提升至48kHz立体声,提高了音乐生成的层次感和专业性;
2. 新版本引入调性控制和音频生成音频功能,增强了对专业音乐人和普通用户的可用性和创作灵活性;
3. Udio专注于音乐生成,使用大语言模型处理复杂的音乐信息,尽管技术先进但仍难以完全替代真人表演。
https://mp.weixin.qq.com/s/cVVEG5I3mu870QDm9PGz8w
前沿科技
八、 无需任何系统的物理知识,美国阿贡国家实验室AI制造材料「指纹」
1. 美国阿贡国家实验室开发了一个无监督深度学习框架,能够自动从X射线光子相关光谱数据中识别和分类材料的松弛动力学,无需依赖物理知识;
2. 该技术通过神经网络生成材料的“指纹”,使科学家能够访问以前无法获取的信息,加速大型数据集的探索和样本识别;
3. 研究使用自动编码器技术创建材料指纹,并通过无监督学习方法将相似特征的指纹聚类,提高了材料结构和动力学变化的理解。
https://mp.weixin.qq.com/s/VEu2-Gtfwlwz62XDhMp1yw
报告观点
九、 Llama 4训练开启!MetaMeta科学家揭秘Llama 3.1是如何炼成的
1. Llama 3.1的开发考虑了多种因素如scaling law、训练时间、硬件限制,并使用了合成数据和后训练技术来优化模型性能;
2. Llama 4的研发已启动,聚焦于agent技术,旨在提高模型的智能操作能力和实用性;
3. Meta科学家Thomas Scialom强调了开源社区的重要性,并期待社区能够帮助优化和运行大规模模型,如Llama 3.1。
https://mp.weixin.qq.com/s/2q3jTMM45AJAZjF5AdXzow
十、 对话智谱AI张鹏:对标OpenAI发布视频模型,这是AGI必要一环
1. 张鹏认为视频生成技术是实现多模态人工智能和通向AGI(人工通用智能)的必要步骤;
2. 视频生成不仅是技术展示,而是整个产品和技术发展路线的一部分,重要性在于其在多模态路径中的作用;
3. 对于视频生成模型的商业化和市场反馈,张鹏表示当前的策略是初步尝试,目的是探索市场和用户需求,将根据反馈进行调整。
https://mp.weixin.qq.com/s/c9NiQPHPtoAsEwmS5GJiTA
👇订阅下方合集,获取每日推送