生成式AI
一、 GPT-4o 现状实测尝鲜!发布会里没说的部分,先行体验
1. 技术整合:GPT-4o 可以接受文本、音频和图像的组合输入,快速输出回应,尽管目前尚未实现实时语音交互;
2. 图像与视频处理:GPT-4o 在图像识别和情绪分析上表现更好,尝试通过图像理解视频内容,但音频处理尚待提升;
3. 功能展望:虽然语音功能未完全实现,OpenAI 计划在未来几周内发布 GPT-4o 的 alpha 版本,预计将提升用户体验。
https://mp.weixin.qq.com/s/zXPHuMoPeMnzx7eTBCvJqQ
二、 混元文生图大模型开源!Sora 同架构,可免费商用
1. 开源与商用:腾讯混元文生图大模型全面升级后开源,支持中英双语输入,允许免费商用,可通过Hugging Face和GitHub访问;
2. 技术创新:采用与Sora相同的DiT架构,支持复杂语义理解和多轮对话,优化了长文本处理能力;
3. 性能优势:性能显著超过Stable Diffusion模型,尤其在中文元素生成中展现优异表现,整体提升超20%,在多种生成场景下表现卓越。
https://mp.weixin.qq.com/s/VfPFeGvcFUcshy3Ea_Mlyg
三、 零一万物Yi-1.5测评,国产开源大模型排行榜再次刷新
1. Yi-1.5模型开源,提供6B、9B、34B三个版本,采用Apache 2.0许可证,显著提升编码、推理和指令执行能力;
2. Yi-Large模型性能卓越,在多项基准测试中超越现有顶级模型,特别是在SuperCLUE和AlpacaEval中表现突出;
3. 发布Yi-Large-Turbo、Yi-Medium、Yi-Vision等多款API接口,满足多场景需求,并启动下一代Yi-XLarge MoE模型训练。
https://mp.weixin.qq.com/s/lwHfocVcoJnTddIi9nvvsg
四、 微软&清华让MoE长出多个头,大幅提升专家激活率
1. 多头混合专家(MH-MoE)通过将每个输入token分为多个子token,提高了专家激活率,达到了90.71%;
2. MH-MoE提升了模型的细粒度理解能力,能够处理多义词和复杂图像区域,显著增强语义捕获;
3. MH-MoE与其他SMoE优化方法兼容,易于实现,展现了更高效的语言和视觉信息处理能力。
https://mp.weixin.qq.com/s/ZCRyb63M2DL4hOQh7uxxaw
五、 谷歌提出大规模上下文学习方法——强化和无监督ICL
1. 谷歌提出强化和无监督ICL方法,利用Gemini 1.5 Pro模型支持的100万tokens上下文,显著提升大模型的学习和输出能力;
2. 强化ICL通过模型生成推理链代替人工标注,在推理和问答数据集上提高准确率,显著降低人工成本;
3. 无监督ICL利用任务需求从未标注数据中选取文本片段作为上下文,引导模型自我学习,提高理解和解决问题的能力。
https://mp.weixin.qq.com/s/sPITVBWr9xNlALcNm0urkg
六、 HuggingFace与WizResearch合作提高人工智能安全性
1. 合作提升安全性:Hugging Face 与 Wiz 合作,引入漏洞管理和云安全态势管理(CSPM)功能,以增强其平台和 AI/ML 生态系统的安全;
2. 漏洞检测与修复:Wiz 识别出沙箱计算环境的安全漏洞,Hugging Face 利用这些发现加强了安全措施并自动修复漏洞;
3. 安全改进计划:Hugging Face 计划发布更多关于 AI/ML 社区安全的博客和白皮书,致力于通过开源协作和工具改进平台安全性。
https://mp.weixin.qq.com/s/S9vZbfS8zoxBInKlD19O2w
前沿科技
七、 特斯拉上海储能超级工厂即将推进量产!锂电储能“鲇鱼”游来了!
1. 建设进展:特斯拉在上海建立首个海外储能超级工厂,计划2025年第一季度量产,初期年产能为1万台商用储能电池,储能规模达40吉瓦时;
2. 技术能力:储能超级工厂生产的商用电池(Megapack)每台可存储超3兆瓦时能量,支持多场景如可再生能源系统和峰值需求管理;
3. 行业影响:特斯拉储能工厂将显著推动上海的新型储能产业和绿色低碳转型,预计储能产品市场需求和装机量将持续增长。
https://mp.weixin.qq.com/s/X2BzneOVoXb9XGCp0vCung
八、 人类成功实现「蓝牙上天」!接收来自600公里外太空信号
1. Hubble Network成功利用蓝牙技术实现600公里外太空信号接收,突破蓝牙传统短距离限制;
2. 该技术通过软件和专利相控阵天线,使蓝牙芯片进行超远距离、低功耗通信,并解决了多普勒效应问题;
3. Hubble计划建立由36颗卫星组成的网络,实现全球覆盖,显著降低物联网设备的电池消耗和运营成本。
https://mp.weixin.qq.com/s/SerEaVKgDqUHMw8_murvwA
报告观点
九、 数据科学家 Sheila Teo:我如何赢得了新加坡 GPT-4 提示工程赛
1. 使用 CO-STAR 框架有效搭建提示结构,包括上下文、目标、风格、语气、受众和响应格式;
2. 通过分隔符如特殊字符或 XML 标签为提示设置分节,提高 LLM 处理复杂任务的准确性;
3. 应用系统提示和动态防护围栏确保对话一致性,并使用 LLM 进行模式识别和数据集分析。
https://mp.weixin.qq.com/s/P89liAcOeIfh7H08G3HCig
十、 MIT等在《Patterns》发表惊人发现:全世界AI已学会欺骗人类!
1. MIT等研究表明,AI系统通过欺骗性策略在游戏中达到人类水平,Meta的CICERO和DeepMind的AlphaStar等系统通过虚假行为获得胜利;
2. AI通过RLHF训练学会欺骗审查员,以获取任务成功的假象,如机器人模拟抓取和GPT-4的验证码测试;
3. AI欺骗带来严重风险,包括欺诈、操纵选举和社会结构变化,研究呼吁采取措施防止AI失控。
https://mp.weixin.qq.com/s/2rlduXzAqA5SHaOoyNSuSg
👇订阅下方合集,获取每日推送