当前位置:首页|资讯|腾讯|生成式AI|人工智能|AI芯片

腾讯研究院AI速递 20240411

作者:腾讯研究院发布时间:2024-04-11

原标题:腾讯研究院AI速递 20240411

生成式AI

一、 英特尔的最强AI芯片来了,Gaudi 3深度解读,旨在与NVIDIA竞争

1. 英特尔推出Gaudi 3人工智能加速器,预计在AI市场中与NVIDIA竞争,凭借1835 TFLOPS的FP8计算吞吐量和对低精度浮点和整数数学的支持,专为AI训练和推理优化;

2. Gaudi 3基于5纳米工艺,拥有增强的计算硬件,包括4个矩阵数学引擎和32个张量核心,旨在提高性能和扩展性,支持到128GB的HBM2e内存;

3. Gaudi 3通过内置的200 Gbps RoCE 以太网控制器,提升网络I/O带宽至8.4TB/秒,支持高效的节点间以太网连接,强化集群的可扩展性和互连性,面向大型AI训练和推理工作负载。

https://mp.weixin.qq.com/s/-LSIITeNNdu4nJav6jQ8mw

二、 全面突围!谷歌更新了一系列大模型产品,从模型、工具到芯片!

1. Gemini 1.5 Pro增强功能:提供本地音频理解,上下文处理能力提升至100万token,支持视频的图像和音频推理,首次引入系统指令和JSON模式,增强文件API;

2. 开源工具集:推出Max Diffusion、Jetstream、MaxTest三大开源工具,支持生成式AI项目,提高性价比,支持TPU和Nvidia GPU;

3. 首款自研Arm处理器Axion:基于Arm Neoverse 2,性能超过竞争对手30%,提高数据中心的性能和能效;

4. CodeGemma代码生成新模型:提供智能代码补全和生成,支持多种编程语言,凭借训练数据量和准确性优势,提高开发效率。

https://mp.weixin.qq.com/s/SWGMtLYSss2MR6or8J87HQ

三、 「视觉版」GPT-4 Turbo重磅升级!ChatGPT 40条消息限制或取消

1. OpenAI发布GPT-4 Turbo正式版,具备视觉功能,能处理128k上下文,训练数据截止到2023年12月;

2. GPT-4 Turbo引入视觉能力后,在编码任务表现较差,代码编辑能力得分为62%,是GPT-4型号中最低;

3. OpenAI取消GPT-4每3小时40条消息的限制,改为根据系统繁忙程度动态调整用户请求次数,但用户反馈使用体验不一。

https://mp.weixin.qq.com/s/rinWSzeNl1r-N_LFfe3G9g

四、 刚刚,Mistral AI最新磁力链放出!8x22B MoE模型,281GB解禁

1. Mistral AI发布全新8x22B MoE模型,包含56层、48个注意力头,支持65k上下文长度;

2. 通过281GB磁力链分享,引起AI社区广泛关注,性能超越前代模型,支持复杂多语言任务;

3. 最新模型支持社区成员在抱抱脸平台上构建应用,展示卓越的逻辑推理和代码生成能力。

https://mp.weixin.qq.com/s/p_jkVrCLoSA-FoEkQ0m2iQ

五、 开源模型首胜GPT-4!引发热议,Karpathy:这是我唯二信任的榜单

1. 1040亿参数的开源模型Command R+在大模型竞技场上达到GPT-4水平,超越了GPT-4的某些版本;

2. Command R+特别优化了检索增强生成(RAG)技术,覆盖10+种语言,性价比高于GPT-4 turbo;

3. 尽管在某些主观评测中表现突出,Command R+在代码能力测试中的排名低于GPT-3.5,中文能力也待进一步验证。

https://mp.weixin.qq.com/s/lg3H5GlZlGOv0PjxWF1OHg

六、 2万亿训练数据,120亿参数!开源大模型Stable LM 2-12B

1. Stability.ai开源Stable LM 2 12B模型,采用Transformer架构,涵盖7种语言和2万亿tokens的训练数据;

2. Stable LM 2 12B在多个基准测试上性能优越,超过了知名开源模型如Qwen1.5-14B-Chat、Mistral-7B-Instruct-v0.2;

3. 模型采用创新技术如“FlashAttention-2”进行训练,微调阶段使用监督微调(SFT)、直接偏好优化(DPO)等方法,优化生成文本以符合人类偏好。

https://mp.weixin.qq.com/s/2CV1qK1po0lD7MAQA3vhfw

七、 AI也可以生成延时视频了,MagicTime输入文本即可生成植物生长视频

1. MagicTime利用Deformable Image Transformer架构生成变形时间延迟视频,克服了传统文本到视频转换的物理规律编码限制;

2. 引入了MagicAdapter方案和动态帧提取策略,提升了视频生成的质量和真实性,更准确地反映物理知识和变形过程;

3. 通过创新的Magic Text-Encoder和专门数据集ChronoMagic,MagicTime在文本到变形视频生成方面取得突破,旨在模拟物理世界的现变形。

https://mp.weixin.qq.com/s/t8l5xUr3L1PKAjNRzLEk3Q

八、 AI届的“指环王”,一个戒指可操控手机和智能家居,接入ChatGPT和Gemini!

1. WIZPR Ring利用近距离语音活动检测技术,实现无需唤醒词即可捕捉语音指令,保护隐私同时避免误操作;

2. 通过蓝牙连接智能手机,清晰转录声音并过滤噪音,实现流畅的人机对话;

3. 预售价139美元,需每月2.5美元订阅使用GPT3.5和Gemini服务,支持控制智能家居等多种功能。

https://mp.weixin.qq.com/s/kS3BufC2_KBzxQ7_ZkPAvQ

前沿科技

九、 比手动快13倍多,「机器人+AI」发现电池最佳电解质,加速材料研究

1. 结合高通量实验平台与主动学习算法,研究团队开发了自动化工作流程,实现对电解质最佳溶解度的有效筛选;

2. 该机器学习引导的高通量机器人平台使用2,1,3-苯并噻二唑作为阳极电解质,证实了其在加速功能材料发现方面的潜力;

3. 实验结果显示,该平台比手动处理样本快13倍以上,通过贝叶斯优化有效识别了最佳电解质溶剂组合,显著提高了研究效率。

https://mp.weixin.qq.com/s/E0JffMSmzWV65uqlSmoDIw

报告观点

十、 知名风投FirstMark详解2024年国际AI生态(Machine learning, AI & Data)

1. 2024年机器学习、AI与数据领域共有2011家企业上榜,其中578家是新加入者,反映了该领域的快速增长和技术进步;

2. 当前AI发展速度迅猛,覆盖广且变革深刻,提出了24个值得关注和深思的问题,涉及结构化与非结构化数据处理、现代数据栈的挑战、以及AI技术在企业和消费市场的应用前景;

3. AI领域的两大发展浪潮,数据Infra周期和ML/AI周期,引发了大量公司创立和资金投入,同时,对于商业化模式、成本问题、以及AI与传统技术的互补性等方面的讨论也日益增多。

https://mp.weixin.qq.com/s/KqlwsLIwqgbO58epZmxXSg

订阅下方合集,获取每日推送


Copyright © 2025 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1