腾讯研究院AI速递 20240411

作者：腾讯研究院发布时间：2024-04-11

腾讯生成式AI 人工智能 AI芯片

生成式AI

一、英特尔的最强AI芯片来了，Gaudi 3深度解读，旨在与NVIDIA竞争

1. 英特尔推出Gaudi 3人工智能加速器，预计在AI市场中与NVIDIA竞争，凭借1835 TFLOPS的FP8计算吞吐量和对低精度浮点和整数数学的支持，专为AI训练和推理优化；

2. Gaudi 3基于5纳米工艺，拥有增强的计算硬件，包括4个矩阵数学引擎和32个张量核心，旨在提高性能和扩展性，支持到128GB的HBM2e内存；

3. Gaudi 3通过内置的200 Gbps RoCE 以太网控制器，提升网络I/O带宽至8.4TB/秒，支持高效的节点间以太网连接，强化集群的可扩展性和互连性，面向大型AI训练和推理工作负载。

https://mp.weixin.qq.com/s/-LSIITeNNdu4nJav6jQ8mw

二、全面突围！谷歌更新了一系列大模型产品，从模型、工具到芯片！

1. Gemini 1.5 Pro增强功能：提供本地音频理解，上下文处理能力提升至100万token，支持视频的图像和音频推理，首次引入系统指令和JSON模式，增强文件API；

2. 开源工具集：推出Max Diffusion、Jetstream、MaxTest三大开源工具，支持生成式AI项目，提高性价比，支持TPU和Nvidia GPU；

3. 首款自研Arm处理器Axion：基于Arm Neoverse 2，性能超过竞争对手30%，提高数据中心的性能和能效；

4. CodeGemma代码生成新模型：提供智能代码补全和生成，支持多种编程语言，凭借训练数据量和准确性优势，提高开发效率。

https://mp.weixin.qq.com/s/SWGMtLYSss2MR6or8J87HQ

三、「视觉版」GPT-4 Turbo重磅升级！ChatGPT 40条消息限制或取消

1. OpenAI发布GPT-4 Turbo正式版，具备视觉功能，能处理128k上下文，训练数据截止到2023年12月；

2. GPT-4 Turbo引入视觉能力后，在编码任务表现较差，代码编辑能力得分为62%，是GPT-4型号中最低；

3. OpenAI取消GPT-4每3小时40条消息的限制，改为根据系统繁忙程度动态调整用户请求次数，但用户反馈使用体验不一。

https://mp.weixin.qq.com/s/rinWSzeNl1r-N_LFfe3G9g

四、刚刚，Mistral AI最新磁力链放出！8x22B MoE模型，281GB解禁

1. Mistral AI发布全新8x22B MoE模型，包含56层、48个注意力头，支持65k上下文长度；

2. 通过281GB磁力链分享，引起AI社区广泛关注，性能超越前代模型，支持复杂多语言任务；

3. 最新模型支持社区成员在抱抱脸平台上构建应用，展示卓越的逻辑推理和代码生成能力。

https://mp.weixin.qq.com/s/p_jkVrCLoSA-FoEkQ0m2iQ

五、开源模型首胜GPT-4！引发热议，Karpathy：这是我唯二信任的榜单

1. 1040亿参数的开源模型Command R+在大模型竞技场上达到GPT-4水平，超越了GPT-4的某些版本；

2. Command R+特别优化了检索增强生成（RAG）技术，覆盖10+种语言，性价比高于GPT-4 turbo；

3. 尽管在某些主观评测中表现突出，Command R+在代码能力测试中的排名低于GPT-3.5，中文能力也待进一步验证。

https://mp.weixin.qq.com/s/lg3H5GlZlGOv0PjxWF1OHg

六、 2万亿训练数据，120亿参数！开源大模型Stable LM 2-12B

1. Stability.ai开源Stable LM 2 12B模型，采用Transformer架构，涵盖7种语言和2万亿tokens的训练数据；

2. Stable LM 2 12B在多个基准测试上性能优越，超过了知名开源模型如Qwen1.5-14B-Chat、Mistral-7B-Instruct-v0.2；

3. 模型采用创新技术如“FlashAttention-2”进行训练，微调阶段使用监督微调（SFT）、直接偏好优化（DPO）等方法，优化生成文本以符合人类偏好。

https://mp.weixin.qq.com/s/2CV1qK1po0lD7MAQA3vhfw

七、 AI也可以生成延时视频了，MagicTime输入文本即可生成植物生长视频

1. MagicTime利用Deformable Image Transformer架构生成变形时间延迟视频，克服了传统文本到视频转换的物理规律编码限制；

2. 引入了MagicAdapter方案和动态帧提取策略，提升了视频生成的质量和真实性，更准确地反映物理知识和变形过程；

3. 通过创新的Magic Text-Encoder和专门数据集ChronoMagic，MagicTime在文本到变形视频生成方面取得突破，旨在模拟物理世界的现变形。

https://mp.weixin.qq.com/s/t8l5xUr3L1PKAjNRzLEk3Q

八、 AI届的“指环王”，一个戒指可操控手机和智能家居，接入ChatGPT和Gemini！

1. WIZPR Ring利用近距离语音活动检测技术，实现无需唤醒词即可捕捉语音指令，保护隐私同时避免误操作；

2. 通过蓝牙连接智能手机，清晰转录声音并过滤噪音，实现流畅的人机对话；

3. 预售价139美元，需每月2.5美元订阅使用GPT3.5和Gemini服务，支持控制智能家居等多种功能。

https://mp.weixin.qq.com/s/kS3BufC2_KBzxQ7_ZkPAvQ

前沿科技

九、比手动快13倍多，「机器人+AI」发现电池最佳电解质，加速材料研究

1. 结合高通量实验平台与主动学习算法，研究团队开发了自动化工作流程，实现对电解质最佳溶解度的有效筛选；

2. 该机器学习引导的高通量机器人平台使用2,1,3-苯并噻二唑作为阳极电解质，证实了其在加速功能材料发现方面的潜力；

3. 实验结果显示，该平台比手动处理样本快13倍以上，通过贝叶斯优化有效识别了最佳电解质溶剂组合，显著提高了研究效率。

https://mp.weixin.qq.com/s/E0JffMSmzWV65uqlSmoDIw

报告观点

十、知名风投FirstMark详解2024年国际AI生态(Machine learning, AI & Data)

1. 2024年机器学习、AI与数据领域共有2011家企业上榜，其中578家是新加入者，反映了该领域的快速增长和技术进步；

2. 当前AI发展速度迅猛，覆盖广且变革深刻，提出了24个值得关注和深思的问题，涉及结构化与非结构化数据处理、现代数据栈的挑战、以及AI技术在企业和消费市场的应用前景；

3. AI领域的两大发展浪潮，数据Infra周期和ML/AI周期，引发了大量公司创立和资金投入，同时，对于商业化模式、成本问题、以及AI与传统技术的互补性等方面的讨论也日益增多。

https://mp.weixin.qq.com/s/KqlwsLIwqgbO58epZmxXSg

订阅下方合集，获取每日推送

金融界 2024-12-30

腾讯研究院AI速递 20240411

推荐体验

相关资讯

腾讯研究院AI速递 20240304

近期资讯

如何在不同设备上快速关闭蓝牙以保护隐私和节省电量

如何在微信中设置空白昵称，展现神秘个性

甘肃德福取得磨床的砂轮自动更换抛磨工装专利，保证铜箔横向整个面都可以抛磨处理到

如何有效利用QQ举报功能维护自己的网络安全与权益

韦尔股份：高阶像素产品应用于国内高端手机

如何快速识别歌曲的实用技巧与方法分享

湖北宏玛达轮毂取得铝合金轮毂生产用毛刺去除装置专利，提高铝合金轮毂毛刺去除效率

加号的多重意义：从数学运算到生活中的积极连接与合作

江苏凯鑫取得多面同步铸件表面去毛刺装置专利，能够对铸件进行多面同步毛刺处理

晶晨股份：发布业界首款6nm 4K AI芯片

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响