现在ChatGPT等大模型一大痛点: 处理长文本算力消耗巨大,背后原因是Transformer架构中注意力机制的二次复杂度。 FlashAttention作者Tri Dao参与提出的新架构,成为有力挑...【查看原文】
十年前,移动互联网充满朝气,每天都有新芽从智能手机的沃土中长出。十年后,我们早已习惯了Web2.0社
ChatGPT
appso 2023-01-15
一年时间,斯坦福大学提出的新型 Attention 算法 ——FlashAttention 完成了进化。这次在算法、并行化和工作分区等方面都有了显著改进,对大模型的适用性也更强了。近来,几种长上下文语言模型陆续问世,包括 GPT-4(上下文长度为 32k)、MosaicML 的 MPT(上下文长度为 65k)Anthropic 的 Claude(上下文长度为 100k)。长文档查询和故事写作等新兴用例已经表明扩展语言模型上下文窗口是非常必要的。然而,扩大 Transformer 的上下文长度是一
斯坦福GPT-4Claude
AI研习所 2023-07-25
这一模型比GPT-4、GeminiUltra、ClaudeOpus等模型能力更强,更引人注目的是,其训练成本只需要500美元。
斯坦福GPT-4
21世纪经济报道 2024-06-14
说回我们在AI领域贡献的开源大模型技术,从此次事件来看,中国的开源模型其实十分强大,但在国际社区中的整体知名度并不高。还有一位国外AI社区的创始人也说道:“中国在机器学习生态的工作一直以来都被社区忽视了。也有…
通义千问斯坦福清华
OSC开源社区 2024-06-18
一般来说,便当盒有隔区,这放肉食,那放米饭,Bento也是如此,他们借用了「便当理论」,在填写待办事项之前,就要求用户先把任务拆分成「小/中/大」三种类型,他们对这三种类型任务也有自己的定义。VALL-E可以…
AppSo 2023-01-26
快科技12月27日消息,据媒体报道,今日,在2024美团机器人研究院学术年会上,美团副总裁、美团机器人研究院理事长毛一年表示,美团无人机已拿到首张在迪拜无人机送货许可证。他表示,美团无人机
2024-12-27
快科技12月27日消息,今日,小米发布小米澎湃OS 2升级公告,这是澎湃OS 2发布后的首次重大版本更新,超级小爱首次向正式版用户开放。小米手机系统软件部总监张国全发文,称今天起,将开启一轮
拾柒 2024-12-27
快科技12月27日消息,俄罗斯服务器厂商Graviton宣布,已经开始供货首批AI/HPC服务器,基于俄罗斯自研的CPU处理器,可搭配最多八块GPU计算卡。该处理器型号为S2124B,配备两颗48核心处理器,共
最近,社交媒体刮起一阵“干噎酸奶”风。各种博主纷纷尝试,不断将其搭配花样推陈出新,不过大家的食用体验似乎都不怎么美好,得出了“吃一口脖子抻出二里地”的品尝心得。
快科技12月27日消息,今日,小米宣布澎湃OS 2首次OTA升级,超级小爱首次向正式版用户开放,小米15 系列、小米14 系列、REDMI K80系列、REDMI K70至尊版即日起开始灰度。据了解,超级
快科技12月27日消息,AMD即将发布的最新旗舰处理器锐龙9 9950X3D的CPU-Z截图曝光,我们也得以一见这款处理器的参数。截图显示,这款处理器拥有16核32线程,CPU 的版本号为GNR-B0 ,其中G
黑白 2024-12-27
比亚迪30亿教育慈善基金启动仪式将于2024年12月30日10:30正式开始。科技兴则民族兴,教育强则国家强,比亚迪将携手众多高校和科技馆、博物馆,助力科教兴国。
振亭 2024-12-27
快科技12月27日消息,五菱汽车今日宣布,旗下五菱之光EV已于12月27日正式亮相。官方介绍,该车配备20处可拓展区域,具备对外放电和座椅纯平放倒功能。该车型预留了20处M6标准螺纹安装孔,
快科技12月27日消息,联想官方宣布,将在北京时间2025年1月8日的CES 2025现场,发布多款革命性的笔记本电脑,其中预计包括全新的卷轴屏笔记本。联想表示,将在CES 2025发布多款革命性的笔记本
快科技12月27日消息,今天,小米澎湃OS官微宣布,超级小爱首次面向正式版用户开放升级。据悉,超级小爱是小爱同学的超级AI进化版,致力于打造一个全生态的AI智能助手,它采用全新视觉设计,支
Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1