没眼看……“9.11和9.9哪个大”这样简单的问题,居然把主流大模型都难倒了??强如GPT-4o,都坚定地认为9.11更大。谷歌Gemini Advanced付费版,同样的口径。新...【查看原文】
没想到,一道小学生难度的数学题,竟然难倒了一众海内外AI大模型。元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了,错法各有不同。
AI大模型ChatGPT商汤
光明网 2024-07-17
快科技9月14日消息,OpenAI推出了OpenAI o1预览模型,官方宣称推理能力更强,可达理科博士生水准。按照官方技术博客说法,o1在推理能力上代表了人工智能最强的水平。同时官方放出了更多OpenAI
OpenAI人工智能
雪花 2024-09-14
AI大模型人工智能
新闻夜航 2024-07-19
大部分大模型在问答中都错误地比较了小数点后的数字,认为9.11大于9.9,考虑到数字涉及的语境问题,记者将其限定为在数学语境下,如ChatGPT这样的大模型也照样答错。记者追问ChatGPT有没有其他比较方法…
ChatGPT
第一财经 2024-07-19
根据GPT-4omini在多个关键基准测试中的得分,可以看出,其在文本和多模态推理、逻辑推理、数学和编程等方面均表现出色,优于市场上其他小型模型。据ArtificialAnalysis统计,GPT-4omin…
OpenAI编程
新榜 2024-08-11
IT之家12月29日消息,小米创办人,董事长兼CEO雷军今日宣布,12月31日晚8点,打算做一场围炉跨年直播。雷军表示,2024马上就要过去了,回望这一年,大家肯定都有不少感慨。如果你没有特别的安排,欢迎你来我的直播间,一起许个愿、聊聊天,比如,这一年来,你都经历过哪些有趣的事和难忘的事?
IT之家 2024-12-29
快科技12月29日消息,据媒体报道,近日,多家公司的Chrome浏览器扩展功能遭到黑客攻击,导致用户敏感数据面临泄露风险。其中,美国加州的数据安全初创公司Cyberhaven成为受害者之一,该公司已对外证实遭受恶意网络攻击。
快科技 2024-12-29
值得注意的是,随着技术的飞速发展,手机安全问题也日益凸显,可能造成信息泄露,对国家安全构成威胁。
千龙网 2024-12-29
12月29日,澎湃新闻记者从中国国家铁路集团有限公司(以下简称“国铁集团”)获悉,当日,CR450动车组样车在北京发布,这标志着“CR450科技创新工程”取得重大突破,将极大提升我国铁路科技创新水平和科技自立自强能力,进一步巩固扩大我国高铁技术世界领跑优势。
澎湃新闻 2024-12-29
要达到这种效果,有几种方法可以尝试,不管是使用相机还是后期处理软件,都能实现模糊背景的效果。如果你有一支大光圈的镜头,比如f/1.8或f/2.8的镜头,效果会更明显。
新报观察 2024-12-29
钛媒体App12月29日消息,据报道,经确认,发生事故的济州航空7C2216航班的机型是美国波音公司的737-800,于2009年8月出厂,飞机机龄15年。
钛媒体快报 2024-12-29
2024年12月28日,第四代自升自航式风电安装船“铁建风电2000”在中集来福士山东烟台建造基地交付。该船装备了起吊能力达2000吨的全回转起重机,可在水深80米的海域进行20兆瓦以上各型海上风机的安装施工,满足了海上风电行业深远海、大兆瓦的趋势,实现了该领域“国船国造国用”的目标。
金台资讯 2024-12-29
快科技12月29日消息,今年8月28日,高德地图卫星求救功能上线,在2025年到来前,高德地图宣布卫星求救新增三大功能,分别为北斗卫星短报文求救、位置同显和救援小结。此外,在进入救援聊天室时,对于求救者来说,地图页面上会直观的显示你当前的位置、与救援队的距离以及位置的最后更新时间。
驱动之家 2024-12-29
12月27日,据红星资本局消息,美团表示,推进算法公开常态化。美团还表示,将在2025年底前逐步取消骑手超时扣款,推动从负向处罚向正向激励的转变。值得一提的是,此前,12月17日,有网传通知显示,美团骑手过度跑单,将被平台强制下线。通知称,为保障安全,外卖平台对于跑单时长累计过长的骑手将采取强制下线。
光明网 2024-12-29
12月26日至27日,“数字寻踪·普陀印象”海纳小镇城市数字化转型体验Citywalk活动举办。一支由各界人士组成的考察团沿着“海纳新城”与“普陀新篇”两条线路,实地探访了普陀区内多个具有代表性的智慧城市建设优秀案例。
东方网 2024-12-29
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1