没眼看……“9.11和9.9哪个大”这样简单的问题,居然把主流大模型都难倒了??强如GPT-4o,都坚定地认为9.11更大。谷歌Gemini Advanced付费版,同样的口径。新...【查看原文】
没想到,一道小学生难度的数学题,竟然难倒了一众海内外AI大模型。元宝答对,但ChatGPT-4o、字节豆包、月之暗面kimi、智谱清言、零一万物万知、阶跃星辰跃问、百川智能百小应、商汤商量都答错了,错法各有不同。
AI大模型ChatGPT商汤
光明网 2024-07-17
快科技9月14日消息,OpenAI推出了OpenAI o1预览模型,官方宣称推理能力更强,可达理科博士生水准。按照官方技术博客说法,o1在推理能力上代表了人工智能最强的水平。同时官方放出了更多OpenAI
OpenAI人工智能
雪花 2024-09-14
AI大模型人工智能
新闻夜航 2024-07-19
大部分大模型在问答中都错误地比较了小数点后的数字,认为9.11大于9.9,考虑到数字涉及的语境问题,记者将其限定为在数学语境下,如ChatGPT这样的大模型也照样答错。记者追问ChatGPT有没有其他比较方法…
ChatGPT
第一财经 2024-07-19
根据GPT-4omini在多个关键基准测试中的得分,可以看出,其在文本和多模态推理、逻辑推理、数学和编程等方面均表现出色,优于市场上其他小型模型。据ArtificialAnalysis统计,GPT-4omin…
OpenAI编程
新榜 2024-08-11
快科技12月31日消息,据报道,瑞士国际航空公司表示,瑞航一架客机因发动机故障、机舱和驾驶舱内出现烟雾而紧急迫降一周后,这趟航班的一名机组成员去世。航空运营商在声明中宣布,一名年轻同
2024-12-31
快科技12月31日消息,今天上午,小米SU7正式公布了SU7的小米15周年限定色——璀璨洋红。官方图公布之后,新配色受到不少女性用户的喜爱,不仅新车主可以享受,锁单且未交付用户也可
快科技12月1日消息,据媒体报道,在12月27日举行的BOE(京东方)“向新2025”交流活动中,京东方回顾了2024年在多个关键领域取得的成绩,并剖析了京东方在战略、技术、应用、生态、模
快科技12月31日消息,三星Galaxy S25 Ultra国行版现身Geekbench 6跑分网站,型号是SM-S9380,单核成绩是3049,多核成绩是9793,这是三星最强悍的高端旗舰。据悉,该机搭载高通骁龙8 Elite处理
快科技12月31日消息,Queen Studios与游戏科学联合打造的《黑神话:悟空》天命人1/1半身像正式截单,全球限量780体。据悉,该雕像全款为33800元,定金12000元,预计将于2025年第4季度发货。
快科技12月31日消息,2024年马上就要结束了,而截止收盘今年A股涨幅最好的票就是中国版英伟达--寒武纪。据悉,寒武纪以387%涨幅夺得今年股王称号,总市值近2800亿,正丹股份(375%)、汇金科技
快科技12月31日消息,公安部交通管理局披露了一起酒后驾车的案例,引起网友热议。据介绍,2024年12月24日,抚吉高速吉水南收费站,交警开展违法整治时,查获饮酒后驾车的男子谢某,其呼气检测
快科技12月31日消息,据媒体报道,今天,抖音电商发布《直播间里的中国制造——2024抖音电商产业带发展报告》,全面盘点2024年全国产业带地区实体经济和中小商家在该平台的发展情况。
快科技12月31日消息,距离极越汽车闪崩已经过去了一段时间,热度渐渐消退,而当前最关心这件事的莫过于车主群体了。屋漏偏逢连夜雨,近日,有极越07车主就遭遇了追尾事故,而这也再次引发网友
快科技12月31日消息,网友分享的视频显示,12月27日,山东烟台,一辆新能源SUV行驶中不慎冲进鱼塘,结果被一位好心钓友用鱼竿把车拉到了岸边,成功救援。视频中,这辆新能源SUV冲进鱼塘后,离
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1