威大哥大等联合发文！最新多模态大模型LLaVA问世，水平直逼GPT-4

作者：新智元发布时间：2023-04-29

编辑：拉燕【新智元导读】微软&哥大联合发表视觉指令微调论文，LLaVA出炉！视觉指令微调火了。这篇论文名为Visual Instruction Tuning，由威斯康星大学麦迪逊分校，微软研究院...【查看原文】

相关资讯

多模态大模型MiniGPT4和LLaVA开源（GPT4图文对话平替）；MOSS等模型放出权重

看看本周新进展本周带来的 8 个 SOTA 模型分别用于多模态对话、对话系统、文本到语音生成、中文医学对话等；1 个工具用于三维视觉重建；1 个数据集用于自然语言处理。阿卜杜拉国王科技大学开源MiniGPT-4，具备类GPT-4的图像理解与对话能力的多模态大模型MiniGPT-4 是阿卜杜拉国王科技大学开源的一款多模态大模型，同时具备图像理解与对话能力。它使用 BLIP-2 的冻结视觉编码器和 Vicuna 的冻结 LLM，仅使用一个投影层进行对齐。MiniGPT-4 的训练分为两个阶段。第一阶段是传统的

GPT-4 MOSS MiniGPT Vicuna

AI试库の小土同学 2023-04-24

GPT-4炸圈--多模态大模型

GPT-4重磅发布，拥有多模态大模型的光环加持，将会给我们带来哪些眼前一亮的技术呢，今天就让我们来揭开GPT-4能力的面纱

GPT-4

江湖修行 2023-03-16

大模型+蒙特卡洛树搜索，一招让LLaMa-3 8B奥数水平直逼GPT-4

这几天，17岁中专生姜萍在2024阿里巴巴全球数学竞赛预选赛中取得全球第12名的新闻刷了屏。而同时，AI挑战赛的成绩显示，在所有563支AI参赛队伍中，最高分34分，平均分18分，赶上了人类选手平均水平。AI参与数学竞赛的主要短板是逻辑推理能力弱，证明题很难拿到完整得分点。

LLaMA GPT-4 阿里巴巴

机器之心Pro 2024-06-17

OpenAI最新大模型曝光：剑指多模态，GPT-4之后最大升级

大模型之争，又卷起来了。据Theinformation爆料称，OpenAI即将推出多模态模型GPT-vision。如果消息为真，这将是OpenAI在GPT-4之后推出的最大更新。另一边，谷歌的多模态模型进展也在最近传出，为的就是能和OpenAI抗衡。目前为止，OpenAI还没有对爆料中的传闻做出回应，但此前发布过多模态模型测试。

OpenAI 谷歌 GPT-4

量子位 2023-09-19

近期资讯

为何岛国主要是进行两栖战？

CCTV兵器科技频道 2024-12-29

如何正确贴防窥膜以保护个人隐私和设备安全

在这个信息化的时代，手机、平板和电脑已经成为我们生活中不可或缺的一部分。随着这些设备的普及，隐私保护的问题也越来越受到重视。防窥膜作为一种有效的隐私保护工具，能够有效防止他人偷窥屏幕上的内容。那么，防窥膜该怎么贴呢？今天就来聊聊这个话题。在开始之前，咱们得准备一些工具。首先，你需要一张合适尺寸的防窥膜。

新报观察 2024-12-29

如何找回误删除的照片：实用技巧与备份建议

在生活中，我们常常会遇到一些让人心烦的事情，比如不小心删除了重要的照片。想象一下，你兴致勃勃地准备分享某个美好回忆的照片，结果发现它竟然消失了。大多数情况下，照片会被放入“回收站”或者“垃圾箱”里。需要注意的是，数据恢复的成功率受多种因素影响，比如照片被删除后是否被新的数据覆盖了，所以越早行动越好。

新报观察 2024-12-29

2024 年观影人次破 10 亿：平均票价 42.1 元，总场次 1.43 亿场

IT之家 2024-12-29

多种实用方法教你轻松去除图片和视频中的水印

在我们的日常生活中，水印常常出现在各种图片和视频上。水印的存在虽然可以保护版权，但有时候我们真的希望能去掉它，尤其是当我们想要使用某些图片或视频时。今天就来聊聊怎么删除水印，分享一些实用的方法和技巧。在开始之前，先了解一下水印的类型。水印主要分为两种：一种是透明水印，通常是半透明的文字或图案，另一种是覆盖水印，通常是比较明显的图案或文字。

新报观察 2024-12-29

2025年AI眼镜渗透率会突破60%？

全天候科技 2024-12-29

如何在Excel中固定表头以提高数据处理效率的方法与技巧总结

在使用Excel进行数据处理时，固定表头是一个非常实用的功能，尤其是当你的数据表格很长，向下滚动时，表头会消失，这样就很难确认每一列的具体含义。今天，我们就来聊聊如何在Excel中固定表头，让你的工作更加高效。固定表头就是为了解决这个问题，让你在滚动表格时，始终能够看到列的名称，确保你能随时了解你在查看的内容。

新报观察 2024-12-29

雷明：预防女孩形成讨好型人格

财经网科技 2024-12-29

华为手机应用分身功能详解：轻松管理多个账户的实用技巧

在现代生活中，手机已经成为我们不可或缺的工具。无论是工作、学习还是娱乐，手机都扮演着重要的角色。尤其是华为手机，凭借其强大的功能和用户友好的界面，受到了很多人的喜爱。今天，我们来聊聊华为手机的一个实用功能——应用分身。应用分身这个功能，简单来说，就是让你在同一部手机上使用同一个应用的两个不同账户。

新报观察 2024-12-29

团队中有一群比业务还懂业务的人，他们想要干什么？

在不少公司，都有一些不在团队但比团队还懂业务的人存在。比如正文作者说的这个模式研发中心。虽然是随着业务的拓展自然生长出来的，但在其他人眼里，是个什么样的存在呢？

Kris_3zzz 2024-12-29

威大哥大等联合发文！最新多模态大模型LLaVA问世，水平直逼GPT-4

推荐体验

相关资讯

最新多模态大模型LLaVA问世，水平直逼GPT-4

多模态大模型MiniGPT4和LLaVA开源（GPT4图文对话平替）；MOSS等模型放出权重

GPT-4炸圈--多模态大模型

大模型+蒙特卡洛树搜索，一招让LLaMa-3 8B奥数水平直逼GPT-4

OpenAI最新大模型曝光：剑指多模态，GPT-4之后最大升级

近期资讯

为何岛国主要是进行两栖战？

如何正确贴防窥膜以保护个人隐私和设备安全

如何找回误删除的照片：实用技巧与备份建议

2024 年观影人次破 10 亿：平均票价 42.1 元，总场次 1.43 亿场

多种实用方法教你轻松去除图片和视频中的水印

2025年AI眼镜渗透率会突破60%？

如何在Excel中固定表头以提高数据处理效率的方法与技巧总结

雷明：预防女孩形成讨好型人格

华为手机应用分身功能详解：轻松管理多个账户的实用技巧

团队中有一群比业务还懂业务的人，他们想要干什么？

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响