CogVLM2是一款视觉语言模型(Visual Language Model),由智谱AI和清华KEG潜心打磨。这款模型是CogVLM的升级版本,支持高达 1344 * 1344 的图像分辨率...【查看原文】
CogVLM2是一款视觉语言模型(Visual Language Model),由智谱AI和清华KEG潜心打磨。这款模型是CogVLM的升级版本,支持高达 1344 * 1344 的图像分辨率...
清华
萤火架构 2024-09-06
8月30日,阿里通义千问开源第二代视觉语言模型Qwen2-VL,推出2B、7B两个尺寸及其量化版本模型。2023年8月,通义千问开源第一代视觉语言理解模型Qwen-VL。一年内,模型下载量突破1000万次。
通义千问
界面新闻 2024-08-30
新智元报道 编辑:编辑部 【新智元导读】Stability AI也有大语言模型了,现在已有3B和7B的版本。大语言模型的Stable Diffusion时刻,是真来了。 大语言模型之战,
Stable DiffusionStability AI大语言模型
新智元 2023-04-20
相比上代模型,Qwen2-VL 的基础性能全面提升
褚杏娟 2024-09-01
我们很高兴发布 IDEFICS ( Image-aware Decoder Enhanced à la Flamingo with Ininterleaved Cross-attention S ) 这一开放视觉语言模型。IDEFICS 基于 Flamingo,Flamingo 作为最先进的视觉语言模型,最初由 DeepMind 开发,但目前尚未公开发布。与 GPT-4 类似,该模型接受任意图像和文本输入序列并生成输出文本。IDEFICS 仅基于公开可用的数据和模型 (LLaMA v1 和 OpenCLI
GPT-4LLaMA
HuggingFace 2023-09-08
刺刀见红,2025春节档能撑起多少「鸿鹄志」。
文娱商业观察 2024-12-31
南昌做对了什么
城市进化论 2024-12-31
闲鱼爆火,是时候为阿里“赚钱养家”了
节点财经 2024-12-31
河北邯郸初中生被杀案一审宣判,一人被判无期徒刑。
8点1氪 2024-12-31
建生产线,买大IP授权,这条路的可复制性,为布鲁可未来发展埋下了隐患。
略大参考 2024-12-31
方向何在?
车百智库 2024-12-31
迈向万亿市值。
全天候科技 2024-12-31
伯乐与千里马,渐行渐远。
雷达财经 2024-12-31
音乐平台交上怎样的2024答卷?
犀牛娱乐 2024-12-31
市值105亿港元
36氪的朋友们 2024-12-31
Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1