DiT作为效果惊艳的Sora的核心技术之一,利用Difffusion Transfomer 将生成模型扩展到更大的模型规模。...【查看原文】
本文详细介绍Transformer架构图像生成方面的应用,将Diffusion和Transformer结合起来的模型:DiT。目前DiT已经成为了AIGC时代的新宠儿,视频和图像生成不可缺少的一部分。
深度学习AIGC
好评笔记 2024-12-21
Stable Diffusion v2 基础环境承接Stable Diffusion v1,需要更新pytorch版本,使用xformers能有效缓解GPU内存不足的问题。
Stable Diffusion
鹤宁 2023-06-16
近来,几种长上下文语言模型陆续问世,包括 GPT-4(上下文长度为 32k)、MosaicML 的 MPT(上下文长度为 65k)Anthropic 的 Claude(上下文长度为 100k)。长文档
GPT-4Claude
机器之心 2023-07-31
论文详情MaskGIT: Masked Generative Image TransformerHuiwen Chang, Han Zhang, Lu Jiang, Ce Liu, William T. Freeman官方的 Colab Demo: https://colab.research.google.com/github/google-research/maskgit/blob/main/MaskGIT_demo.ipynbImageGPT 工作机制先简单介绍一下 ImageGPT (Genera
AIGC谷歌GitHub
刹那-Ksana- 2023-06-27
北大和字节联手搞了个大的: 提出图像生成新范式,从预测下一个 token 变成预测下一级分辨率,效果超越 Sora 核心组件 Diffusion Transformer(DiT)。 并且代码开源,短短
北大Sora编程
量子位 2024-04-16
Parallelized Autoregressive Visual Generation 并行化自回归视觉生成 自回归模型是视觉生成的一种强大方法,但由于其逐 Token 的序列预测过程,导致推理速
叶子的技术碎碎念 2024-12-29
过年回家,面对七大姑八大姨,你是否也感到迷茫?别担心,今天要介绍的这款神器——**中国亲戚关系计算器**,将帮你轻松解决这个难题!
小华同学ai 2024-12-29
2025年大语言模型基础设施发展趋势预测 随着人工智能技术的迅猛进步,大语言模型(LLM)在各行各业的应用越来越广泛。 展望2025年,LLM的基础设施将迎来重大变化,深刻改变我们与人工智能互动的方式
Y11_推特同名 2024-12-29
智驾赛道再跑出一个IPO
时代财经 2024-12-29
在人工智能(AI)领域,检索增强生成(Retrieval-Augmented Generation,简称RAG)技术正迅速发展,预计到2025年将发挥更重要的作用。
新茶饮2025年还会玩出什么新花样?
一、开篇 12月今年最后一个月了,相逢的人已走散,Q4的OKR已经定型了,很平淡无味、闲的无聊,提前写个年终总结吧。25年,再过一个月就35岁了,一个人来北京也已经11年了。年近末尾,思绪良多。回
独泪了无痕 2024-12-29
文章首发到公众号:月伴飞鱼,每天分享程序员职场经验! 大家好呀,我是飞鱼。 作为程序员,肯定都深受加班的痛苦。 我觉得还是得先把觉睡够,然后才是锻炼。 睡眠的优先级,不但高于锻炼,甚至高于洗脸洗澡。
程序员飞鱼 2024-12-29
马上快 30 了,回头看自己职场生涯,除了几个时间点有成长,学到一些东西,大部分时间是无情的业务 CRUD,对自己未来的发展逐渐有了焦虑。 看了各种大佬的分享,整理了一些思路,希望可以给各位参考。 持
小兵张健 2024-12-29
Introduction Building a hyper-deterministic high-frequency trading (HFT) platform requires careful a
Richard2012 2024-12-29
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1