自OpenAI推出 Sora 以来,「文生视频」概念及相关应用备受瞩目。而伴随 Sora 的大热,其背后的关键技术,DiT(Diffusion Transformers) 也被「考古挖掘」了出来。 事...【查看原文】
自 OpenAI 推出 Sora 以来,「文生视频」概念及相关应用备受瞩目。而伴随 Sora 的大热,其背后的关键技术,DiT (Diffusion Transformers) 也被「考古挖掘」了出来。 [图片] 事实上,DiT 是一个文生图模型,该模型于两年前开源,其研发人员分别是 Peebles 和谢赛宁,其中 Peebles 也是 Sora 的项目领导者之一。 在 DiT 模型提出之前,Transformer 以其强大的特征提取和上下文理解能力,几乎在自然语言处理领域独霸一方。而 U-Net 则以其
OpenAISora
HyperAI超神经 2024-05-28
小朋友不爱背诗怎么办?《千秋诗颂》试试看。 [图片] 2 月 26 日,中国首部文生视频 AI 系列动画《千秋诗颂》于 CCTV-1 频道正式播出,这部动画由上海人工智能实验室和「央妈」(中央广播电视总台)强强联手,借助「央视听媒体大模型」,从美轮美奂的画面到动感十足的效果,直接把古诗里的世界带到小朋友眼前。 据了解,「千秋诗颂」综合运用了可控图像生成、人物动态生成、文生视频等最新技术成果,其背后的智囊团上海人工智能实验室的研究人员一直深耕于文生图、文生视频等领域,早在 2023 年年底就发布了全球第一个
人工智能Sora
OpenBayes 2024-05-30
1888 年,爱迪生提交了一项名为「活动电影放映机」的专利,该设备首次实现连续播放静态照片,形成类似动态画面的效果,由此拉开了视频发展的序幕。 回顾历史,视频经历了从无到有、从黑白到彩色、从模拟信号到数字信号的迭代。过去,视频的制作包括了脚本/剧本创作、拍摄、剪辑、配音、校审等多个步骤。时至今日,小到短视频平台的爆款视频,大到剧院内热映的大制作电影,仍然遵循着这一长链条的制作形式。 近年来,随着生成式 AI 的出现,视频的制作也迎来创新。自 ChatGPT 横空出世以来,生成式 AI 在文字理解方面的能力
SoraChatGPT
HyperAI超神经 2024-03-26
文生图界的「扛把子」重磅登场!千呼万唤,Stability AI 终于推出了开源模型 Stable Diffusion 3 Medium,该模型包含 20 亿参数,在图像质量、复杂提示理解以及资源效率方面都有显著提升,能够生成细节逼真、色彩鲜艳、光照自然的图像,并能适应多种风格!HyperAI超神经现已上线「ComfyUI Stable Diffusion 3 工作流在线教程」,已经为大家搭建好了环境,使用时无需输入任何命令,一键克隆即可启动。该教程将 Stable Diffusion 3 Medium
Stable DiffusionStability AI
HyperAI超神经 2024-07-24
近日,Colossal-AI团队开源了全球首个类Sora架构视频生成模型「Open-Sora 1.0」。本次开源的内容涵盖了整个训练流程,包括数据处理、训练细节和模型权重。开源仅两天,已在GitHub上斩获7k星!该项目支持完整的视频数据预处理、加速训练、推理等,只需 3 天的培训即可制作 2 秒 512x512 视频。让我们先来一起看看Open-Sora生成的视频效果吧!夜晚熙熙攘攘的城市街道,充满了汽车大灯的光芒和路灯的环境光。生机勃勃的向日葵田。花朵整齐地排列,营造出一种秩序感和对称感。森林地区宁静
SoraGitHub汽车
AI-GitHub 2024-03-19
vivoY200+机身厚度仅7.99mm,重199g,却内置的6000mAh大电池,采用第二代硅碳负极材料,能量密度高达791Wh/L,较普通石墨电池至高提升11.15%。在2倍行业健康寿命的技术加持下,四年后电池健康度还能保持80%以。vivoY200+采用磐石抗摔结构,搭配2倍抗冲击强度的金刚盾玻璃。
大话百科天地 2024-12-30
在日常办公中,WPSOffice是一个非常常用的办公软件,很多人用它来处理文档、表格和演示等。今天,我们来聊聊在WPS中如何输入根号这个符号。虽然看似简单,但很多人可能在使用过程中遇到过一些小麻烦。接下来,我会详细介绍几种方法,帮助大家轻松打出根号。首先,WPS的界面设计相对友好,功能也很齐全。
新报观察 2024-12-30
SIE工作室业务集团首席执行官HermanHulst近日接受了采访。在被问及个人感情深厚的技术或产品时,他表示对游戏手柄情有独钟。“我一直都对手柄有着特殊的感情。”“作为开发者,我们的任务是创造令人惊叹的游戏世界,但正是通过手柄,我们才能将玩家与这些精彩的世界紧密相连。”Hulst继续说道。
中关村在线 2024-12-30
对人类大脑处理信息的能力进行研究后,美国加州理工学院的神经科学家发现,人类思考的速度并没有想象中的那么快。大脑处理信息的速度仅为每秒10比特,与计算机每秒能执行数万亿次操作根本无法相比。这一发现提出了一个有趣的悖论:我们的大脑究竟是如何过滤如此庞大的信息量,以便有效地感知世界并作出决策的?
北青网 2024-12-30
昨天,荣耀首席影像工程师罗巍分享了一组手机“200X”变焦的内部仿真效果,并表示“看来支持200X有机会”。针对荣耀手机以后是否会支持放大至200倍,他表示“有可能哦”,而针对12倍以内长焦的后续优化计划,他说“端侧的我们也会有优化推出,不过比云测慢”。
公司董事长杨友汉介绍,公司开展“智改数转”后,车间自动化率超过95%,生产周期缩短22.5%,综合运营成本降低5%,不良品率降至0.15%,生产效率和产品质量显著提升。2024年,金凌科技、速波赛等当地锂电企业借力锂电产业数字化综合赋能平台,实现生产效率平均提升25%,生产成本平均降低15%。
经济日报 2024-12-30
近日,“问月——中国探月工程嫦娥五号月球样品展”在北京天文馆拉开帷幕,涵盖了月壤多种形态的共计0.6克嫦娥五号月球样品与公众见面。展览通过精密的机械臂、大直径半球透镜、体视显微镜、三维数字重建技术展示月壤,观众可用肉眼和显微镜“零距离”观看。
不管是出门旅行,还是日常通勤,充电宝都能让我们的手机、平板等设备保持充沛的电量。不过,充电宝的使用和充电方法,很多人可能并不太了解。
在这里,电子信息、先进制造、新能源、生物医药等多个高新技术产业集群交错有致,近2.5万家国家级高新技术企业坐落其间,“20+8”产业集群蔚然成风。面对新一轮科技革命和产业变革机遇,华夏银行深圳分行积极推动对于战略性新兴产业集群的金融服务,助力新质生产力茁壮成长。
南方都市报 2024-12-30
用保鲜膜包裹食物加热会致癌?12月29日,由北京市科协、北京市委网信办主办,北京广播电视台、北京科技记者编辑协会承办的“智止流言探求真知——‘科学’流言求真榜十周年发布活动”在京举行,多位专家为公众梳理并“粉碎”过去10年在网络上广为传播的十大“科学”流言,帮助公众明辨是非。
中国青年网 2024-12-30
Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1