利用 GPT 的视觉能力和 TTS API 来处理视频并添加旁白 [译]

作者：宝玉的工程技术分享发布时间：2023-11-10

这个笔记本演示了如何利用 GPT 的视觉能力来处理视频内容。GPT-4 无法直接接收视频作为输入，但我们可以通过视觉识别功能以及全新的 128K 上下文窗口，一次性描述视频中的所有静态画面。...【查看原文】

相关资讯

GPT-4V和TTS功能实现视频解说

使用GPT-4V的视觉能力和TTS功能，可以实现类似AI足球解说演示的讲述视频。下面是简单的操作步骤： 1、? 提取视频帧： • 用OpenCV初始化视频文件读取。 • 遍历视频，逐帧处理，并将每一帧编码为base64格式。 2、? 构建描述提示： • 创建一个结构化的提示，包含视频描述的请求，“用户”角色，以及编码的base64视频帧。 • 定义GPT请求的参数，如模型、提示信息和API密钥。 [图片] 3、? 发送GPT请求： • 通过openai.ChatCompletion.create函数发送请

OpenAI

AI_Fox 2023-11-07

OpenAI 重磅更新，API 添加新函数调用能力

人工智能领域的领军公司 OpenAI 近日宣布了一项重磅更新，其 API（应用程序接口）新增了函数调用的能力。这一更新为开发人员带来了更灵活、更强大的工具，使他们能够更好地利用 OpenAI 的强大技

OpenAI 人工智能

数字化信息港 2023-06-30

基于 Docker 的 Edge-TTS 中转API，兼容 OpenAI TTS接口

微软 Edge 浏览器的大声朗读功能强大，支持多种语言和角色。基于此，开发者创建了 edge-tts Python 包，允许在程序中使用微软 TTS 服务为文字配音。然而，可能由于国内羊毛薅的太狠了

OpenAI 微软

mortimer 2024-12-21

「豆包Marscode体验官」使用AI来处理Excel的数据吧

我正在参加「豆包MarsCode初体验」征文活动# 豆包MarsCode体验官-｛玩转AI｝开启智能编程之旅，拿手机大奖背景 Excel是大部分没有信息化的公司通用的数据处理手段。但并不是所有的人对

编程

可乐三分糖 2024-07-13

深度｜Andrej Karpathy 最新思考：小模型有巨大潜力，大模型用来处理多任务，AI 模型未来聚焦于处理重要信息的能力

这是前特斯拉AI总监&OpenAI创始成员AndrejKarpathy近日与硅谷知名投资人SaraGuo和EladGil的最新对话。题图来自AndrejKarpathy与SaraGuo和EladGil的对话截…

OpenAI

人人都是产品经理 2024-09-10

近期资讯

ICT半导体集成电路测试有限公司取得像差校正器和带电粒子束装置专利，提升装置的性能

金融界2024年12月28日消息，国家知识产权局信息显示，ICT半导体集成电路测试有限公司取得一项名为“像差校正器和带电粒子束装置”的专利，授权公告号CN222214110U，申请日期为2024年4月。专利摘要显示，像差校正器和带电粒子束装置。所述像差校正器包括第一多个磁性元件，每个磁性元件包含磁极和用于向所述磁极提供磁场的对应磁棒。

金融界 2024-12-28

谈一谈浮躁的时代该怎么自处

本次研究旨在通过对各媒体以及生活的变化，社会的变迁走向，分析用户需求、使用者分析和使用场景，以及人们的精神需求进行深入研究分析，探讨人们在各大平台上的消费行为、分享和探讨的热点、由微观知宏观、各种行为偏好、场景下的变化等方面的情况。

王富贵儿本人 2024-12-28

敦仪科技取得晶圆旋干组件专利，能让使用者在操作时带来方便及效率

金融界2024年12月28日消息，国家知识产权局信息显示，敦仪科技股份有限公司取得一项名为“晶圆旋干组件”的专利，授权公告号CN222214118U，申请日期为2024年2月。

金融界 2024-12-28

浙江中科尚弘取得用于离子注入机扫描系统的驱动机构专利，实现对靶盘组件垂直扫描运动的精确控制

金融界2024年12月28日消息，国家知识产权局信息显示，浙江中科尚弘离子装备工程有限公司取得一项名为“一种用于离子注入机扫描系统的驱动机构”的专利，授权公告号CN222214111U，申请日期为2023年12月。

金融界 2024-12-28

东莞市晟鼎精密仪器取得真空等离子反应腔装置专利，减少能耗

金融界2024年12月28日消息，国家知识产权局信息显示，东莞市晟鼎精密仪器有限公司取得一项名为“真空等离子反应腔装置”的专利，授权公告号CN222214112U，申请日期为2024年1月。

金融界 2024-12-28

痛包、痛桌、痛厕所，年轻人为何“痛一切”？

从“痛包”到“痛桌”，再到“痛厕所”，年轻人为何对“痛一切”如此着迷？本文深入探讨了“痛文化”的起源、发展及其在现代社会中的多样化表现，揭示了这一文化现象背后的消费心理和社会意义。

剁椒TMT 2024-12-28

数据分析误区系列（二）：数据揭示的谎言

在做数据分析时，常常会陷入一些自己都不知道的陷阱，从而得出一些错误的结论。本文就分享了其中一个案例：误解或误用数据。如何解决，且看作者的分析。

佑佑和博博~ 2024-12-28

东莞晟鼎取得一种等离子体均匀分布的气体分流装置专利，能实现等离子体均匀分布

金融界2024年12月28日消息，国家知识产权局信息显示，东莞市晟鼎精密仪器有限公司取得一项名为“一种等离子体均匀分布的气体分流装置”的专利，授权公告号CN222214109U，申请日期为2024年1月。

金融界 2024-12-28

“别逗了，连人的问题都没解决，AI谈何发展？”

随着人工智能技术的迅猛发展，AI行业在2024年经历了翻天覆地的变化，但其背后隐藏的人才紧缺问题却日益严峻。本文深入探讨了AI领域人才短缺的现状，分析了这一问题对行业发展的影响，并从多个角度揭示了人才供需矛盾的根源。

听筒Tech 2024-12-28

用户体验常见误区及解决办法

在应用用户体验思维时，因为经验不足难免会造成一些失误。本文对这些失误总结了7个要点，提前了解，可以帮助我们更好完成设计。

DesignLink 2024-12-28

利用 GPT 的视觉能力和 TTS API 来处理视频并添加旁白 [译]

推荐体验

相关资讯

GPT-4V和TTS功能实现视频解说

OpenAI 重磅更新，API 添加新函数调用能力

基于 Docker 的 Edge-TTS 中转API，兼容 OpenAI TTS接口

「豆包Marscode体验官」使用AI来处理Excel的数据吧

深度｜Andrej Karpathy 最新思考：小模型有巨大潜力，大模型用来处理多任务，AI 模型未来聚焦于处理重要信息的能力

近期资讯

ICT半导体集成电路测试有限公司取得像差校正器和带电粒子束装置专利，提升装置的性能

谈一谈浮躁的时代该怎么自处

敦仪科技取得晶圆旋干组件专利，能让使用者在操作时带来方便及效率

浙江中科尚弘取得用于离子注入机扫描系统的驱动机构专利，实现对靶盘组件垂直扫描运动的精确控制

东莞市晟鼎精密仪器取得真空等离子反应腔装置专利，减少能耗

痛包、痛桌、痛厕所，年轻人为何“痛一切”？

数据分析误区系列（二）：数据揭示的谎言

东莞晟鼎取得一种等离子体均匀分布的气体分流装置专利，能实现等离子体均匀分布

“别逗了，连人的问题都没解决，AI谈何发展？”

用户体验常见误区及解决办法

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响