君不言语音识别技术则已,言则必称Whisper,没错,OpenAi开源的Whisper确实是世界主流语音识别技术的魁首,但在中文领域,有一个足以和Whisper相颉顽的项目,那就是阿里达摩院自研的...【查看原文】
# 前言 要解决问题: 需要一款开源的语音转文字应用, 用于视频自动转换字幕. 想到的思路: `openai`的`whisper`以及根据这个模型开发的`whisper.cpp`C++应用. 其它的补充: 最好在`linux`下部署, `Windows`下困难太多. --- # 一、部署`whisper` 官方文档要求至少十`python3.8-3.10`, 同时需要`ffmpeg`, 要有`nv`的显卡, 支持`cuda` 直接安装部署: `pip install -U openai-whisper`
WhisperOpenAI
不停感叹的老林 2024-01-08
前言 前段时间测试一下OpenAI的语音识别模型 当时发现效率很低,今天发现阿里有一个专注的语音识别大模型FunAsr 看介绍Funasr的中文识别能力应该比Whisper更强大: Funasr的模型
OpenAIWhisper
土圭垚墝 2024-05-29
很多做录音采访之类的工作,需要实时录音后期还要将谈话内容整理成文字,如果人工去做的话及其耗时,还可以根据音频文件生成srt字幕,非常适合做自媒体视频的人用,还比如看到一些视频非常好很想将里面的文案提取出来,有很多软件就可以实现将语音转成文字,这里就跟大家分享一个免费又好用的软件:Whisper,这是一个免费开源程序,该软件是whisper.cpp实现的Windows 移植,是OpenAI 的 Whisper自动语音识别 (ASR) 模型的 C++ 端口。github项目地址:https://github.
WhisperGitHubOpenAI
AI画师大阳 2023-09-09
功能实时语音转文字、实时翻译(需麦克风权限)导入音频、视频文件(mp3、wav、m4a、ogg、mp4、webm、ogm),导出逐句字幕或逐词字幕(导出格式:TXT、SRT、VTT)转录和翻译音频离线在您的个人计算机。由OpenAI的Whisper提供动力。可以简单理解为QT的前端界面,python语言构建服务端,使用Whisper语言模型进行计算语音转文字的软件。痛点在于离线,缺点也很明显,模型较大,高质量模型运算依赖于硬件和算法优化应用场景学习,歌曲提取歌词,视频提取字幕,多媒体信息前置数据提取相较于
mayoの自留地 2023-10-20
OpenAI Whisper实时语音识别:实现近乎实时的语音转文本 近年来,随着人工智能技术的飞速发展,语音识别领域也取得了突破性进展。OpenAI推出的Whisper模型就是其中的佼佼者,凭借其强大
OpenAIWhisper人工智能
用户391315911403 2024-09-02
PhotobyGoumbik文|叶伟民写文章常常会用到数据,最错误的做法,就是直接罗列数据。单独说30万公里是无感的,只感觉数字很大,但一秒钟可以跑完快8圈赤道,脑子里马上惊叹一声“哎呀,原来这么快啊”。
叶伟民写作 2024-12-29
BryanJohnson是一位硅谷的亿万富豪,他每年花费200万美金极限抗衰,采用过祖孙三代换血浆、基因疗法、干细胞疗法等等,受到全球媒体和关注健康人群的极大关注。
笔记侠 2024-12-29
IT之家12月29日消息,据日本共同社报道,索尼集团旗下的半导体公司及铠侠等6家日本国内半导体企业已开始为培养及获得人才而合作,各公司的工程师以大学生为对象介绍工作内容和职业规划。报道称,上述6家公司还包括三菱电机和瑞萨电子等,工程师在大学设置平台,宣传工作魅力并与学生交流。
IT之家 2024-12-29
12月26日至27日,全国工业和信息化工作会议在京召开。会议强调,2025年要培育壮大新兴产业和未来产业。原子级制造,继11月23日的2024原子级制造产业发展论坛后,一个月内再次被工信部点名要大力发展。
21世纪经济报道 2024-12-29
每个人都希望找到“长长的坡、厚厚的雪”,然后滚雪球。12月26日,百度公布了自己2024年的AI领域成绩单,可是愁坏了“密集恐惧症”患者。截至11月初,百度文心大模型的日均调用量已经超过15亿,相较一年前首次披露的5000万次,增长30倍。
读懂数字科技 2024-12-29
11月底华为发布了全新旗舰系列Mate70系列,现据最新消息,最近华为还会更新一款中低端系列新机——华为畅享70X。中国电信产品库显示8+128GB版或为1799元,8+256GB版或为1999元,8+512GB版或为2299元,提供雪域白、曜金黑、湖光青等配色。
小白测评 2024-12-29
钛媒体App12月29日消息,理想汽车CEO李想表示,我们100%会做机器人,但不是现在。我们如果连L4级别自动驾驶汽车,都解决不了,怎么去解决更复杂的?车是无接触机器人,包括道路提示、参与者都是标准化的,每个人都受交通规则的训练,这已经是最简单的人工智能机器人。如果车没法实现,其他人工智能机器人非常有限。
钛媒体快报 2024-12-29
据韩国航空铁路事故调查委员会29日通报,济州航空7C2216航班的2个“黑匣子”当中的飞行资料记录仪外形部分受损,另一个驾驶室语音记录仪保存完好。航空铁路事故调查委员会指出,通常“黑匣子”解读工作需要一周左右的时间,但解读受损的飞行资料记录仪可能需要一个月左右的时间。
极目新闻 2024-12-29
回首2024年,ICT产业发生了哪些令人印象深刻的事情,哪些技术得到了广泛应用和推广?展望2025年,有何新趋势值得关注和思考?近日,通信世界全媒体记者采访了通鼎互联/通鼎集团董事长沈小平。“如果用一个词或一句话总结‘我’的2024,我认为是‘种树者必培其根,种德者必养其心’。”
中国财富网 2024-12-29
随着华为全新产品Mate70系列、MateX6,以及HarmonyOSNEXT版本的推出,华为再度成为科技行业最为耀眼的明星。从去年开始,华为的手机销量也开始不断攀升,重新回到了行业领军的位置,尤其是高端产品依旧带来了独一无二的表现。很多人都觉得这是因为华为在技术研发领域投入巨大,获得了遥遥领先的优势。
万能的大熊 2024-12-29
Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1