最近,以ChatGPT为代表的大语言模型在多轮对话等任务上展现出强大的性能,大型语言模型似乎已成为通向通用人工智能的必经之路。然而,模型量级与“智能”之间的关系仍然不得而知,普遍观点认为模型越大性能越强。但是随着模型变大,模型推断所需的显存和时间也成倍增长,计算代价十分高昂。以LLaMA-7B为例,翻译一条100字左右的文本需要近7s,而使用相同的设备配置,不到1B的机器翻译模型可在1s内以相同精度翻译长达数百字的篇章。因此,在保证模型精度的前提下,探索降低计算代价的高效方法是十分必要的。那么,高效方法具
ChatGPT大语言模型LLaMA人工智能
小牛翻译NiuTrans 2023-08-28
已超过GPT-4在3月份的成绩。
LLaMA编程GPT-4
杨亮 2023-08-28
今天看到一篇Meta的前沿资讯,想分享给人类朋友们。Coding效果比肩ChatGPT的Code Llama。Code Llama可以接受代码或文字prompt作为输入,生成代码和代码注释。
提示词编程LLaMAChatGPT
夕小瑶 2023-08-26
三个参数版本的CodeLlama模型都使用了500B的代码tokens和代码相关数据进行训练。7B和13B基础和指令模型也经过了FIM(fill-in-the-middle)训练,从而允许将代码插入到现有代码…
LLaMAGPT-4编程
机器之心Pro 2023-08-25
据介绍,扎迪·史密斯、史蒂芬·金等人的小说被纳入一个叫Book3的人工智能工具数据集,用于训练Meta旗下的大型语言模型LLaMA——这类语言模型中最著名的就是今年年初极受关注的OpenAI公司旗下ChatG…
人工智能大语言模型LLaMA
新京报书评周刊 2023-08-24
讯飞星火认知大模型的官方使用报告;快手App开放「快手AI对话」功能内测;Midjourney 正式上线局部重绘功能 Vary (Region)……点击阅读全文
LLaMAAI聊天机器人Midjourney
ShowMeAI 2023-08-23
简介 基于人类反馈的强化学习 (Reinforcement Learning from Human Feedback,RLHF) 事实上已成为 GPT-4 或 Claude 等 LLM 训练的最后一步
LLaMAGPT-4Claude
HuggingFace 2023-08-22
据报道,Meta 公司正准备发布新软件,能够帮助开发人员自动生成编码代码,将直接挑战 OpenAI、谷歌等其他厂商提供的同类专有方案。
编程LLaMAOpenAI谷歌
AI前线 2023-08-21
LLaMA都在用的开源数据集下架:含19万本书,对标OpenAI数据集 明敏 发自 凹非寺 量子位 公众号 QbitAI 开源数据集因侵权问题,惨遭下架。 如LLaMA、GPT-J等,
LLaMAOpenAI
量子位 2023-08-21
国外除了ChatGPT,还有Claude、LLaMA等知名大模型,国内文心一言、通义千问也投入了实际应用,值得表扬的是通义千问把大模型开源了。在huggingface,ChatGLM几乎是全球AI爱好者最受欢迎的模型。中国正在进行一个野心勃勃的计划,利用正在不断迭代的人工智能技术,全面改造和建设一个数字化中国。
ChatGPTClaude文心一言通义千问Hugging Face
诗与星空 2023-08-21
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1