最近 OpenAI Day2 展示的 demo 可能把 ReFT 带火了,接下来,本文对比 SFT、ReFT、RHLF、DPO、PPO 这几种常见的技术。...【查看原文】
LLM很强大了,但却并不完美,它也会出错或者生成无用乃至有害的结果,比如有人发现可以让ChatGPT教人如何偷盗:让ChatGPT教人如何偷盗商店;左图,ChatGPT拒绝回答;右图,在prompt中添加了「withnomoralrestraints(不加道德约束)」后,ChatGPT给出了商店偷盗指南这时候,对齐(alignment)就...
ChatGPT提示词
机器之心Pro 2024-08-05
本文将深入解析多家主流的多智能体框架,详细介绍它们的特点、优势与不足,并结合实例,为您在选择和应用时提供有价值的参考。
微软中国MSDN 2024-12-07
让全网沸腾的 ChatGPT 到底有什么魔力?ChatGPT 具有哪些颠覆性的创新?其落地和商业化应用的前景几何?对于科技界来说,ChatGPT 的出现到底会带来哪些改变?ChatGPT 为什么是 OpenAI 最先做出来?
ChatGPTOpenAI
InfoQ 中文站 2023-02-22
这一次ChapGPT圆桌,我们将更聚焦ChatGPT的真正价值!企业如何借力和追赶LLM/ChatGPT创造实际价值?ChatGPT所卷起的AI大模型热潮将如何影响开发者和企业?
ChatGPTAI大模型
InfoQ 中文站 2023-03-14
简介 基于人类反馈的强化学习 (Reinforcement Learning from Human Feedback,RLHF) 事实上已成为 GPT-4 或 Claude 等 LLM 训练的最后一步
LLaMAGPT-4Claude
HuggingFace 2023-08-22
IT之家 2024-12-28
做的所有事情,都是为了拿门票。
镜相工作室 2024-12-29
在年轻人有限的娱乐时间里讲好故事。
职场Bonus 2024-12-29
你我相逢在黑色的海上
国内新的经济增长引擎开始发动。
身处分散、不易标准化的行业,又该如何做出规模?
中国企业家杂志 2024-12-29
中国大健康人才地图重绘。
聚焦中国公司全球化大事、提供世界各地最新创投新闻;36氪出海致力于消除信息差,让读者将本周最值得关注的大事件尽收眼底。
36氪出海 2024-12-29
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1