说起AI圈的“网红”,Andrej Karpathy是大家很熟悉的名字,他不仅是Openai的创始成员,也曾经担任特斯拉的AI总监长达五年。他最近做了一个关于大模型的分享,我将其内容浓缩整理成为一个太长不看/TLDR版,正好为迟些要主讲的内部大模型培训做个准备,希望能让没有技术基础的同学们也能了解大模型是什么和大模型的发展方向这两个重要的议题。第一部分:大模型是什么?* 简单来说,一个大语言模型其实只需要两个文件!以Meta发布的Llama2 70B模型为例,你的笔记本电脑上只需要下面这两个文件就能在本地
大语言模型OpenAI
RichChat 2023-12-05
在过去的一年里,云技术、机器学习和生成式AI变得更为普及,从写电子邮件到开发软件,甚至是癌症早期筛查,这些技术几乎影响到人类生活的方方面面。创新将是未来数年各个领域的重要主题,旨在普及技术,帮助我们跟上日益加快的生活节奏,而这一切都将始于生成式AI。 生成式AI将逐渐具备文化意识 用文化多样性数据训练的大语言模型(LLM)将更加细致入微地了解人类经验和复杂的社会挑战。这种文化流利度有望让全球用户更便利地使用生成式AI。 从我们讲的故事、吃的食物和穿着打扮,到价值观、礼仪、偏见、处理问题和做决定的方式,文化
亚马逊生成式AI机器学习大语言模型
奔流实时 2023-12-05
联发科的新一代旗舰级AI处理器APU和AI开发平台NeuroPilot,可以显著提高大模型在终端侧的运行效率,为vivo的端侧生成式AI应用提供强大的AI算力和性能。有这么多的AI生态合作,从部署到落地都有了…
大语言模型生成式AI
观察科技 2023-12-05
百度在3月16日发布知识增强大语言模型文心一言,目前文心一言的基础模型已迭代到文心大模型4.0版本。知识增强大语言模型从数万亿数据和数千亿知识中融合学习,得到预训练大模型,在此基础上采用有监督精调、人类反馈强…
文心大模型大语言模型百度文心一言
百度 2023-12-05
当ChatGPT发布后,如何将大语言模型技术与各个领域结合应用引起了广泛的关注与探讨。在开发安全领域,静态代码检测技术也因为大语言模型的出现,有了产生变革的可能。近日,海云安公司宣布,已成功实现将大语言模型(…
大语言模型编程ChatGPT
安全牛 2023-12-05
这篇报告详尽地回顾了自ChatGPT发布一年以来,各种声称与ChatGPT相当或更优的开源大语言模型在各种任务上的表现!报告整合了各种评估基准,分析了开源LLMs与ChatGPT在不同任务上的比较。包括一般能力、代理能力、逻辑推理能力、长文本建模能力、特定应用能力(如问答、总结)、以及可信赖性(如幻觉、安全性)。结论先行:综合能力,ChatGPT,依然,遥遥领先!以下是报告简要总结: 1、一般能力:基准测试:包括MT-Bench(多轮对话和指令遵循能力测试),AlpacaEval(测试模型遵循一
OpenAIChatGPT大语言模型
AI研习所 2023-12-04
数码闲聊站爆料称:“vivo和天玑实现了70亿AI大语言模型,目前手机上的最高档,也是第一个实现这么大规模的,还有10亿AI视觉大模型,这是相当卷了。联发科的新一代旗舰级AI处理器APU和AI开发平台Neur…
AI大模型大语言模型
科技泛观察 2023-12-04
至此,通义千问共开源18亿、70亿、140亿、720亿参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。据介绍,Qwen-72B可以处理最多32k的长文本输入,在长文本…
通义千问大语言模型
中国网科技 2023-12-04
11月14日消息,英伟达北京时间13日发布了下一代人工智能超级计算机芯片,这些芯片将在深度学习和大型语言模型(LLM)方面发挥重要作用,比如OpenAI的GPT-4。新芯片相比上一代有了显著的飞跃,将被用于数…
英伟达OpenAI人工智能深度学习
高清范VR 2023-12-03
以大语言模型为基础所形成的文生图,文生文还有文生视频能力,进一步推动AI的赋能进入“副驾驶模式”。目前在内容策划环节,爱奇艺利用生成式AI将项目评估信息的整理耗时由几小时压缩至几分钟。12月1日,爱奇艺副总裁孙斌来到钛媒体2023T-EDGE全球创新大会,并在创新趋势论坛上带来了爱奇艺的AIGC实践分享。
大语言模型生成式AIAIGC
钛媒体APP 2023-12-03
Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1