大模型微调实战（八）-使用INT8/FP4/NF4微调大模型

作者：吃果冻不吐果冻皮发布时间：2023-12-05

ChatGPT

随着，ChatGPT 迅速爆火，引发了大模型的时代变革。然而对于普通大众来说，进行大模型的预训练或者全量微调遥不可及。由此，催生了各种参数高效微调技术，让科研人员或者普通开发者有机会尝试微调大模型。...【查看原文】

相关资讯

大模型微调实战（七）-基于LoRA微调多模态大模型

随着，ChatGPT 迅速爆火，引发了大模型的时代变革。然而对于普通大众来说，进行大模型的预训练或者全量微调遥不可及。由此，催生了各种参数高效微调技术，让科研人员或者普通开发者有机会尝试微调大模型。

LoRA ChatGPT

吃果冻不吐果冻皮 2023-12-04

阿里发布通义千问大模型的int8版本

可在线运行的notebook链接：在kaggle网站搜索：Qwen-7B-Chat-Int8首先需要安装依赖包：!pip install modelscope tiktoken transformers_stream_generator!pip install auto-gptq optimum接着加载八比特量化的模型：from modelscope import AutoTokenizer, AutoModelForCausalLMtokenizer = AutoTokenizer.from_pretr

通义千问

AI日日新 2023-10-18

近期资讯

分析上位机通信难题：复杂性与应对策略

在工业自动化和物联网（IoT）领域，上位机通信一直被认为是开发过程中的一大难点。上位机通信扮演着至关重要的角色。

小码编匠 2024-12-28

.NET 五个优秀依赖注入框架大盘点

在平时开发中，依赖注入（Dependency Injection, DI）已经成为构建模块化、可测试和易于维护应用程序的关键技术之一。

小码编匠 2024-12-28

JavaScript 自定义双击事件，CustomEvent 对象的使用详解

大家好，我是CoderBin。在本篇文章中，我会详细介绍关于如何创建自定义事件、监听自定义事件的技巧，以及实现一个关于双击自定义事件的案例。

CoderBin 2024-12-28

深入浅出 MySQL 数据库关键知识点与高可用方案

在当今数字化时代，数据已成为企业发展和决策的核心资产。而 MySQL 作为一款广泛使用的开源关系型数据库管理系统，在数据存储、管理和处理方面发挥着至关重要的作用。无论是小型创业公司还是大型企业，深入理

快起来别睡了 2024-12-28

java并发系列-ConcurrentHashMap 底层原理（一）

这篇文章，我打算从以下几个方面来讲。 1）多线程下的 HashMap 有什么问题？ 2）怎样保证线程安全，为什么选用 ConcurrentHashMap？ 3）ConcurrentHashMap 1.

舞动灵魂 2024-12-28

记一次使用投屏软件scrcpy导致Android设备横竖屏切换的问题

问题还原某天，测试同事突然报所有应用都变成竖屏了，实际上系统默认就是横屏显示的，某些应用强制显示横屏的应用，也被显示成了竖屏。问题分析如何通过adb命令切换横竖屏很明显，是系统的某个属性的变化

HelloBan 2024-12-27

有人吃下海贝后永久失忆这种可怕的事情越来越容易发生了

吕宋岛（Luzon）居住着菲律宾一半以上的人口，在这里，许多人经常食用诸如贝类这样的海产品。贝类常以浮游生物为食，但一个国际研究团队注意到，吕宋岛贝类的食谱中包括了一类叫做拟菱形藻（P

2024-12-28

OpenHarmony UI开发-ohos-svg

ohos-svg是一个SVG图片的解析器和渲染器，解析SVG图片并渲染到页面上。它支持大部分 SVG 1.1 规范，包括基本形状、路径、文本、样式和渐变,它能够渲染大多数标准的 SVG 图像。ohos

别说我什么都不会 2024-12-27

高效搭建Nacos：实现微服务的服务注册与配置中心

Nacos（Dynamic Naming and Configuration Service）是阿里巴巴开源的一款动态服务发现、配置管理和服务管理平台。它旨在帮助开发者更轻松地构建、部署和管理分布式系

M1A1 2024-12-28

支付相关—支付宝小程序非同一主体下多商户进行收款

官方文档的描述小程序非同一主体下的商家进行收款普通小程序由于没有授权回调地址，无法完成第三方授权。需要完成以上需求，目前有三种方案

我要成为Java糕手 2024-12-28

大模型微调实战（八）-使用INT8/FP4/NF4微调大模型

推荐体验

相关资讯

大模型微调实战（七）-基于LoRA微调多模态大模型

阿里发布通义千问大模型的int8版本

贪心大模型微调实战营

贪心大模型微调实战营贪心大模型开发应用实战营贪心大模型微调实战营算法篇分享

贪心AI大模型实战开发微调大模型学习

近期资讯

分析上位机通信难题：复杂性与应对策略

.NET 五个优秀依赖注入框架大盘点

JavaScript 自定义双击事件，CustomEvent 对象的使用详解

深入浅出 MySQL 数据库关键知识点与高可用方案

java并发系列-ConcurrentHashMap 底层原理（一）

记一次使用投屏软件scrcpy导致Android设备横竖屏切换的问题

有人吃下海贝后永久失忆这种可怕的事情越来越容易发生了

OpenHarmony UI开发-ohos-svg

高效搭建Nacos：实现微服务的服务注册与配置中心

支付相关—支付宝小程序非同一主体下多商户进行收款

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响