多彩网

玩转 Deepseek-R1 本地部署+知识库搭建+多轮RAG,保姆级教程!

玩转 Deepseek-R1 本地部署+知识库搭建+多轮RAG,保姆级教程!

liyalv 2025-03-04 武术瑜伽 4 次浏览 0个评论

最近,深度求索开源的 DeepSeek-R1 系列模型火遍全球,但因为“服务器繁忙”劝退不少人。为了解决这个问题,我们将以 UltraRAG 框架为例,为大家介绍 DeepSeek-R1 的本地部署流程,同时带领大家熟悉 UltraRAG 的细节和功能。在成功跑通 VanillaRAG 后,我还简单尝试了在 DeepSeek-R1 加持下的 Adaptive-Note,提出法律领域的问题,效果居然出乎意料的好,有截图为证:
如上图,在 UltraRAG 上对 VanillaRAGAdaptive-Note 分别提问“我喝多后撞了人可能会承担什么罪责?”VanillaRAG 简单直接,分别列出了罪名和建议,内容全面,但是稍微有点不够细致。再看看 Adaptive-Note 的回答,不光总结了可能的几点罪名,并且分析了酒精含量和事后处理态度对量刑和赔偿的影响,引经据典,令人信服。整体来看, Adaptive-Note 的回答更加可信。
VanillaRAG:是最基础的 RAG(Retrievals-Augmented Generation,检索增强生成)架构,通常指的是未经优化或改进的标准 RAG 方法。它的基本流程包括:查询构造(Query Formation)、检索(Retrievals)、生成(Generation)
Adaptive-Note:  一种用于复杂问答任务的自适应笔记增强 RAG 方法,采用 检索-记忆(Retriever-and-Memory) 机制, iteratively 收集和优化知识结构。它通过自适应记忆复审和任务导向生成提高知识交互质量,并采用基于笔记的探索终止策略确保信息充分获取,以提升答案质量。论文: http://arxiv.org/abs/2410.08821
看到这里,我猜大家已经迫不及待想要体验 UltraRAG 了,所以接下来我们将手把手详细介绍 UltraRAG 的部署流程。


DeepSeek-R1 的模型有多个蒸馏版本,分别是 7B、14B、70B 以及满血的 671B 版本。权衡了条件和效果后,我们选择 14B 的模型进行部署,以下是运行 UltraRAG 的基本硬件要求:
这里需要注意 nvidia 的显卡驱动需要和 cuda 版本兼容,否则 vllm 运行模型有可能出现报错的情况。如果你的显卡出现不兼容的情况,可以尝试重装驱动和 cuda。这里推荐一个简单好用的安装方法,可以有效避免 cuda 和驱动的不兼容问题:登录 nvidia 官方网站(http://developer.nvidia.com/cuda-toolkit-archive),选择适合 cuda-toolkit 版本安装和安装参数(推荐使用 runfile 方式安装,真的简单好用!)。
cuda-toolkit参数配置页面
运行 UltraRAG 有两种方法,一种通过 docker 运行,这种方式最简单,需要你的机器上已经安装配置好了 nvidia-docker ,并拥有它的运行的权限(一般情况下需要 root 权限)。这种情况下,你只需要执行这行代码就行了:
如果你的机器上没有 nvidia-docker 也不要紧,可以配置 conda 环境来运行。
要确保你的本地机器安装了 conda,没有的话也可以在这个网址(http://docs.anaconda.com/miniconda/install/中找到安装的方法,使用普通账户直接安装,几行代码很好执行~
接着,就是在 conda 环境上安装 UltraRAG 的依赖,下面的代码依次执行就好了~
以上步骤操作完成之后,环境依赖就准备好了。接下来开始下载模型。
我们需要下载以下 3 个模型,分别执行命令。
模型下载完成之后,紧接着运行 llm 服务,具体执行这个命令即可~
这里简单说明一下参数的含义:
--gpu-memory-utilization 0.8:表示 GPU 的占用率,显存 80G 时,0.8 意味着最大占用 64GB 的显存。
--dtype auto:表示 vllm 自动选择模型参数类型。
--api-key token-abc123:自定义模型 API 的密钥为token-abc123。
vllm 服务部署完成后将会启动 OpenAI-Compatibly 的服务,默认参数为:
为了常驻后台,你也可以使用以下命令运行:
好了,现在环境搭好了,模型也下载好了,我们现在来运行 UltraRAG:
如果一切顺利,我们会看到下图的结果。这意味着 WebUI 已经跑起来了,我们把 URL  复制到浏览器,应该就能访问页面了,你可以使用 3 个 URL 中的任何一个进行访问:

这里附上超详细视频教程,可以对照细节一步步上手:


UltraRAG 框架由清华大学 THUNLP 联合东北大学 NEUIR 、面壁智能团队及 9#AISoft 团队共同提出,基于敏捷化部署与模块化构造,引入了自动化的“数据构建-模型微调-推理评测”知识适配技术体系,提供了一站式、科研与开发双重友好的 RAG 系统解决方案。UltraRAG 显著简化了 RAG 系统在领域适配过程中,从数据构建到模型微调的全流程,助力科研人员与开发者高效应对复杂任务:
UltraRAG 框架具有以下优势:
零代码编程 WebUI 支持:零编程经验用户亦可上手操作全链路搭建和优化过程,包括 多模态 RAG 方案 VisRAG ;
合成与微调一键式解决:以自研 KBAlign、RAG-DDR 等方法为核心,一键式系统化数据构建 + 检索、生成模型多样微调策略支持下的性能优化;
多维多阶段稳健式评估:以自研 RAGevals 方法为核心,融入面向有效/关键信息的多阶段评估方法,显著提升“模型评估”的稳健性;
科研友好探索工作集成:内置 THUNLP-RAG 组自研方法及其他前沿RAG 方法,支持模块级持续探索与研发。

以上全部功能,都可以直接通过 web 前端快速实现。

转载请注明来自常州多彩网超声波设备有限公司,本文标题:《玩转 Deepseek-R1 本地部署+知识库搭建+多轮RAG,保姆级教程!》

百度分享代码,如果开启HTTPS请参考李洋个人博客
每一天,每一秒,你所做的决定都会改变你的人生!
Top
 芦洋村内部修路最新消息  路虎最新款2024街拍  江永桃川镇新闻网最新  最新昆山工业用电价格表  罗湖美景大厦进水了吗最新消息  途昂二手价格嘉兴最新  高帮女鞋最新款式大全  携带陶瓷大壶最新款  降噪顶级耳机推荐最新款  济南楼市最新消息价格  金珠手绳最新款图片大全  最新新闻偷拍  沈冲土菜馆团购价格表最新  泰兴市疫情最新新闻播报  中山传销最新新闻  营口车祸新闻最新  塘沽诈骗新闻最新  兰州临泽最新新闻  捷达刹车配件价格表最新  最新款雅  欧洲最新款蒙迪欧多少钱  百里杜鹃最新新闻联播  雪竹餐馆团购价格表最新  新化旱灾最新消息  佛沙发350最新价格  吊顶大灯最新款式  山东州疫情最新消息通知  平安路复式公寓价格表最新  亳州2018规划最新消息  宁夏高定家具价格表最新 
多彩网