基于本地知识库的大模型搭建

前排提示,文末有大模型AGI-CSDN独家资料包哦!

  • 一、安装postgresql
    • 1.下载postgresql
    • 2.安装postgresql
  • 二、配置向量插件
    • 1.向量插件配置
  • 三、数据库准备
    • 1.初始化
  • 四、初始化向量库
    • 1.向量库初始化
  • 五、模型,启动!
    • 1.阿型,启动!
  • 六、上传本地知识库及效果展示
    • 1.上传本地知识库

一、安装postgresql

1.下载postgresql

1)进入下载网址,根据本地设备下载对应版本的数据库(以window安装postgresql16版本为例)https://www.enterprisedb.com/downloads/postgres-postgresql-downloads

在这里插入图片描述

2.安装postgresql

1)具体安装可以一路next,或者参考别人的博客安装一下,建议安装默认路径。默认安装的路径应该是C:\Program Files\PostgreSQL\16
(PS:记好设置的账号密码)

二、配置向量插件

这一步是重点,配置前需要确定你的电脑是否有visual studio下的C++环境,如果没有的话,需要下载visual studio(社区版即可,无需专业版),安装时把C++的都选上。同时记住安装地址
下载地址:https://visualstudio.microsoft.com/zh-hans/downloads/
在这里插入图片描述

1.向量插件配置

1)以管理员身份打开Developer Command Prompt for VS 2022终端(此处我下载的是社区版VS 2022版)
在这里插入图片描述
2)在Developer Command Prompt for VS 2022终端进入源码目录下(E:\LLM\Langchain-Chatchat)执行call命令
call “E:\visualStudio\VC\Auxiliary\Build\vcvars64.bat”(根据自己的安装目录调整路径),若出现call命令出错,也可以直接到对应的目录下进行点击启动。
在这里插入图片描述

3)执行set "PGROOT=C:\Program Files\PostgreSQL\16"语句(根据自己postgresql的安装地址修改,如果是默认则无需修改)
在这里插入图片描述
4)执行语句下载pgvector文件,git clone --branch v0.4.4 https://github.com/pgvector/pgvector.git
在这里插入图片描述
5)进入pgvector目录,执行
nmake /F Makefile.win
nmake /F Makefile.win install语句
在这里插入图片描述
6)打开pgAdmin4,创建数据库以及安装向量插件。
语句如下:
CREATE DATABASE TEST;
CREATE EXTENSION IF NOT EXISTS vector;

在这里插入图片描述
在这里插入图片描述
这些做完,基本上就差不多了,马上成功了吼吼吼!!!

三、数据库准备

这一步就该回到Anaconda Powershell Prompt终端了。

1.初始化

1)在configs目录下执行python -m spacy download en_core_web_sm语句。
在这里插入图片描述
2)在configs目录下执行python -m spacy download zh_core_web_sm语句
在这里插入图片描述
3)在configs目录下执行pip install psycopg2语句
在这里插入图片描述
4)在configs目录下执行pip install pgvector语句
在这里插入图片描述

四、初始化向量库

1.向量库初始化

1)在Langchain-Chatchat目录下,执行python init_database.py --recreate-vs语句,进行数据初始化
在这里插入图片描述

五、模型,启动!

1.阿型,启动!

1)执行python startup.py -a启动模型
在这里插入图片描述

六、上传本地知识库及效果展示

1.上传本地知识库

1)选择知识库管理,然后选择新建数据库
在这里插入图片描述
2)添加文件(仅支持txt文件)
在这里插入图片描述
3)测试问答
在这里插入图片描述


恭喜您,你已经成功搭建了属于你自己的本地知识库大模型,接下来快去训练属于自己的“小助理”吧!祝您生活愉快!!!

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!
在这里插入图片描述

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

👉AI大模型学习路线汇总👈

大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

👉大模型实战案例👈

光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

在这里插入图片描述

👉大模型视频和PDF合集👈

观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
在这里插入图片描述
在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

Logo

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。

更多推荐