作者:Agent@胖娃 (B站同号)

时间:2024年5月12日

学习目标

  • 使用开源软件Ollama+AnythingLLM构建本地类ChatGPT问答机器人系统
  • 熟悉和了解基于LLM的本地RAG知识库搭建原理和逻辑,替换符合国内的LLM工具
  • 学会安装、配置、使用问答系统,找出符合企业私有化客服(对内)的产品规划逻辑
  • 对比和发现问题,寻找优劣点

软件版本

所需软件 版本及下载地址 备注
Ollama Download v0.1.32 for Mac verion
AnythingLLM useanything.com/downloa v1.5.4 for Mac verion
OS_MAC MacBook Pro OS 14.4.1 Intel Core i5

软件功能说明

所需软件 功能介绍
Ollama Ollama是一个开源的大型语言模型服务工具,它帮助用户快速在本地运行大模型。支持llama3\llama2\phi3等,可以是实时更新LLM
AnythingLLM 一个全栈应用程序,使您能够将任何文档、资源或内容转换为上下文,任何人都LLM可以在聊天期间用作参考。此应用程序允许您选择要使用的向量数据库LLM或向量数据库。目前,该项目支持Pinecone,ChromaDB等用于矢量存储,OpenAI用于LLM/chatting。

安装过程

Ollama安装和启动过程

Mac环境,软件安装的过程都比较简单且Ollama官网的文档已经很详细,就不在这里啰嗦了,可以直接参考文档,连接如下:

最新(24/5/12) 支持的LLM及版本

Model Parameters Size Download
Llama 3 8B 4.7GB ollama run llama3
Llama 3 70B 40GB ollama run llama3:70b
Phi-3 3.8B 2.3GB ollama run phi3
Mistral 7B 4.1GB ollama run mistral
Neural Chat 7B 4.1GB ollama run neural-chat
Starling 7B 4.1GB ollama run starling-lm
Code Llama 7B 3.8GB ollama run codellama
Llama 2 Uncensored 7B 3.8GB ollama run llama2-uncensored
LLaVA 7B 4.5GB ollama run llava
Gemma 2B 1.4GB ollama run gemma:2b
Gemma 7B 4.8GB ollama run gemma:7b
Solar 10.7B 6.1GB ollama run solar

我当前环境采用Llama3和Phi-3,先下载并启动好,后面在AnythingLLM配置中会用到。

  • 检查下载模型及其版本
    aiagent@ais-MacBook-Pro ~ % ollama – 查找常用命令工具

aiagent@ais-MacBook-Pro ~ % ollama list 查看使用模型清单

  • 启动Ollama服务

aiagent@ais-MacBook-Pro ~ % ollama serve 启动ollama服务

状态OK

到此,ollama准备完毕。

AnythingLLM安装和启动过程

AnythingLLM 是AnythingLLM 是一个开源的、可定制的、功能丰富的文档聊天机器人,支持多种文档类型,如 PDF、TXT、DOCX 等,并提供了一个用户界面来管理向量数据库中的文档。AnythingLLM 还具备两种聊天模式:对话模式和查询模式,以及聊天中的引用标注功能。

该项目文件连接如下:

其功能特性如下:

  1. 文档整合与智能对话
    1. AnythingLLM能够将各种类型和来源的文档、资料或内容转换成统一格式,使得LLM能够在聊天过程中直接引用这些内容,实现与用户就特定文档内容进行智能对话。
  1. 多用户支持与权限管理
    1. 支持多个用户同时使用,允许管理员设置不同的访问权限,控制谁能查看或编辑特定的知识库内容,确保数据的安全性和隐私性。
  1. 兼容多种LLM和组件
    1. 用户可以选择使用商业现成的LLM服务,如OpenAI的GPT系列模型,或是流行的开源LLM,如阿里云的通义千问等。同时,它还支持与向量数据库和其他相关组件集成,以增强系统的功能和性能。
  1. 全栈应用与灵活部署
    1. 作为一个全栈应用程序,AnythingLLM提供本地运行和远程托管两种部署方式,用户可以根据自身需求选择合适的部署环境。
  1. 定制化与扩展性
    1. 提供丰富的定制选项,用户可以根据具体业务需求对系统进行配置和扩展,使其更好地适应不同场景下的知识管理和对话需求。

到这里下载安装文件,注意平台版本

useanything.com/downloa

拖进去就OK了

它长这样

配置项也很齐全

配置过程

创造workspace

配置Workspace参数

在Chat Settings ,里面选址模型提供方以及具体的LLM模型。在选址问答形式有Chat聊天

和Query问答模式,以及在参数里面可以设置Prompt提示词

设置向量数据参数,通常情况下采取默认即可

设置Agent Configuration ,按照你自己的情况设置Provider

最后,上传本地文件

测试完成,正常反馈,安装部署成功