随着技术的快速发展,检索增强生成(RAG)成为构建智能知识库的核心方案。嘉为蓝鲸 OpsPilot基于 RAG 技术打造高效知识处理体系,在 RAG 预处理环节,提取与分块技术通过精准解析文档结构、拆分语义单元为后续处理奠定基础。而在知识处理的 “下半场”,Embedding 与 检索 作为连接预处理与大模型应用的关键桥梁,前者做“翻译家”,把文本变成机器能懂的数字密码,后者则是 “导航器”,用这些密码在知识库快速找到答案。
在 RAG 系统中,Embedding起到两次关键转换的作用。一是接收预处理过后的文本块,将其转为高维向量存于数据库。二是用户提问时,Embedding 模型将问题转为 “问题向量”,系统匹配 “相似向量”,提取对应文本内容与问题构成提示词,输入大语言模型(LLM),生成回答,完成对话检索闭环。
在OpsPilot中,Embedding 和检索设置是怎么相互协作发挥优势的呢?
1)Embedding
将文本转化为向量,以数学形式捕捉语义特性与关系,使计算机能够“理解”数据
2)检索设置
通过向量相似度匹配,从海量知识库中快速定位相关信息
01.OpsPilot的Embedding模型
OpsPilot目前已经内置2个常用的Embed模型,具体有如下优势:
1)FastEmbed (BAAI/bge - small - zh - v1.5) 模型
其作用与优势如下:
2)bce - embedding - base_v1 模型
02.OpsPilot检索机制
拥有了文本分块和向量空间数据,OpsPilot使用三种检索设置实现对知识库的高效、精准检索。
嘉为蓝鲸OpsPilot基RAG技术,通过预处理-Embedding-检索三阶体系构建智能知识库。Embedding转换文本为语义向量,混合检索融合关键词匹配与向量搜索,内置双模型适配中文及跨领域场景,实现精准语义关联与高效知识闭环,赋能智能运维。
03.嘉为蓝鲸OpsPilot——更懂运维的AI平台
嘉为蓝鲸OpsPilot是集知识库管理、技能配置、机器人管理和工具管理为一体的智能运维支撑平台,深度融合 LLM 大模型的语义理解、知识增强与多模态处理能力,聚焦运维领域,突破单一 LLM 能力局限,成为更懂运维的智能 AI 平台。
申请演示