个人网站 前置审批WordPress文章内容彩色
- 作者: 五速梦信息网
- 时间: 2026年03月21日 11:13
当前位置: 首页 > news >正文
个人网站 前置审批,WordPress文章内容彩色,app store应用商店下载,客户关系crm管理系统大家好#xff0c;今天我们来继续看看 RAG 落地的一些有趣的事儿#xff0c;从技术社群早上的讨论开始#xff0c;喜欢技术交流的可以文末加入我们 一、从一周出Demo、半年用不好说起 最近读了读2024-傅盛开年AI大课#xff0c;其中有讲到RAG环节#xff0c;三张片子比较…大家好今天我们来继续看看 RAG 落地的一些有趣的事儿从技术社群早上的讨论开始喜欢技术交流的可以文末加入我们 一、从一周出Demo、半年用不好说起 最近读了读2024-傅盛开年AI大课其中有讲到RAG环节三张片子比较有趣。 首先用检索的方法配合大模型进行任务处理可以很好的使用企业数据进行知识问答 这是继是当前为大家所熟知的RAG问答范式了。 其次RAG开源框架很多可现实很骨感 片子里的那句话说的很现实一周出Demo半年用不好 例如目前已经开源的RAG框架包括12种【还不全面】其中排在前5的为大家所熟知 1LangChain https://github.com/langchain-ai/langchain/ 2QAnything https://github.com/netease-youdao/QAnything/tree/master 3LlamaIndex https://github.com/run-llama/llama_index/ 4langchainchat https://github.com/chatchat-space/Langchain-Chatchat/releases/tag/v0.2.8
- FastGPT https://github.com/labring/FastGPT
6langchain4j https://github.com/langchain4j/langchain4j
7Unstructured https://github.com/Unstructured-IO/unstructured
8GPT-RAG https://github.com/Azure/GPT-RAG
9Quivr https://github.com/StanGirard/quivr
10Dify https://github.com/langgenius/dify
11Verba https://github.com/weaviate/Verba
12danswerhttps://github.com/danswer-ai/danswer
最后给出的高级套件其中涉及到知识预处理、语义理解和改写、混合检索引擎、自动化质量评估体系、微调效果校准等多个例子。 二、现实实践优化探索与真实反馈
最近技术社群一个小伙伴分享了一个工作《RAG探索之路的血泪史及曙光》读了一下讲的也很不错推荐给大家读一读。
agent的技术发展流程 朴素RAG的实现方式 针对文本切割的一些经验 此外在chatglm金融问答比赛中的一些方案 在总结侧可以同时结合正则、关键词抽取、文档问答、ICL、分块文本信息加入标题等提升效果。 当然方案是方案其中一些有趣的讨论
Q:我对于RAG相当没有信心。两个问题实在让我跪了1Retrieval明明是对的。但是LLM根据Retrieval结果回答问题出错。睁眼说瞎话的几率还是明显大于用户可以接收的概率用户一般只能接受0.1%的错误率;2多跳逻辑无法通过Retrieval来做。比如查询Elon musk的兄弟叫什么名字可能资料里只有Elon的妈妈是谁Elon妈妈生了几个孩子。需要合成这个逻辑。优化prompt template使用GPT4使用CoT使用reference generation使用NLI都没办法让错误率到1%以下。还是会偶尔胡编……
A: reasoning 还是有存在价值的用 llm 推理是一条路径。不过也不唯一。好问题。第一个我们遇到过最后通过优化 prompt template 和自定义答复模板解决第二个建议试试用graph database 用来召回特别适合解决多度和多跳关系。rag 使用 embedding 我只能说局限太大。
Q:第二个问题不是graph能解决的。我刚才举的例子能用graph。实际上没法用Graph的例子海量。比如一些客服机器人在回答优惠券的组合使用的问题。 Q:提到的普通文本上下文检索优化中转为html方式后优化检索的方式我非常感兴趣请问您知道是否有这方面的论文或者公开数据集吗
A: 数据源有以下几种形式Markdown。直接使用 Python-Markdown转化到 Html。pdf。可以找相关库转化为 Markdown再转化为 Html有些包也支持直接转。Html。拿来用即可。关于 Html 检索是我自己实现的逻辑主要阶段有两个分片入库。
主要思路是识别 html 中的 headerparagraph和 olul 等标记。并将其转化为元数据连同 embedding 的结果一同保存到vector store 中。
元数据应该包含分片来自的源文件分片 id应该符合源文件中出现的原始顺序递增。这个挺重要会用于后面上下文检索。分片的 html tag特别是需要通过 header 体现自己隶属于哪个层级。
检索。如果命中某个分片则获取分片的元数据。然后根据所属的层级信息进行处理上下文补全vector store 中当前层级的所有分片都找到。这里就不是基于 vector similarity 检索了一个小技巧是将层级直接体现在字段中按字段直接索引。如果发送给 llm context 还有剩余可以再找兄弟平行层级如果还有剩余可以找父层级。
技术交流资料
技术要学会分享、交流不建议闭门造车。一个人可以走的很快、一堆人可以走的更远。
成立了大模型技术交流群本文相关资料、技术交流答疑均可加我们的交流群获取群友已超过2000人添加时最好的备注方式为来源兴趣方向方便找到志同道合的朋友。 方式①、微信搜索公众号机器学习社区后台回复加群 方式②、添加微信号mlc2060备注来自CSDN 技术交流 通俗易懂讲解大模型系列 做大模型也有1年多了聊聊这段时间的感悟 用通俗易懂的方式讲解大模型算法工程师最全面试题汇总 用通俗易懂的方式讲解我的大模型岗位面试总结共24家9个offer 用通俗易懂的方式讲解大模型 RAG 在 LangChain 中的应用实战 用通俗易懂的方式讲解一文讲清大模型 RAG 技术全流程 用通俗易懂的方式讲解如何提升大模型 Agent 的能力? 用通俗易懂的方式讲解ChatGPT 开放的多模态的DALL-E 3功能好玩到停不下来 用通俗易懂的方式讲解基于扩散模型Diffusion,文生图 AnyText 的效果太棒了 用通俗易懂的方式讲解在 CPU 服务器上部署 ChatGLM3-6B 模型 用通俗易懂的方式讲解使用 LangChain 和大模型生成海报文案 用通俗易懂的方式讲解ChatGLM3-6B 部署指南 用通俗易懂的方式讲解使用 LangChain 封装自定义的 LLM太棒了 用通俗易懂的方式讲解基于 Langchain 和 ChatChat 部署本地知识库问答系统 用通俗易懂的方式讲解在 Ubuntu 22 上安装 CUDA、Nvidia 显卡驱动、PyTorch等大模型基础环境 用通俗易懂的方式讲解Llama2 部署讲解及试用方式 用通俗易懂的方式讲解基于 LangChain 和 ChatGLM2 打造自有知识库问答系统 用通俗易懂的方式讲解一份保姆级的 Stable Diffusion 部署教程开启你的炼丹之路 用通俗易懂的方式讲解对 embedding 模型进行微调我的大模型召回效果提升了太多了 用通俗易懂的方式讲解LlamaIndex 官方发布高清大图纵览高级 RAG技术 用通俗易懂的方式讲解为什么大模型 Advanced RAG 方法对于AI的未来至关重要 用通俗易懂的方式讲解使用 LlamaIndex 和 Eleasticsearch 进行大模型 RAG 检索增强生成 用通俗易懂的方式讲解基于 Langchain 框架利用 MongoDB 矢量搜索实现大模型 RAG 高级检索方法 用通俗易懂的方式讲解使用Llama-2、PgVector和LlamaIndex构建大模型 RAG 全流程
总结 本文主要介绍了RAG现有的一些开源框架以及后续实践环节中大家真实的感受。实际上RAG作为一个技术方案目前已经有很多大家都大差不差。 目前大模型和RAG等技术方案的开源极大地拉开了大家的门槛这是好事情对推动技术和业务发展。但这个有不是好事情这加剧了公司的竞争。 丢掉幻想打磨细节。 参考文献 1、傅盛2024开年AI大课PPT 2、https://zhuanlan.zhihu.com/p/664921095
- 上一篇: 个人网站 平台网站空间租赁 排名
- 下一篇: 个人网站 前置审批域名注册网站搭建
相关文章
-
个人网站 平台网站空间租赁 排名
个人网站 平台网站空间租赁 排名
- 技术栈
- 2026年03月21日
-
个人网站 百度推广建设网站使用的工具
个人网站 百度推广建设网站使用的工具
- 技术栈
- 2026年03月21日
-
个人网站 百度收录滨州市住房和城乡建设部网站
个人网站 百度收录滨州市住房和城乡建设部网站
- 技术栈
- 2026年03月21日
-
个人网站 前置审批域名注册网站搭建
个人网站 前置审批域名注册网站搭建
- 技术栈
- 2026年03月21日
-
个人网站 如何备案棋牌网站建设源码
个人网站 如何备案棋牌网站建设源码
- 技术栈
- 2026年03月21日
-
个人网站 商业土特产网站平台建设
个人网站 商业土特产网站平台建设
- 技术栈
- 2026年03月21日






