Public Docs
【模型量化】深度学习模型量化 & 量化理论 & 各平台的量化过程 & 硬件加速
【TVM】TI关于TVM的使用测试与分析
【LLM&LVM】大模型开源工程思维导图
【北航卓越工程师】《汽车前沿技术导论:智能驾驶》讲义
【工具链】Yocto使用介绍——使用Yocto创建一个树莓派的系统镜像
【工具链】使用ssh+dialog指令设定服务器指定用户仅容器访问
【推理引擎】一篇关于模型推理的详细对比与学习
【推理引擎】关于TVM中的Schedule优化详解(On going)
【LLM微调】使用litgpt进行私有数据集模型微调的测试总结
【TVM】在TVM Relay中创建一个自定义操作符
【STT+LLM+TTS】如何使用语音转文字模型+大预言模型+语音生成模型完成一个类人的语音交互机器人
【RAG】 通过RAG构建垂直领域的LLM Agent的方法探索
【RAG】GraphRAG精读与测试(On going)
【AI Agent】MetaGPT精读与学习
【AI Base】Ilya Sutskever 27篇必读论文分享清单
【Nvidia】Jetson AGX Orin/ Jetson Orin nano 硬件测试调试内容(On going)
【BI/DI】LLM Using in BI Testing Scenario (On going)
【Nvidia】How to Activate a Camera on Nvidia Platform in Details
【RAS-PI】树莓派驱动开发
【行业咨询阅读】关注实时咨询和分析
【mobileye】2024 Driving AI
【mobileye】SDS_Safety_Architecture
【yolo】yolov8测试
【nvidia】Triton server实践
【alibaba】MNN(on updating)
【OpenAI】Triton(on updating)
【CAIS】关于Compound AI Systems的思考
【Nvidia】关于Cuda+Cudnn+TensorRT推理环境
【BEV】BEVDet在各个平台上的执行效率及优化(On Updating)
【Chip】AI在芯片设计和电路设计中的应用
【Chip】ChiPFormer
【Chip】关于布线的学习
【Chip】MaskPlace论文精读与工程复现优化
【gynasium】强化学习初体验
【Cadence】X AI
【transformer】MinGPT开源工程学习
【中间件】针对apollo 10.0中关于cyberRT性能优化的深度解读和思考
【Robotics】调研了解当前机器人开发者套件(on updating)
【Robotics】ROS CON China 2024 文档技术整理与感想总结(上2024.12.7,中2024.12.8,下场外产品)
【algorithm】关于模型、数据与标注规范的平衡问题
【nvidia】DLA的学习了解与使用
【nvidia】构建nvidia嵌入式平台的交叉编译环境(其他环境平台可借鉴)
文档发布于【Feng's Docs】
-
+
首页
【RAG】 通过RAG构建垂直领域的LLM Agent的方法探索
# [llama index](https://github.com/run-llama/llama_index) `llama_index`(现称为 llama_index,以前称为 GPT Index)是一个用于构建、检索和操作文本数据索引的工具。它的核心作用是在大型语言模型(如GPT-3)之上创建高效的数据索引和查询接口,以便更快速和智能地处理文本数据。以下是llama_index的一些主要作用: * 索引构建: llama_index 可以从大文本数据集中提取有用的信息并构建索引。这个索引可以用来加速文本数据的查询和检索。 它支持多种数据格式的索引构建,包括文档、网页、数据库等。 * 高效检索: 通过构建的索引,llama_index 能够实现对大规模文本数据的高效检索。用户可以快速找到与查询相关的信息,而不需要遍历整个数据集。 * 智能查询接口: llama_index 提供了与GPT-3等大型语言模型的集成,能够通过自然语言查询从索引中提取信息。这样,用户可以使用类似对话的方式进行数据检索。 * 数据增强与转换: 它还可以对数据进行各种增强和转换操作,例如提取摘要、关键词提取、情感分析等。这些操作可以帮助用户更好地理解和利用数据。 * 应用集成: llama_index 可以与各种应用和系统集成,提供强大的文本数据处理能力。它可以用于搜索引擎优化、聊天机器人、知识库建设等多个领域。 # [Trulens](https://github.com/truera/trulens) `TruLens` 是一个用于对语言模型应用(如对话代理、文本生成系统等)进行透明化评估和解释的工具。它帮助开发者了解和改进语言模型的行为和性能。以下是 TruLens 的主要功能和作用: * 解释模型决策: TruLens 提供了工具和方法来解释语言模型的决策过程。这可以帮助开发者理解模型是如何得出特定答案的,并识别潜在的问题或偏见。 * 性能评估: 通过对模型输出进行定量和定性评估,TruLens 帮助开发者评估模型的性能。它可以自动生成性能报告,涵盖准确性、流畅性、一致性等方面。 * 可视化工具: TruLens 提供了一系列可视化工具,帮助开发者直观地分析模型的输出。例如,热图、注意力图等,帮助识别输入与输出之间的关系。 * 定制评估指标: 开发者可以定义和使用自定义的评估指标来评估模型的表现。这使得评估过程更具灵活性和针对性。 * 集成与扩展: TruLens 可以与多种模型和框架集成,支持对不同类型的语言模型进行评估和解释。它还提供了扩展功能,允许开发者根据需要添加新的功能和工具。 * 作用与应用场景 * 调试和改进模型:TruLens 帮助开发者识别模型的弱点和错误,并提供改进的方向。例如,通过分析错误样本,开发者可以针对性地调整模型或训练数据。 * 确保模型的公平性和透明性:通过解释模型决策和评估模型表现,TruLens 帮助开发者识别和减轻模型中的偏见和不公平现象。这对于部署在现实世界中的应用尤其重要。 * 提升用户信任:当用户知道模型的决策过程是透明且可解释的,他们对模型的信任度会增加。TruLens 提供的解释和评估功能有助于提升用户对模型的信任。 * 学术研究和实验:在研究和实验环境中,TruLens 可以帮助研究人员深入分析和理解语言模型的行为,为学术研究提供数据支持。     # Annexe * https://www.bilibili.com/video/BV1dz421B7ro?p=3&vd_source=c551ef751ac5907298e9c711d193f9cd * https://www.bilibili.com/video/BV1tw4m1q7PC/?spm_id_from=333.788.recommend_more_video.0&vd_source=c551ef751ac5907298e9c711d193f9cd * https://www.bilibili.com/video/BV1XC411n72m/?spm_id_from=333.788.recommend_more_video.1&vd_source=c551ef751ac5907298e9c711d193f9cd * https://www.bilibili.com/video/BV1Yi4y1B7RC/?spm_id_from=333.999.0.0 * [llama index](https://github.com/run-llama/llama_index) * [trulens](https://github.com/truera/trulens) * [Chain-of-Thought Prompting Elicits Reasoning in Large Language Models](https://ar5iv.labs.arxiv.org/html/2201.11903) * [Automatic Chain of Thought Prompting in Large Language Models](https://ar5iv.labs.arxiv.org/html/2210.03493) * [Self-Consistency Improves Chain of Thought Reasoning in Language Models](https://ar5iv.labs.arxiv.org/html/2203.11171) * https://www.trulens.org/trulens_eval/getting_started/core_concepts/1_rag_prototype/ * [Building-and-Evaluating-Advanced-RAG-Applications](https://github.com/kevintsai/Building-and-Evaluating-Advanced-RAG-Applications)
dingfeng
2024年7月4日 17:04
283
0 条评论
转发文档
收藏文档
上一篇
下一篇
评论
手机扫码
复制链接
手机扫一扫转发分享
复制链接
Markdown文件
PDF文档
PDF文档(打印)
分享
链接
类型
密码
更新密码