笔记¶

书生·浦语大模型实战营

网课地址：https://www.bilibili.com/video/BV1Rc411b7ns
学习手册：https://jpf9plilub.feishu.cn/docx/CjEpd96yhoT4owx6GE7cDvZLnWg
Q&A 文档：https://cguue83gpz.feishu.cn/docx/Noi7d5lllo6DMGxkuXwclxXMn5f
GPTs: https://www.glbai.com/

L1 书生·浦语大模型全链路开源开放体系¶

本节课程概要：

通用大模型能够应对多种任务、多种模态

从模型到应用所需的步骤：

数据¶

开源书生万卷数据集，和 OpenDataLab 平台，https://opendatalab.com/

评测¶

比较流行的评测数据集：

OpenCompass 开源评测平台，https://opencompass.org.cn/

部署¶

大语言模型部署的技术难点：

LMDeploy: https://github.com/InternLM/lmdeploy

应用¶

从LLM到智能体，Lagent: https://github.com/InternLM/lagent

AgentLego: https://github.com/InternLM/agentlego

L2 轻松玩转书生·浦语大模型趣味 Demo¶

文档地址：https://github.com/InternLM/tutorial/blob/main/helloworld/hello_world.md

InternLM-Chat-7B 智能对话 Demo¶

InternLM：https://github.com/InternLM/InternLM 是一个开源的轻量级训练框架，旨在支持大模型训练而无需大量的依赖。基于 InternLM 训练框架，上海人工智能实验室已经发布了两个开源的预训练模型：InternLM-7B 和 InternLM-20B。

Command Line Demo:
Streamlit Web Demo:

Lagent 智能体工具调用 Demo¶

Lagent：https://github.com/InternLM/lagent 是一个轻量级、开源的基于大语言模型的智能体（agent）框架，支持用户快速地将一个大语言模型转变为多种类型的智能体，并提供了一些典型工具为大语言模型赋能。架构如图所示：

在 Web 页面选择 InternLM 模型，等待模型加载完毕后，输入数学问题已知 2x+3=10，求x ,此时 InternLM-Chat-7B 模型理解题意生成解此题的 Python 代码，Lagent 调度送入 Python 代码解释器求出该问题的解。

浦语·灵笔图文理解创作 Demo¶

浦语·灵笔：https://github.com/InternLM/InternLM-XComposer，是基于书生·浦语大语言模型研发的视觉-语言大模型，提供出色的图文理解和创作能力，结合了视觉和语言的先进技术，能够实现图像到文本、文本到图像的双向转换。使用浦语·灵笔大模型可以轻松的创作一篇图文推文，也能够轻松识别一张图片中的物体，并生成对应的文本描述。

图文创作：
图片理解：

L3 基于 InternLM 和 Langchain 搭建你的知识库¶

文档地址：https://github.com/InternLM/tutorial/blob/main/langchain/readme.md

大模型开发范式¶

LLM 大模型的局限性

知识时效性受限：如何让 LLM 能够获取最新的知识
专业能力有限：如何打造垂域大模型
定制化成本高：如何打造个人专属的 LLM 应用
RAG (Retrieval Augmented Generation) 检索增强生成

核心思想：给大模型外挂一个知识库，对于用户的提问，会首先从知识库中匹配到提问，对应回答的相关文档，然后将文档和提问一起交给大模型来生成回答，从而提高大模型的知识储备。

RAG 流程图：
1. 对于每一个用户输入，首先将基于向量模型 Sentence Transformer，将输入文本转化为向量；
2. 在 Chroma 向量数据库中匹配相似的文本段，我们认为与问题相似的文本段大概率包含了问题的答案；
3. 然后我们会将用户的输入和检索到的相似文本段一起嵌入到模型的 Prompt 中，传递给 InternLM 模型，要求模型对问题作出最终的回答，作为最后的输出。
RAG 优缺点：
- 低成本且可实时更新：对于新的知识，只需组织加入到外挂知识库中即可，无需对大模型进行重新训练，不需要 GPU 算力；
- 能力受基座模型影响：大基座模型的能力上限极大程度决定的 RAG 应用的能力天花板；
- 单次回答知识有限：RAG应用每次需要将检索到的相关文档和用户提问一起交给大模型进行回答，占用了大量的模型上下文；
- 对于一些需要大跨度收集知识，进行总结性回答的问题表现不佳。
Finetune 微调

核心思想：在一个新的较小的训练集上，进行轻量级的训练微调，从而提升模型在这个新数据集上的能力。

Finetune 优缺点：
- 可个性化微调：Finetune 范式的应用将在个性化数据上微调，充分拟合个性化数据，尤其是对于非可见知识，如回答风格模拟效果非常好；
- 知识覆盖面广：Finetune 范式的应用是一个新的个性化大模型，具有大问题的广阔知识域；
- 成本高昂：需要在新的数据集上进行训练，需要很多的GPU算力和个性化数据；
- 无法实时更新：更新成本高。