在机器学习和自然理解任务中,Query(查询)、Ground Truth(真值标签)、Context(上下文) 是三个核心概念,尤其是在检索增强生成(RAG)、问答系统、信息检索等场景中。
1. Query(查询)
- 是什么:用户提出的问题、请求或输入。
- 作用:作为系统的输入,驱动系统执行搜索、推理或生成。
- 示例:
- 问答系统:
“珠穆朗玛峰有多高?”
- 搜索引擎:
“2023年诺贝尔文学奖得主”
- 对话系统:
“帮我写一封辞职信”
2. Ground Truth(真值标签)
- 是什么:针对 Query 的标准答案或理想输出,通常由人工标注或权威来源提供。
- 作用:用于训练、评估或验证模型的表现,作为衡量模型输出质量的基准。
- 示例:
- Query:
“珠穆朗玛峰有多高?”
- Ground Truth:
“8848.86米(2020年最新测量)”
- 在分类任务中,Ground Truth 可能是类别标签;在生成任务中,可能是参考文本。
3. Context(上下文)
- 是什么:与 Query 相关的背景信息或参考材料,系统需要基于它来生成答案或执行任务。
- 作用:提供推理依据,限制生成范围,确保答案的准确性和相关性。
- 常见类型:
- 检索到的文档(如 RAG 中的知识库片段)
- 对话历史(多轮对话中的先前对话内容)
- 结构化数据(如表格、知识图谱)
- 示例:
- Query:
“爱因斯坦的主要贡献是什么?”
- Context:
“阿尔伯特·爱因斯坦提出了相对论,解释了光电效应,并获得了1921年诺贝尔物理学奖。”
三者的关系与典型流程
- 用户输入 Query。
- 系统根据 Query 从知识库中检索或选择相关 Context。
- 模型结合 Query 和 Context 生成答案。
- 将模型输出与 Ground Truth 比较,评估准确性。
举例说明
RAG 场景
- Ground Truth(人工标注的参考答案):
“量子计算通过量子叠加和纠缠实现指数级并行计算能力,尤其在优化问题、密码学和量子化学模拟中具备革命性潜力。”
文本分类场景
- Query:一段文本数据
- Context:文本周围的上下文信息,例如其他相关文本或文档的标签,帮助模型更准确地分类
- Ground Truth: 该文本数据的类别标签,例如正面情绪或负面情绪
总结
- Query:用户的提问或需求。
- Ground Truth:标准答案,用于评估模型。
- Context:模型生成答案时参考的信息源。
三者共同构成监督学习或评估任务的基础框架,尤其在自然语言处理任务中至关重要。