齐鲁工业大学(山东省科学院);山东省计算中心(国家超级计算济南中心)王英龙获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉齐鲁工业大学(山东省科学院);山东省计算中心(国家超级计算济南中心)申请的专利一种基于FocusedRAG的可信学术问答方法和装置获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN121834025B 。
龙图腾网通过国家知识产权局官网在2026-05-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202610303427.1,技术领域涉及:G06F16/93;该发明授权一种基于FocusedRAG的可信学术问答方法和装置是由王英龙;于瑞;王天一;刘瑞霞设计研发完成,并于2026-03-13向国家知识产权局提交的专利申请。
本一种基于FocusedRAG的可信学术问答方法和装置在说明书摘要公布了:本发明公开了一种基于FocusedRAG的可信学术问答方法和装置,属于人工智能、信息检索领域。步骤包括:从公开数据源下载学术论文数据作为原始数据集;对原始数据集中的文档内容沿章节边界进行分割,利用大语言模型对用户查询进行重写明确检索意图;设计查询自适应信噪分离机制筛选出与查询相关的章节作为检索空间;在选定章节内,扩展查询自适应信噪分离机制获取句级信噪分界阈值,然后设计句子选择机制获取候选证据区间,基于候选证据区间的累积相关性得分进行排序,最后在检索token预算约束下对候选证据区间进行贪心选择形成检索上下文;将检索上下文与用户查询输入大语言模型生成最终答案。本发明能够建立精确的归因基础,显著提升问答的准确性和可信度。
本发明授权一种基于FocusedRAG的可信学术问答方法和装置在权利要求书中公布了:1.一种基于FocusedRAG的可信学术问答方法,其特征在于,包括以下步骤: S1.数据获取:从公开数据源获取学术论文数据作为原始数据集; S2.预处理:对原始数据集中的文档内容沿章节边界进行分割,同时利用大语言模型对用户查询进行重写得到重写后查询; S3.检索空间压缩:构建查询自适应信噪分离机制,基于重写后查询筛选出与查询相关的章节作为检索空间,具体步骤如下: S31.将重写后查询与目标对象输入到预训练意图识别模型中,得到目标对象与重写后查询的意图相关性分数,聚合所有目标对象与重写后查询的意图相关性分数,得到意图相关性分布; S32.将意图相关性分布按降序排列,然后基于每个候选分界位置,依次将目标对象划分为信号类和噪声类,并计算每一种划分的类间方差; S33.通过寻找最大的类间方差识别最优分界位置,基于最优分界位置与的意图相关性分数计算平均意图相关性分数作为目标对象意图相关性分数的最优分界阈值; S34.将意图相关性分数高于最优分界阈值的章节作为信号章节用于后续句子选择; S4.证据区间筛选:在检索空间内,扩展查询自适应信噪分离机制,获取句级信噪分界阈值,通过相关性密度引导的句子选择机制,从检索空间中获取候选证据区间,基于候选证据区间的累积相关性得分进行排序,在检索token预算约束下对候选证据区间进行择优选择,形成检索上下文; 所述扩展查询自适应信噪分离机制具体包括: S411.将重写后查询与信号章节中的所有句子输入到查询自适应信噪分离机制中,使用预训练意图识别模型计算重写后查询与每个句子的意图相关性分数,得到句子级意图相关性分布; S412.对句子级意图相关性分布进行高斯平滑处理得到平滑后的意图相关性分布; S413.对平滑后的意图相关性分布复用S32、S33和S34的操作得到句子级最优分界阈值; 相关性密度引导的句子选择机制具体包括: S421.计算意图相关性盈余: 对于信号章节中的句子的平滑后的意图相关性分数,计算其相对于句子级最优分界阈值的意图相关性盈余; S422.构建候选证据区间集合: 对于每个满足意图相关性盈余大于零的起始位置,通过最大子数组原理识别使累积盈余最大的终止位置,收集所有累积盈余为正的区间,构成候选区间集合;对每个信号章节分别进行拓扑过滤,聚合所有信号章节的过滤结果,形成候选证据区间集合; S423.构建检索上下文: 按候选证据区间集合中每个区间的累积相关性降序排列,得到优先序列,然后对优先序列执行贪心选择得到最终检索上下文; S5.答案生成:将检索上下文与用户查询一并输入大语言模型,大语言模型生成针对用户查询的学术问答答案。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人齐鲁工业大学(山东省科学院);山东省计算中心(国家超级计算济南中心),其通讯地址为:250000 山东省济南市长清区大学路3501号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励