江西理工大学廖列法获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉江西理工大学申请的专利一种文本聚类模型的训练方法及基于此的文本聚类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116401565B 。
龙图腾网通过国家知识产权局官网在2026-05-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310379154.5,技术领域涉及:G06F18/23;该发明授权一种文本聚类模型的训练方法及基于此的文本聚类方法是由廖列法;姚秀设计研发完成,并于2023-04-11向国家知识产权局提交的专利申请。
本一种文本聚类模型的训练方法及基于此的文本聚类方法在说明书摘要公布了:本发明提供一种文本聚类模型的训练方法,所述方法包括:S1、获取训练集、初始模型,所述初始模型包括预训练的BERT模型、预训练的深度编码模型以及聚类模块,其中,所述训练集包括多个类别的文本数据,所述预训练的深度编码模型包括编码器、隐含层和解码器;S2、采用步骤S1得到的训练集多次迭代训练由步骤S1中获得的初始模型至收敛,其中,收敛后的初始模型中的预训练的BERT模型、预训练的深度编码模型中的编码器、聚类模块组成最终的文本聚类模型。本发明解决传统深度聚类方法的嵌入与聚类的分离问题,并且其提高了的文本聚类模型的聚类效果。
本发明授权一种文本聚类模型的训练方法及基于此的文本聚类方法在权利要求书中公布了:1.一种文本聚类模型的训练方法,其特征在于,所述方法包括: S1、获取训练集、初始模型,所述初始模型包括预训练的BERT模型、预训练的深度编码模型以及聚类模块,其中,所述训练集包括多个类别的文本数据,所述预训练的深度编码模型包括编码器、隐含层和解码器; S2、采用步骤S1得到的训练集多次迭代训练由步骤S1中获得的的初始模型至收敛,其中,收敛后的初始模型中的预训练的BERT模型、预训练的深度编码模型中的编码器、聚类模块组成文本聚类模型至收敛,已获得最终的文本聚类模型;所述聚类模块由单隐含层和具有自编码器性质的聚类子模块构成并采用以下规则的似然函数: 其中,为深度编码模型的重建损失,为所有的输入向量数,表示第i个输入向量,表示第i个输入向量重建后的向量,表示稀疏化,防止聚类质心偏离,表示后验概率,表示稀疏化模型的各参数,是经过公式变换组合而成的一项式子,其中与是一样的含义,即第i个数据点来自第l个簇的概率,与表示一样的含义,即第l个簇类的中心向量,表示第k个簇类中心向量的转置向量,为文本聚类最终产生的簇类数,表示利用狄利克雷先验来有效平衡簇类的分配,是第k个簇类的狄利克雷先验参数,对𝛾k取对数以此来平衡计算结果,表示k个簇的平均吸引度,K表示文本聚类最终产生的簇类数,k表示聚类产生的第k个簇类。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人江西理工大学,其通讯地址为:341000 江西省赣州市红旗大道86号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励