Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 中国农业大学马浚诚获国家专利权

中国农业大学马浚诚获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉中国农业大学申请的专利基于多模态音频表征与融合的畜禽异常声音识别方法、装置、介质及设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN120727034B

龙图腾网通过国家知识产权局官网在2026-04-24发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202510993308.9,技术领域涉及:G10L25/51;该发明授权基于多模态音频表征与融合的畜禽异常声音识别方法、装置、介质及设备是由马浚诚;孟彦伯;王朝元设计研发完成,并于2025-07-18向国家知识产权局提交的专利申请。

基于多模态音频表征与融合的畜禽异常声音识别方法、装置、介质及设备在说明书摘要公布了:本发明公开的一种基于多模态音频表征与融合的畜禽异常声音识别方法、装置、介质及设备,包括:收集畜禽的音频信号;将畜禽的音频信号输入到多模态音频特征提取模块中提取音频的时序模态特征和频谱模态特征;将提取的时序模态特征和频谱图模态特征输入到跨模态音频特征提取模块中进行特征融合,最后由分类器对畜禽的音频进行预测,完成畜禽异常声音识别。因此,本发明显著提升实际生产环境中畜禽咳嗽声识别准确率,具有更高的实际工程应用价值。

本发明授权基于多模态音频表征与融合的畜禽异常声音识别方法、装置、介质及设备在权利要求书中公布了:1.一种基于多模态音频表征与融合的畜禽异常声音识别方法,其特征在于,包括: 收集畜禽的音频信号; 将畜禽的音频信号输入到多模态音频特征提取模块中提取音频的时序模态特征和频谱模态特征;其中,多模态音频特征提取模块包括时序模态编码器和频谱图模态编码器,其中,时序模态编码器和频谱图模态编码器的训练过程,包括: 收集畜禽声音,构建语料库; 基于语料库,构建预训练数据集; 将预训练数据集输入多模态音频表示与融合框架的多模态音频特征提取模块中,首先将预训练数据集进行单一样本数据的随机裁剪,使得一个样本变为两个样本,两个样本之间存在重叠,并将随机裁剪后的两个样本分别送入到时序模态模编码器和频谱图模态编码器进行特征学习和提取,其中,时序模态模编码器使用Transformer编码器对音频波形的特征进行学习;频谱图模态编码器使用SeResNet18对频谱图的空间特征进行提取,通过这两个表征对模型损失值进行计算;时序模态编码器首先使用卷积采样层的卷积核大小为17,步幅为6,经过归一化和ReLU激活函数,再送入到Transformer编码器中,后面包含三个层的MLP,其中两个隐藏线性层的维度为512,每一层后跟一个归一化层和ReLU激活函数,第三层是线性输出层维度为2048,后跟一个归一化层,输出为一个2048维的特征;频谱图模态编码器首先使用SeResNet18模型,包含三个层的MLP,其中两个隐藏线性层的维度为512,每一层后跟一个归一化层和ReLU激活函数,第三层是线性输出层维度为2048,后跟一个归一化层,三个层的MLP以及归一化层与时序模态编码器结构一致且共享权重,输出为一个2048维的特征; 将提取的时序模态特征和频谱图模态特征输入到跨模态音频特征提取模块中进行特征融合,最后由分类器对畜禽的音频进行预测,完成畜禽异常声音识别。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国农业大学,其通讯地址为:100193 北京市海淀区圆明园西路2号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。