重庆理工大学肖汉光获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉重庆理工大学申请的专利一种图像语义分割模型及分割方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116468740B 。
龙图腾网通过国家知识产权局官网在2026-05-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310463484.2,技术领域涉及:G06T7/11;该发明授权一种图像语义分割模型及分割方法是由肖汉光;时心怡;宋旺旺;薛旭枫;曹刘洋;李玉麟设计研发完成,并于2023-04-26向国家知识产权局提交的专利申请。
本一种图像语义分割模型及分割方法在说明书摘要公布了:本发明公开了一种图像语义分割模型,由设计的混合的注意力聚焦方法与注意力矫正残差模块ARRM、混合特征整合模块MFFM构成,整体采用深度监督方式训练,合理加入可变形卷积,结合构建的多尺度空间注意力模块MSP与双池化注意力模块DPA进行联合优化,解决了小目标特征分割难的问题。为了体现模型在下游任务上的优异表现,采用迁移学习的方式完成了在不同数据集之间的训练,扩大了模型的适用范围。最后,在骨干网络中加入分组卷积大大减少了计算成本,合理的网络深度与内部模块设计在保证分割效果的前提下解决了分割模型训练成本高的问题。
本发明授权一种图像语义分割模型及分割方法在权利要求书中公布了:1.一种图像语义分割方法,其特征在于:包括以下步骤: a选取与待处理图片具有相同特征的图片数据集进行批量化数据预处理,根据分割目标设置对应的窗宽窗位,再将图片数据转换成PNG格式的图片数据; b将步骤a中得到的图片数据集进行无交叉划分为训练集、验证集和测试集; c对训练集中的图片数据进行数据增强,包括随机旋转、随机水平翻转和随机垂直翻转; d设计用于提高模型分割精度的损失函数,损失函数采用DiceLoss和BCELoss的混合损失,其中α和β分别为DiceLoss和BCELoss的权重超参数,两者相加和为1,DiceLoss的损失表达式为: 13 BCELoss的损失表达式为: 14 DiceLoss和BCELoss的混合损失表达式为: 15 N表示像素点总数,C表示类别总数,表示二进制的GroundTruth中第c类,第i个像素对应类别值,表示对应类别的预测概率值;表示平滑指数且等于; e获取图像语义分割模型,包括特征提取模块、特征融合模块和深度监督训练模块; 特征提取模块由六层STDC骨干卷积层组成,包括阶段1至阶段6,每一阶段都包括多个基本模块和不同的注意力模块以及尺寸不同的跳连,最后2个阶段还结合注意力矫正残差ARRM模块进行特征注意力矫正筛选;对于低层特征,使用多尺度空间注意力机制MSP模块,通过三个不同的池化层提取空间信息;对于高层特征,使用通道注意力机制,实现对语义信息的针对性筛选,通过不同尺寸的跳连实现特征保留,从而优化结果; 特征融合模块将阶段3特征和整合后的阶段5特征输入混合特征整合MFFM模块进行融合,实现高层语义信息和低层空间信息的提取与结合,提高分割性能,在混合特征整合MFFM模块中引入了可变形卷积,可变形卷积在普通卷积后微调像素点的方向,实现卷积核的自适应扩张; 深度监督训练模块采用三个层级的特征进行上采样,即阶段5特征、经过重塑的阶段6特征以及通过混合特征整合MFFM模块融合的阶段3特征和阶段5特征,将这三个特征作为分割头的输入,并采用加权平均的方式获得最终的输出结果; MSP模块用于将输入特征分别在通道维度上做AvgPooling,Strip-Pooling和MaxPooling,通过三条池化路径获得分割目标在空间维度上丰富的特征信息;然后将通过三条池化路径获得结果在通道上堆叠,再通过卷积调整通道数为1,使用sigmoid激活函数进行归一化得到空间注意力权重,最后将空间注意力权重与原特征矩阵点乘,MSP模块的计算如下: 1 2 其中表示Sigmoid激活函数;Concat表示通道拼接操作;Finput表示输入的原始特征图; 注意力矫正残差ARRM模块包括一个DoublePooling-Attention模块和残差跳连,先将输入特征图通过一个3×3卷积降维,经过两个并联的MaxPooling和AvgPooling后,再经过一个共享MLP层将通道压缩和扩张,最后将两个输出结果进行逐元素相加,通过BN层和sigmoid激活函数后得到相应的注意力矫正权重矩阵,经过与原特征矩阵点乘后再与原特征矩阵跳连,得到输出结果,注意力矫正残差ARRM模块的计算如下: 3 4 5 6 7 其中表示输入的原始特征图,表示经过卷积调整通道数后的新特征,MaxPool和AvgPool分别表示最大池化和平均池化操作,MLP表示共享的多层感知机,BN表示批量归一化,RELU和表示不同的激活函数,和分别表示逐元素求和、点乘;DPA为双池化注意力模块;FMaxPool表示经过最大池化操作后得到的特征图;FAvgPool表示经过平均池化操作后得到的特征图,混合特征整合MFFM模块包括含有MSP模块与SE模块的混合注意力机制和可变形卷积,输入端由低层级特征和高层语义特征组成;低层特征处理时需要将输入的低层级特征通过MSP模块;高层信息处理时通过一个SE模块;两个路径的特征经过注意力筛选后,分别通过一个可变形卷积进行自适应感受野的调整,以优化边界特征的提取,之后进行通道拼接,拼接后的特征通过1x1卷积块增加非线性能力,之后与处理过的高层特征再拼接一次,加强语义指导,然后将拼接后的特征矩阵再使用一个可变形卷积进行特征提取,最后与经过MSP模块筛选的低层特征进行加和后输出,混合特征整合MFFM模块的计算如下: 8 9 10 11 12 DConv表示为可变形卷积操作,UpS为上采样操作,MSP为MSP模块,SE为压缩和激励操作,和分别为输入混合特征整合MFFM模块的低层、高层特征图,和分别表示为经过混合注意力机制筛选后的低层、高层特征;和为两次不同尺度特征融合后的结果;为最后的输出特征图; f基于损失函数对图像语义分割模型进行训练,利用神经网络在训练过程中梯度反向传播来更新模型权重,根据图像语义分割模型训练后在验证集上的分割效果来判断模型超参数设置是否更优,更新保存的模型权重,最后模型训练完毕,在测试集上进行图像语义分割效果的评估;在图像语义分割模型训练过程中,将深度监督训练模块输出的多个预测特征图像通过公式15处理后再进行均值化操作,得到总损失表达式为: 16 图像语义分割模型训练完成后,即可对待处理的图片数据进行语义分割。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人重庆理工大学,其通讯地址为:400054 重庆市巴南区李家沱红光大道69号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
以上内容由龙图腾AI智能生成。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

皖公网安备 34010402703815号
请提出您的宝贵建议,有机会获取IP积分或其他奖励