Document
拖动滑块完成拼图
个人中心

预订订单
商城订单
发布专利 发布成果 人才入驻 发布商标 发布需求

请提出您的宝贵建议,有机会获取IP积分或其他奖励

投诉建议

在线咨询

联系我们

龙图腾公众号
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 焦点科技股份有限公司贾馥玮获国家专利权

焦点科技股份有限公司贾馥玮获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网获悉焦点科技股份有限公司申请的专利一种基于视频文本合并、过滤与分类的字幕提取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116634223B

龙图腾网通过国家知识产权局官网在2026-05-05发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310579487.2,技术领域涉及:H04N21/44;该发明授权一种基于视频文本合并、过滤与分类的字幕提取方法是由贾馥玮;房鹏展设计研发完成,并于2023-05-22向国家知识产权局提交的专利申请。

一种基于视频文本合并、过滤与分类的字幕提取方法在说明书摘要公布了:本发明公开了一种基于视频文本合并、过滤与分类的字幕提取方法,包括对视频抽帧,使用光学字符识别所有视频帧内的文本,获得视频内文本框集合;根据文本内容、文本框坐标、文本出现时间等对视频内文本框集合进行合并和过滤;利用基于机器学习的字幕分类模型预测过滤后的每个文本框是否为字幕,将判断为字幕类别的文本及其位置信息保存,作为此视频的字幕信息。本发明的方法通过合并和过滤文本框,可初步过滤大部分不属于字幕类型的文本,通过构建机器学习字幕分类模型,可进一步地确定文本框类型。此方法无需规定字幕区域,能够应对现有互联网视频字幕位置多变的问题。

本发明授权一种基于视频文本合并、过滤与分类的字幕提取方法在权利要求书中公布了:1.一种基于视频文本合并、过滤与分类的字幕提取方法,其特征在于,包括以下步骤: 步骤1,从视频中以预设的时间间隔抽帧,对帧图像进行文本检测与识别,包括使用光学字符识别技术检测所有帧图像内的文本,用以构成文本框,并根据文本框信息和视频时间轴信息,统计多维特征,所述多维特征包括每个文本框的文本内容、顶点坐标和出现时间,用以获得第一文本框集合; 步骤2,对于第一文本框集合内的文本框,利用各文本框在单帧图像内以及多个连续帧图像间的文本框信息,执行文本合并,获得第二文本框集合,更新合并后的文本框的顶点坐标,以被合并的文本框的出现时间生成持续时间列表;其中,针对单个视频内所有帧的文本框,计算相邻帧的文本相似度及文本框交并比,将满足预设交并比阈值的文本框进行合并; 步骤3,对于第二文本框集合内的文本框,使用文本框的多维特征,根据预设条件对文本框进行过滤,所述过滤包括: 根据持续时间的列表,将持续时间超过预设持续阈值的文字框从第二文本框集合中删除; 根据顶点坐标的最大偏移信息,将超过预设偏移阈值的文字框从第二文本框集合中删除; 根据文本框的顶点坐标,计算文本框的倾斜角度,将倾斜角度大于预设倾斜阈值的文本框从第二文本框集合中删除; 预设字符数量阈值,将不满足字符数量阈值的文本框从第二文本框集合中删除; 步骤4,对过滤后的第二文本框集合内的文本框的多维特征,基于文本框的时域、空域信息提取每个文本框的特征向量,用于机器学习算法的训练; 包括确定每个文本框的分类特征: 计算第二文本框集合内所有文本框中单个字符的持续时间中位数; 计算每个文本框的单个字符持续时间与持续时间中位数的绝对值,作为特征一; 利用第二文本框集合内所有文本框的字符高度计算中位数,根据视频像素高度对此中位数进行归一化; 计算每个文本框的字符高度与所有文本框的字符高度中位数的绝对值,作为特征二; 根据文本框坐标位置及持续时间计算文本区域热力图,根据热力图得到每个文本框所在区域的热力平均值,计算第二文本框集合内所有文本框热力平均值的中位数; 计算每个文本框的热力平均值与整个视频的热力平均值中位数的绝对值,作为特征三; 将上述特征一、特征二和特征三组合成每个文本框的特征向量; 步骤5,将第二文本框集合的特征向量输入基于机器学习的字幕分类模型,用于训练判定文本框集合是否为字幕; 步骤6,将被判定为字幕的文本框集合作为第三文本框集合,将第三文本框集合设置为视频的字幕信息。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人焦点科技股份有限公司,其通讯地址为:210032 江苏省南京市江北新区丽景路7号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

以上内容由龙图腾AI智能生成。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。