Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及音乐源分离技术领域,特别涉及一种基于声部结构感知的音乐伴奏分离方法及系统。本发明提供了一种基于声部结构感知的音乐伴奏分离方法及系统,在分离音乐伴奏的同时,引入声部结构感知机制,对音乐中不同声部之间的结构关系进行建模,从而获得更加干...
  • 本发明公开了一种基于视听特征融合的多模态语音分离方法及其系统,方法包括:语音和视频采集步骤;语音短时傅里叶变换步骤;采用短时傅里叶变换,将所述混合语音的时域信号转换为复数谱;面部视频处理步骤;使用人脸识别模型预处理所述面部视频,提取单个说话...
  • 本申请公开了一种音频分离方法、系统和相关装置,该方法包括:获取混合音频,确定混合音频对应的混合频域信号;其中,混合音频中包括不同目标对象的目标音频;基于所述混合频域信号对应的频率分布信息,得到所述混合频域信号对应的频率分布特征;结合时间维度...
  • 本申请提供一种音频处理方法、装置、设备及存储介质,音频处理方法包括:获取待处理的预设音频信号;预设音频信号包括第一音频信号以及第二音频信号,第一音频信号与第二音频信号不同;对第一音频信号以及第二音频信号进行回声返回损耗估计,得到对应的回声返...
  • 本申请涉及音频信号处理技术领域,提供一种回声消除方法、装置、音频设备及存储介质,该方法包括:获取目标角度范围内不同角度对应的波束信号;从波束信号中选取第一候选波束信号,第一候选波束信号与音频输入器件的输入信号的相关性大于第一预设阈值;从第一...
  • 本发明提供一种数据增强方法、装置、电子设备、存储介质及程序产品,涉及数据处理技术领域,该方法包括:获取待加强的初始数据;从多个环境噪声数据匹配所述初始数据对应的第一环境噪声数据;将所述第一环境噪声数据和所述初始数据进行能量对齐;基于能量对齐...
  • 本申请提供了一种基于知识蒸馏的远距离语音增强方法、系统、介质及终端,方法包括:获取并预处理目标语音信号和超声回波信号,得到带噪语音特征和超声唇动特征;将带噪语音特征和超声唇动特征输入至学生模型和预训练的教师模型;学生模型和教师模型分别输出增...
  • 本发明公开了一种基于门控重标定与路由加权的语音重建方法及系统,在神经声码器模型的编码端引入组内通道门控重标定模块,通过通道分组与门控机制对编码特征进行自适应重标定,提升特征表达的有效性与量化效率。同时,在神经声码器模型训练阶段引入路由网络,...
  • 一种基于特征解耦与掩蔽重建的流匹配歌声美化方法,本发明目的是解决现有歌声美化方法在综合表现力欠缺、训练依赖成对数据、个性化演唱风格丢失等方面的不足,具体过程为:提取歌声音频的梅尔频谱图并进行预处理;从原始音频波形和梅尔频谱图中解耦提取出音色...
  • 本发明涉及语义通信与智能资源管理技术领域,提供了一种基于轻量化Swin Transformer的资源自适应语义压缩方法。该方法包括:使用Swin Transformer构建语义编码器,引入门控网络以动态调整语义编码器的深度,为不同算力的终端...
  • 本发明涉及音频数据处理技术领域,具体是声音克隆方法、系统、电子设备及介质,包括对输入的参考语音形成稳定音色锚片段库;对目标文本进行前端处理,对各锚片段加权后叠加至该窗口的基础说话人条件向量,形成增强说话人条件向量,并基于增强说话人条件向量合...
  • 本发明提供一种语音编码方法、装置、电子设备及计算机存储介质,在接收语音数据后,利用神经网络语音编码模型针对不同情况,融合预训练特征编码器输出的编码后的语义特征、视频编码器输出的视频特征和现语音编码器输出的编码特征,生成语音编码结果;有效提升...
  • 本发明公开了一种多功能高清音频解码设备及音频系统,该设备通过在机壳内集成用户交互模块、数据扩展模块、音频处理模块、耳机放大模块、电源管理模块和音频输出接口,从而实现高清解码、接口扩展和MAC开机的功能,简化了桌面布线,解决了MAC用户开机不...
  • 本发明公开了一种基于动态特征混淆与解耦注意力的说话人身份认证方法,首先提取原始语音信号的特征生成原始特征图F;生成动态混淆掩码M,并与F进行逐元素融合,得到混淆特征图F′;将混淆特征图F′或原始特征图F输入深度神经网络编码器,提取高维说话人...
  • 本发明公开了一种基于声纹识别的触摸屏语音唤醒系统,涉及语音数据处理技术领域,包括智能控制终端用于控制各个模块之间进行数据传输和信息交互。本发明通过对用户提前输入的唤醒语音数据进行各项计算,确定独属于用户唤醒语音数据的声道形状、声学结构特征以...
  • 本发明公开了一种用于多语种语音识别模型构建的方法,涉及计算机技术领域,本发明通过口语分支与歌词分支并行生成候选文本,并在同一口语语言模型下对窗内候选进行对照式流畅度评估,利用门控判定将更符合歌词生成规律的时间窗标记为抑制区间,从而在输出端避...
  • 本申请公开了一种语音识别方法、装置、设备、存储介质及程序产品,涉及语音识别技术领域,包括:确定语音数据对应的第一语音识别结果;确定唇部视频数据对应的第二语音识别结果;根据待语音识别对象对应的环境噪声、环境光照、头部运动矢量及唇部可见度中的至...
  • 本发明涉及语音识别与音频信号处理技术领域,特别涉及一种具备自适应门限调节能力的超低功耗语音唤醒系统,包括输入声音处理模块与能量趋势检测模块监听并接收来自麦克风的音频信号x(t),输出包络信号En(t);自适应控制模块根据包络信号En(t)对...
  • 本发明提供一种语音识别方法及装置。所述方法包括:获取原始语音数据;对所述原始语音数据进行信号预处理,得到预处理语音数据;根据所述预处理语音数据,得到目标特征数据;所述目标特征数据包括短时能量和短时零交叉率;根据预设提取条件和所述目标特征数据...
  • 本申请实施例提供一种音频内容识别方法、装置、电子设备、存储介质及程序产品,包括:获取待处理的音频数据,并对待处理的音频数据进行特征处理,得到音频的声学特征;将音频的声学特征与文本特征进行耦合,得到耦合特征;对耦合特征进行有序性判断,得到文本...
技术分类