Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 一种基于特征解耦与掩蔽重建的流匹配歌声美化方法,本发明目的是解决现有歌声美化方法在综合表现力欠缺、训练依赖成对数据、个性化演唱风格丢失等方面的不足,具体过程为:提取歌声音频的梅尔频谱图并进行预处理;从原始音频波形和梅尔频谱图中解耦提取出音色...
  • 本发明涉及语义通信与智能资源管理技术领域,提供了一种基于轻量化Swin Transformer的资源自适应语义压缩方法。该方法包括:使用Swin Transformer构建语义编码器,引入门控网络以动态调整语义编码器的深度,为不同算力的终端...
  • 本发明涉及音频数据处理技术领域,具体是声音克隆方法、系统、电子设备及介质,包括对输入的参考语音形成稳定音色锚片段库;对目标文本进行前端处理,对各锚片段加权后叠加至该窗口的基础说话人条件向量,形成增强说话人条件向量,并基于增强说话人条件向量合...
  • 本发明提供一种语音编码方法、装置、电子设备及计算机存储介质,在接收语音数据后,利用神经网络语音编码模型针对不同情况,融合预训练特征编码器输出的编码后的语义特征、视频编码器输出的视频特征和现语音编码器输出的编码特征,生成语音编码结果;有效提升...
  • 本发明公开了一种多功能高清音频解码设备及音频系统,该设备通过在机壳内集成用户交互模块、数据扩展模块、音频处理模块、耳机放大模块、电源管理模块和音频输出接口,从而实现高清解码、接口扩展和MAC开机的功能,简化了桌面布线,解决了MAC用户开机不...
  • 本发明公开了一种基于动态特征混淆与解耦注意力的说话人身份认证方法,首先提取原始语音信号的特征生成原始特征图F;生成动态混淆掩码M,并与F进行逐元素融合,得到混淆特征图F′;将混淆特征图F′或原始特征图F输入深度神经网络编码器,提取高维说话人...
  • 本发明公开了一种基于声纹识别的触摸屏语音唤醒系统,涉及语音数据处理技术领域,包括智能控制终端用于控制各个模块之间进行数据传输和信息交互。本发明通过对用户提前输入的唤醒语音数据进行各项计算,确定独属于用户唤醒语音数据的声道形状、声学结构特征以...
  • 本发明公开了一种用于多语种语音识别模型构建的方法,涉及计算机技术领域,本发明通过口语分支与歌词分支并行生成候选文本,并在同一口语语言模型下对窗内候选进行对照式流畅度评估,利用门控判定将更符合歌词生成规律的时间窗标记为抑制区间,从而在输出端避...
  • 本申请公开了一种语音识别方法、装置、设备、存储介质及程序产品,涉及语音识别技术领域,包括:确定语音数据对应的第一语音识别结果;确定唇部视频数据对应的第二语音识别结果;根据待语音识别对象对应的环境噪声、环境光照、头部运动矢量及唇部可见度中的至...
  • 本发明涉及语音识别与音频信号处理技术领域,特别涉及一种具备自适应门限调节能力的超低功耗语音唤醒系统,包括输入声音处理模块与能量趋势检测模块监听并接收来自麦克风的音频信号x(t),输出包络信号En(t);自适应控制模块根据包络信号En(t)对...
  • 本发明提供一种语音识别方法及装置。所述方法包括:获取原始语音数据;对所述原始语音数据进行信号预处理,得到预处理语音数据;根据所述预处理语音数据,得到目标特征数据;所述目标特征数据包括短时能量和短时零交叉率;根据预设提取条件和所述目标特征数据...
  • 本申请实施例提供一种音频内容识别方法、装置、电子设备、存储介质及程序产品,包括:获取待处理的音频数据,并对待处理的音频数据进行特征处理,得到音频的声学特征;将音频的声学特征与文本特征进行耦合,得到耦合特征;对耦合特征进行有序性判断,得到文本...
  • 本发明公开了一种基于语音交互的支气管影像数据自动采集存储方法及系统,涉及智能语音交互技术领域。通过采集操作者语音信号,将语音信号输入预训练语音识别模型,生成文本序列;对文本序列进行分词和关键词提取,得到指令关键词;将指令关键词与预设指令模板...
  • 本发明公开了基于多模态分析的医患沟通共情语言训练评分系统及方法,涉及人工智能与医疗信息化领域。包括:数据采集模块采集医患语音信号,经由数据预处理与时间对齐模块得到医生语音文本数据及时间序列基础参数;共情语言语义特征提取模块解析文本生成共情语...
  • 本发明公开了基于异步处理和消息队列的语音文本双向转换系统及方法,系统包括服务器、OBS对象存储服务、业务系统、转换网关和多个通用网关;所述转换网关与所述服务器连接,内部配置语音转文字模块和文字转语音模块,其中:语音转文字模块基于FunASR...
  • 本说明书实施例提供了语音编辑处理方法及装置,其中,一种语音编辑处理方法包括:在进行语音编辑处理的过程中,基于用户在应用程序的交互组件输入的对话语音的语音文本,首先获取用户针对语音文本的交互动作数据,并根据交互动作数据和交互环境数据检测是否存...
  • 本发明公开一种面向集群通信的智能语音识别与调度台融合的方法及设备,属于专业无线通信与智能语音识别交叉领域。针对传统集群通信调度依赖人工、通用ASR技术在专业调度场景适配不足的问题,方案通过语音采集模块获取用户语音指令,经ASR语音识别模块转...
  • 本申请公开了一种基于多核异构的语音控制方法、系统、存储介质及芯片,属于芯片技术领域。语音处理单元将用户的语音信号转换成文本指令后发送给语义推理单元;语义推理单元利用语义处理模型对文本指令进行语义推理后生成控制指令,根据控制指令生成第一校验信...
  • 本发明属于语音识别与处理技术领域,涉及一种基于语义压缩与动态优先级的全屋智能语音控制方法,基于大语言模型解析用户语音指令,获得控制意图、目标设备及调节参数;分析控制意图与调节参数确定指令优先级;对控制意图和调节参数编码生成压缩码;当全屋网络...
  • 本发明涉及机器人技术领域,具体涉及一种智能语音交互式饮水安全咨询机器人系统,包括:语音交互模块,用于获取用户的语音数据和环境感知数据;需求识别模块,用于根据语音数据和环境感知数据,识别与当前情景相关联的用户饮水安全需求;语音咨询模块,用于通...
技术分类