Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本申请适用于人工智能技术领域,提供了一种智能玩具的对话意图识别方法,方法包括:获取目标儿童用户的语音数据;对语音数据进行声学与文本并行预处理,得到语音数据对应的文本语义特征与对应的声学情感特征;对文本语义特征以及声学情感特征进行特征融合处理...
  • 本申请适用于人工智能技术领域,提供了一种智能玩具的多模态控制方法,该方法包括:获取目标用户的输入数据;将输入数据转换为文本数据;基于文本数据,确定输入数据对应的实体结构数据以及实体关系数据;根据文本数据、实体结构以及实体关系数据,生成输入数...
  • 本申请涉及人机交互技术领域,公开了一种人机交互方法、装置、电子设备、存储介质及程序产品,该方法包括:获取司机的原始语音信号;根据司机的原始语音信号,确定目标语音文本的意图类别,目标语音文本为原始语音信号的识别结果;从目标语音文本中提取关键信...
  • 本发明涉及语音识别技术领域,具体涉及一种基于大数据的语音识别方法及系统,包括:采集目标区域内的各语音信号帧及其基频,获取各语音信号帧与阳平声调的第一匹配指数、与去声声调的第二匹配指数、与阴平声调的第三匹配指数、与上声声调的第四匹配指数,将所...
  • 本发明提供了一种融合音频与视频的语义识别方法和装置,语义识别方法包括:对音频信息进行特征提取,得到音频特征;对视频信息进行特征提取,得到唇部特征;对音频特征与唇部特征进行对齐并拼接,得到联合特征;对频谱特征图进行信噪比估计,得到信噪比,并依...
  • 本申请公开了一种基于大语言模型的动态噪声自适应语音识别方法、装置、设备及介质,涉及计算机技术领域。包括:对从原始语音信号中截取的短时子信号进行实时分析,以识别原始语音信号的噪声环境类型与信噪比水平;基于噪声环境类型与信噪比水平从多条预设信号...
  • 本申请适用于人工智能技术领域,提供了一种基于语义风险检测的智能玩具控制方法,包括:获取目标用户的语音数据,并对语音数据进行语音转文本处理,得到对应的目标文本数据;通过预设的语义风险检测模型对目标文本数据进行语义风险分析,输出目标文本数据对应...
  • 本发明提供一种基于知识图谱的母婴室语音识别辅助处理方法及系统,构建并优化轻量化母婴照料知识图谱;分阶段开发语音交互和视觉辅助,构建语音问答、授权验证、视觉指导、反馈优化流程;搭建占用状态监测与服务区联动机制,构建实时监测、多端反馈、智能调度...
  • 本说明书实施例公开了一种语音质量检测方法,该方法通过预设的语音活动检测算法,确定各帧的语音分类结果,以将所述音频数据划分语音段以及非语音段,并将非语音段中分类结果为语音数据的各帧音频,作为干扰帧进行剔除,之后所述语音段计算信噪比以确定质量检...
  • 本发明属于语音信号处理技术领域,具体提出一种基于非局部空间U‑Net和混合特征的说话人语音分割方法。本发明构建了非局部空间U‑Net网络,通过引入非局部空间注意力模块,有效捕获语音信号中的长程依赖关系,提升空间特征的表达能力;同时采用混合特...
  • 本申请公开了一种基于深度学习的谐音生成方法及终端,获取待转化语言的源语言文本,提取源语言文本的音素流;根据目标语言的语言规则切分音素流得到多个第一音节;获取目标语言对应的发音库,在发音库中匹配每一第一音节对应的第二音节,并获取第二音节对应的...
  • 本发明实施例公开了一种语音生成方法、装置和电子设备,通过大语言模型根据描述信息确定待转换文本,生成所述待转换文本对应的中间音素序列及该中间音素序列对应的中间语音信息,利用对抗分类器和互信息最小化解析所述中间语音信息,得到对应的情绪特征向量和...
  • 本发明涉及歌声合成和转换技术领域,特别涉及一种基于流匹配的歌声生成强化学习的优化方法及系统。本发明提供了一种基于流匹配的歌声生成强化学习的优化方法及系统。通过在模型后训练阶段引入强化学习机制,利用生成结果之间的相对评价信息,对音乐生成模型进...
  • 本申请公开了一种信息发送方法及相关装置,涉及信息处理技术领域,该方法包括:响应于触发采集第一信息的操作,录制环境声音信号,发送合成音频,合成音频是基于所述第一信息与音频纹理合成,因为音频纹理是基于环境声音信号抽象得到的,所以能够反映环境的非...
  • 本发明涉及人工智能与语音处理技术领域,特别涉及一种零样本歌声合成与编辑的方法及系统。所述方法包括以下步骤:构建模型架构、进行在线旋律学习与联合优化、旋律与内容对齐约束、弱标注时长建模、强化学习后训练、训练与推理。从而能够合成任意歌词与任何参...
  • 本申请提供了一种模型训练方法、装置、电子设备、计算机可读存储介质及计算机程序产品;方法包括:从原始音频数据中提取音频特征序列,基于原始音频数据和文本数据确定第一音素特征序列;基于音频特征序列对第一音素特征序列进行对齐,得到第二音素特征序列;...
  • 本申请涉及一种基于智能调度的多模型翻译与语音合成方法和装置。所述方法包括:获取待翻译语音、待翻译语音对应的任务信息和设备属性信息,并提取待翻译语音的语音特征和语法特征;根据任务信息、设备属性信息、语音特征和语法特征,确定各处理阶段的目标模型...
  • 本发明公开了一种文本转语音模型训练方法、装置、计算机设备及存储介质,该方法包括:获取训练数据集,训练数据集包括遗忘子集和保留子集,其中遗忘子集包含目标说话人的语音样本,保留子集包含非目标说话人的语音样本;将预训练的原始模型的参数作为预设的遗...
  • 本发明涉及语音合成技术领域,具体涉及一种基于多模态情感特征融合的自适应语音合成方法。该方法先获取目标文本序列与初始参考情感音频信号,经预处理得到目标音素序列和目标参考情感音频信号;通过基于旋转位置编码的Transformer文本编码器提取目...
  • 本发明涉及语音合成技术领域,特别涉及一种描述引导的零样本语音合成方法及系统。本发明基于条件流匹配与扩散Transformer进行零样本语音合成,通过文本描述构建目标声学画像,精准引导语音采样过程,实现在无特定说话人数据微调下的高保真语音生成...
技术分类