Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及人工智能与语音处理技术领域,特别涉及一种零样本歌声合成与编辑的方法及系统。所述方法包括以下步骤:构建模型架构、进行在线旋律学习与联合优化、旋律与内容对齐约束、弱标注时长建模、强化学习后训练、训练与推理。从而能够合成任意歌词与任何参...
  • 本申请公开了一种信息发送方法及相关装置,涉及信息处理技术领域,该方法包括:响应于触发采集第一信息的操作,录制环境声音信号,发送合成音频,合成音频是基于所述第一信息与音频纹理合成,因为音频纹理是基于环境声音信号抽象得到的,所以能够反映环境的非...
  • 本发明涉及歌声合成和转换技术领域,特别涉及一种基于流匹配的歌声生成强化学习的优化方法及系统。本发明提供了一种基于流匹配的歌声生成强化学习的优化方法及系统。通过在模型后训练阶段引入强化学习机制,利用生成结果之间的相对评价信息,对音乐生成模型进...
  • 本发明实施例公开了一种语音生成方法、装置和电子设备,通过大语言模型根据描述信息确定待转换文本,生成所述待转换文本对应的中间音素序列及该中间音素序列对应的中间语音信息,利用对抗分类器和互信息最小化解析所述中间语音信息,得到对应的情绪特征向量和...
  • 本申请公开了一种基于深度学习的谐音生成方法及终端,获取待转化语言的源语言文本,提取源语言文本的音素流;根据目标语言的语言规则切分音素流得到多个第一音节;获取目标语言对应的发音库,在发音库中匹配每一第一音节对应的第二音节,并获取第二音节对应的...
  • 本发明属于语音信号处理技术领域,具体提出一种基于非局部空间U‑Net和混合特征的说话人语音分割方法。本发明构建了非局部空间U‑Net网络,通过引入非局部空间注意力模块,有效捕获语音信号中的长程依赖关系,提升空间特征的表达能力;同时采用混合特...
  • 本说明书实施例公开了一种语音质量检测方法,该方法通过预设的语音活动检测算法,确定各帧的语音分类结果,以将所述音频数据划分语音段以及非语音段,并将非语音段中分类结果为语音数据的各帧音频,作为干扰帧进行剔除,之后所述语音段计算信噪比以确定质量检...
  • 本发明提供一种基于知识图谱的母婴室语音识别辅助处理方法及系统,构建并优化轻量化母婴照料知识图谱;分阶段开发语音交互和视觉辅助,构建语音问答、授权验证、视觉指导、反馈优化流程;搭建占用状态监测与服务区联动机制,构建实时监测、多端反馈、智能调度...
  • 本申请适用于人工智能技术领域,提供了一种基于语义风险检测的智能玩具控制方法,包括:获取目标用户的语音数据,并对语音数据进行语音转文本处理,得到对应的目标文本数据;通过预设的语义风险检测模型对目标文本数据进行语义风险分析,输出目标文本数据对应...
  • 本申请公开了一种基于大语言模型的动态噪声自适应语音识别方法、装置、设备及介质,涉及计算机技术领域。包括:对从原始语音信号中截取的短时子信号进行实时分析,以识别原始语音信号的噪声环境类型与信噪比水平;基于噪声环境类型与信噪比水平从多条预设信号...
  • 本发明提供了一种融合音频与视频的语义识别方法和装置,语义识别方法包括:对音频信息进行特征提取,得到音频特征;对视频信息进行特征提取,得到唇部特征;对音频特征与唇部特征进行对齐并拼接,得到联合特征;对频谱特征图进行信噪比估计,得到信噪比,并依...
  • 本发明涉及语音识别技术领域,具体涉及一种基于大数据的语音识别方法及系统,包括:采集目标区域内的各语音信号帧及其基频,获取各语音信号帧与阳平声调的第一匹配指数、与去声声调的第二匹配指数、与阴平声调的第三匹配指数、与上声声调的第四匹配指数,将所...
  • 本申请涉及人机交互技术领域,公开了一种人机交互方法、装置、电子设备、存储介质及程序产品,该方法包括:获取司机的原始语音信号;根据司机的原始语音信号,确定目标语音文本的意图类别,目标语音文本为原始语音信号的识别结果;从目标语音文本中提取关键信...
  • 本申请适用于人工智能技术领域,提供了一种智能玩具的多模态控制方法,该方法包括:获取目标用户的输入数据;将输入数据转换为文本数据;基于文本数据,确定输入数据对应的实体结构数据以及实体关系数据;根据文本数据、实体结构以及实体关系数据,生成输入数...
  • 本申请适用于人工智能技术领域,提供了一种智能玩具的对话意图识别方法,方法包括:获取目标儿童用户的语音数据;对语音数据进行声学与文本并行预处理,得到语音数据对应的文本语义特征与对应的声学情感特征;对文本语义特征以及声学情感特征进行特征融合处理...
  • 本发明涉及物联网、边缘计算及智能语音控制技术领域,具体为一种基于物联网和边缘计算的智能语音控制开关系统,包括:多模态上下文感知单元,输出原始数据流及待处理的多条语音指令;实时状态向量生成单元,生成结构化的上下文状态向量;动态仲裁逻辑配置单元...
  • 本申请提供一种信息传输方法、装置及存储介质,涉及通信技术领域,尽可能的保障IoT设备能够正常进行语音通话。该方法包括:获取语音信息;通过自动语音识别ASR,将语音信息转化为文本信息;发送第一消息,第一消息用于指示将文本信息转化为语音信息所需...
  • 本申请公开了一种基于充电仓的耳机控制方法、充电仓及存储介质,涉及无线耳机技术领域,应用于充电仓,充电仓设置有网络通信模块,公开了基于充电仓的耳机控制方法,包括:响应于耳机单元的语音输入指令,获取耳机单元发送的音频数据流;基于网络通信模块将音...
  • 本发明属于语音交互与广播控制技术领域,具体涉及一种AI语音广播信号处理装置及方法。包括:电话交互信息处理模块,用于接收用户电话并进行语音识别,将用户需求转化为文本信息;广播需求收集归类处理模块,用于分析文本信息,提取广播所需的关键信息;广播...
  • 本发明属于核电广播通信技术领域,具体涉及一种AI语音广播系统。包括IP电话系统、接入系统、广播控制系统,所述IP电话系统通过语音识别方法提取用户的广播意图和内容,并将其转化为文本信息传递至广播控制系统;接入系统将指令转发至广播控制系统,并通...
技术分类