Document
拖动滑块完成拼图
专利交易 商标交易 积分商城 国际服务 IP管家助手 科技果 科技人才 会员权益 需求市场 关于龙图腾 更多
 /  免费注册
到顶部 到底部
清空 搜索
最新专利技术
  • 本发明涉及人工智能技术领域,尤其涉及一种图像的文本描述生成方法、装置、设备及介质。应用于医疗场景,本申请中,根据各个图像令牌初始注意力权重与对应的当前注意力权重,计算得到生成第i个文本令牌时各个图像令牌的激活分数;将激活分数大于预设阈值的图...
  • 本发明涉及物流配送环境感知领域,尤其涉及一种基于多模态物流知识图谱的智慧物流配送方法。本发明首先通过视觉传感器获取道路图像,构建视觉异变观察范围;进而,选择视觉特征图谱提取视觉异变观察范围内的对应的视觉特征,提取的视觉特征,构建其时域变化曲...
  • 一种多模态融合的室内场景语义占据训练方法,涉及3D场景语义占据技术领域,包括:采用视觉模型提取视觉特征为基础,优化语义特征维度,提供基础的空间与语义信息特征;增加文本模态输入,强化模型对于语义空间的认知能力;引入困难体素挖掘的策略,对困难体...
  • 本发明公开了一种离散网格策略的遥感实例分割点自适应优化方法。包括针对目标摇杆图像与参考图像,采用视觉特征提取网络完成二者的级特征提取,以中目标实例为对象构建固定尺寸离散实例网格,将候选正负点集分别映射至网格单元;对含候选点的网格单元采样视觉...
  • 发明公开了一种基于改进HRNet_OCR语义分割模型的红树林遥感图像分割提取方法,属于红树林遥感提取技术领域。包括:步骤S1:获取红树林原始卫星遥感影像,并裁剪红树林遥感影像;步骤S2:对红树林遥感图像中绘制红树林矢量标签并进行栅格化处理;...
  • 本申请公开了一种基于智能体协同的数据标注和模型训练调度的方法和装置,所述基于智能体协同的数据标注和模型训练调度的方法包括:利用图像数据和知识图谱构建智能体的初始网络架构,利用已标注的第一图像数据对初始网络架构中的神经网络进行并行训练,得到智...
  • 本发明公开了一种网球视频数据标注方法和系统,涉及人工智能技术领域,包括:获取网球视频图像帧,通过卷积改进YOLOv11球场关键点识别模型确定归一化球场关键点坐标与球场关键点可见性,采用归一化球场关键点坐标确定上方队区域分割线坐标,基于人员目...
  • 本发明公开了一种图像处理方法、装置、电子设备及存储介质,该方法包括:获取待处理的第一医学图像和第一提示文本;第一提示文本用于指示要执行的第一图像处理任务;将第一医学图像和第一提示文本输入至特征提取模型中,以获得第一图像特征和第一文本特征;特...
  • 本申请公开了一种文本识别方法和相关装置,该方法包括:获取包括目标对象的目标图像,从所述目标图像中获取待识别文本对应的文本区域;基于所述文本区域与所述目标对象之间的位置关系,确定所述文本区域的角度调整方式,利用所述角度调节方式对所述文本区域进...
  • 本发明公开了一种面向复杂版面的手写元素自动分割与提取方法,涉及手写元素自动分割与提取技术领域,旨在解决对混合图文版面中手写内容识别与分离精度不足的技术问题,S200、手写区域精准定位与分割;S201、动态阈值分割算法;S202、上下文感知连...
  • 本申请公开了一种集装箱序列号识别方法及电子设备,集装箱序列号识别方法,包括:获取集装箱图像;输入集装箱图像至序列号区域检测模型,得到序列号区域检测结果,序列号区域检测模型基于标注有序列号标签的集装箱图像样本对深度学习神经网络模型进行训练得到...
  • 本发明公开了基于图像的农机标牌识别方法,涉及标牌识别技术领域,通过获取农机标牌原始图像,对原始图像进行图像增强预处理,将增强后的图像输入至基于自适应贝塞尔曲线回归的文字检测网络,获得初步文本识别结果并进行校验、纠错与格式化转换,生成键值对数...
  • 本发明实施例提供一种基于笔迹流形场建模的手写文字识别方法及系统,该方法包括:对输入图像进行笔迹形态增强,通过可变形卷积网络生成表征笔画中心轨迹的笔迹骨架图,再基于笔迹骨架图构建含方向、宽度、压力、速度的笔迹流形场。随后设置双通道识别结构,基...
  • 本申请涉及图像处理技术领域,尤其涉及一种端子排信息的智能识别方法和装置,包括:获取待处理的端子排图像;对端子排图像进行文本识别,得到端子排文本信息;对端子排图像进行目标掩码分割,输出端子排文本信息所对应的位置坐标;建立端子序号与接线内容的对...
  • 本发明提供了一种车厢信息识别方法及相关装置,属于车厢信息识别技术领域。本发明对待识别的目标区域进行标识定位,得到车号标识、车型标识、自重标识和载重标识在待识别的目标区域的位置信息;基于车号标识、车型标识、自重标识和载重标识在待识别的目标区域...
  • 本发明公开了一种基于图像识别的扫描档案数字化精细分类方法,包括如下步骤:获取扫描档案图像并进行版面校正与图像增强,得到规范化图像;对规范化图像执行文字识别与版面结构理解,形成文字结果与结构结果;结合类别层级体系与业务属性体系,构建对应的生成...
  • 本发明涉及文本处理技术领域,其特别涉及一种OCR识别结果的修正方法及系统。其中,本发明提供的OCR识别结果的修正方法将大语言模型作为一个推理引擎,为其动态地配备多个搜索智能体和一个循环验证机制,通过引入动态、精准的领域知识和上下文,从根本上...
  • 本发明属于图像信息识别技术领域,具体涉及一种基于OCR与大模型的审批信息结构化提取方法,包括以下步骤:S100:对待处理的审批表单图像进行预处理,并通过OCR技术提取文本内容及对应的文本位置信息;S200:将OCR提取的文本输入大语言模型,...
  • 本申请涉及数字资产技术领域和数据确权技术领域,本申请公开了基于数字资产的调度方案获取方法、装置、设备及介质,方法包括:获取数字资产的文本信息、图像信息和结构化字段信息;对文本信息的语义向量、图像信息的语义向量、结构化字段信息的语义向量执行融...
  • 本申请公开了一种电费单智能识别统计方法及系统,方法包括:响应于数据上传指令,显示电费单上传界面,导入可跨年的最多12个月份的电费单;响应于智能识别指令,对所述电费单进行OCR识别,得到电价类型,进而根据所述电价类型对所述电费单进行特征提取,...
技术分类