• 1
  • 2
  • 3
  • 4

首页 / 行业

如何让数字感知与现实同频?计算机CV技术告诉你答案

2022-11-23 11:46:00

随着科技的发展,视觉信息数据正在发生爆炸式的增长。如果设备、人工智能想要在现实世界发挥重要作用,就必须看懂这些图形图像信息所表达和表现的内容。

b04186c0-67f2-11ed-8abf-dac502259ad0.webp

1970-2020年网络上新增数据的占比趋势图,蓝色是非结构化数据,其中大部分都是图像和视频信息数据。

如何让数字双眼看懂真实世界?

如何让数字感知与现实同频?

这就是计算机CV技术要解决的问题。

b04186c0-67f2-11ed-8abf-dac502259ad0.webp

近年,机器学习大热风潮掀起,计算机CV技术与自然语言处理及语音识别并列为机器学习方向的三大热点方向。

而计算机CV技术,即计算机视觉(Computer vision),作为其中的一个重要分支,它的目的其实很简单:看懂图片或视频里的内容,或者说,对视觉关键信息的筛选和筛查。

一门研究如何使机器“看”的技术~

b099bb42-67f2-11ed-8abf-dac502259ad0.webp

计算机CV技术可以利用神经网络中的深度卷积,提取复杂背景环境下图像的边缘、形状、轮廓及纹理等关键特征,并进行精确的识别和预测,从而达到代替人眼对目标进行识别、跟踪和测量。

b206b520-67f2-11ed-8abf-dac502259ad0.webp

目前,计算机CV技术目前有八大类别,分别是图像分类、目标检测、语义分割、实例分割、视频分类、人体关键点检测、场景文字识别、目标跟踪

图像分类

图像分类是计算机视觉中重要的基础问题,其余任务类别都是建立在图像分类的基础上的。比较典型有:人脸识别、图片鉴黄、相册根据人物自动分类等。

b2285e64-67f2-11ed-8abf-dac502259ad0.webp

目标检测

目标检测任务的目标是给定一张图像或是一个视频帧,让计算机找出其中所有目标的位置,并给出每个目标的具体类别。

b2973834-67f2-11ed-8abf-dac502259ad0.webp

语义分割

它将整个图像分成像素组,然后对像素组进行标记和分类。语义分割试图在语义上理解图像中每个像素是什么,并且还必须确定每个物体的边界。

b2de0f52-67f2-11ed-8abf-dac502259ad0.webp

实例分割

实例分割将不同类型的实例进行分类,会区分多个重叠物体和不同背景的复杂景象,不仅需要将不同的对象进行分类,而且还要确定对象的边界、差异,彼此之间空间、位置等关系。

b311fe20-67f2-11ed-8abf-dac502259ad0.webp

视频分类

与图像分类不同的是,分类的对象不再是静止的图像,而是一个由多帧图像构成的、包含语音数据、包含运动信息等的视频对象。视频分类因此要理解视频帧与帧之间的关联信息,还要理解每帧图像信息。

b4056ea2-67f2-11ed-8abf-dac502259ad0.webp

体关键点检测

会通过人体关键节点的组合和追踪来识别人的运动和行为,从而达到描述人体姿态,预测人体行为。

7

场景文字识别

场景文字识别是在图像背景复杂、分辨率低下、字体多样、分布随意等情况下,将图像信息转化为文字序列的过程。

b47c18e0-67f2-11ed-8abf-dac502259ad0.webp

目标跟踪

目标跟踪是指在特定场景跟踪某一个或多个特定感兴趣对象的过程。传统的应用就是视频和真实世界的交互,在检测到初始对象之后进行观察。

b5119f78-67f2-11ed-8abf-dac502259ad0.webp

计算机CV技术目前的应用领域和场景非常广泛,例如人脸识别、手势识别、图像识别、图像检索、OCR、神经网络芯片、医疗影像诊断、无人驾驶、工业视觉、三维重建、图像与NLP结合、智能视频分析等。

以计算机CV技术为支撑的互联网功能,已经覆盖了生活中的每个角落,也悄悄的改变着一切。

b5702a7a-67f2-11ed-8abf-dac502259ad0.webp

例 / 百度CV技术应用覆盖树状图

CV技术在能源行业和森林防火行业中      

可解决的难点

在一些特殊性质的行业,例如能源行业和森林防火行业。

能源行业如何规避危化品本身所带来的高风险、如何实现标准化和高效低风险的巡检和作业流程、如何规避管理管控中的遗漏点、如何及时响应突发安全隐患事件……

森防行业如何在广阔山林有效的巡山、如何及时发现和扑灭突发的火情、如何在林火蔓延时预判趋势、如何使得灭火无人机等设备精准的执行工作、如何管理距离遥远的工作人员……

这些难点和痛点很多都可以通过计算机CV技术解决。

由计算机来代替人力,用数字双眼代替人眼,建立能够从图像或者多维数据中获取‘信息’的人工智能系统,通过算法自动识别,自动甄别,可高精准判断隐患风险、智能化识别管理和作业遗漏,迅速的提升各类工作执行效能。

垂直行业!

庞大数据资源库搭建和算法技术加持

b5dd9d08-67f2-11ed-8abf-dac502259ad0.webp

在能源行业和森林防火行业CV识别中,面临着两个技术难点:①特征提取难;②计算量大。

面对这两个问题,弘和集团采用卷积神经网络和深度学习,可以有效的抓取油气站、油库、森林防火各类场景图像中的特征,在不影响特征提取的前提下,使用海量的数据进行有效的降维,不但大大减少了对算力的要求,并且在保证高识别准确率的同时达到了高响应速度。

庞大的数据库支撑和算法技术突破并行:针对能源行业和森林防火行业验证了超过十万个数学模型。针对特定的应用场景,标注和质检的训练集达千万GB,测试集达百万GB。

丰富的算法模型、数据库资源迭代,可以保证能源行业和森林防火行业各类CV应用场景识别的效率和精准率。

如果想要机器能够进行思考  

我们需要先教会它们去看。

——斯坦福人工智能实验室

二十年前还是直板手机的时代,计算机还是奢侈品,时代变化日新月异,从1959年生物学家开始研究视觉的机理,到1966年计算机视觉的产生,技术的飞速发展不断推进产业的变革。

对于传统的能源和森林防火行业,在计算机CV技术赋能之后,迅速运转的管理通路和极速响应的应急通路连通成闭环,科技的革新之力下,两个行业睁开数字双眼,开启智能化的新时代。

语音识别感知如何让数字

  • 1
  • 2
  • 3
  • 4

最新内容

手机

相关内容