当今时代,处于第三波浪潮的 AI 正迎来加速发展时期,AI 技术不断突破,应用大规模爆发,大量布局 AI 的科技巨头和创业公司逐渐涌上潮头。


而计算机视觉作为 AI 市场的最大分支,无论是在技术成熟度、商业化进程,还是在市场增长速度、投融资热度等方面,自始至终都是人工智能领域最热门的行业之一。


计算机视觉的应用领域几乎涵盖了我们所知的所有行业,如自动驾驶、金融风控、安防、新零售、智能手机、智能机器人......


据 IDC 预测,中国人工智能市场将在 2024 年形成千亿市场规模,而计算机视觉占比将超过一半,未来广阔前景引人遐想。

计算机视觉成为AI最热门分支 国内“AI四小龙”分别都有怎样的布局?

计算机视觉迈入发展快车道


人工智能大家已经耳熟能详,但计算机视觉在排除行业从事者之外,却很少有人能解释的清楚。


那么究竟何谓计算机视觉呢?


简单来说,人类通过眼睛感知和理解周边的世界,而计算机视觉则是一门研究如何使机器“看”的科学。更进一步的说,就是用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。


20 世纪 60 年代,贝尔实验室研发的一种将光子转化为电脉冲的器件,很快成为了高质量数字图像采集任务的新宠,逐渐应用于工业相机传感器,标志着计算机视觉走上应用舞台;70 年代中期,MIT人工智能实验室正式开设计算机视觉课程;1982 年,《视觉》一书的问世,标志着计算机视觉成为了一门独立学科。


进入 21 世纪以来,计算机视觉领域蓬勃发展,各种理论与方法大量涌现,并在多个核心问题上取得了令人瞩目的成果。尤其是近年来,国内外巨头纷纷布局计算机视觉领域,开设计算机视觉研究实验室,并以计算机视觉新系统和技术赋能原有的业务,开拓全新战场。


计算机视觉能干吗?


图像分类


图像分类是根据图像的语义信息对不同类别图像进行区分,是计算机视觉的核心,是物体检测、图像分割、物体跟踪、行为分析、人脸识别等其他高层次视觉任务的基础。例如下图,通过图像分类,计算机识别到图像中有人(person)、树(tree)、草地(grass)、天空(sky)。


图像分类在许多领域都有着广泛的应用,如:安防领域的人脸识别和智能视频分析等,交通领域的交通场景识别,互联网领域基于内容的图像检索和相册自动归类,医学领域的图像识别等。


目标检测


目标检测任务的目标是给定一张图像或是一个视频帧,让计算机找出其中所有目标的位置,并给出每个目标的具体类别。如下图,以识别和检测人为例,用边框标记图像中所有人的位置。

计算机视觉成为AI最热门分支 国内“AI四小龙”分别都有怎样的布局?

而在多类别目标检测中,一般使用不同颜色的边框对检测到的不同物体的位置进行标记,如下图所示。


语义分割


语义分割是计算机视觉中的基本任务,在语义分割中我们需要将视觉输入分为不同的语义可解释类别。它将整个图像分成像素组,然后对像素组进行标记和分类。例如,我们可能需要区分图像中属于汽车的所有像素,并把这些像素涂成蓝色。如下图,把图像分为人(红色)、树木(深绿)、草地(浅绿)、天空(蓝色)标签。


实例分割


实例分割是目标检测和语义分割的结合,在图像中将目标检测出来(目标检测),然后对每个像素打上标签(语义分割)。对比上图、下图可见,如以人为目标,语义分割不区分属于相同类别的不同实例(所有人都标为红色),实例分割区分同类的不同实例(使用不同颜色区分不同的人)。


目标追踪


目标跟踪是指对图像序列中的运动目标进行检测、提取、识别和跟踪,获得运动目标的运动参数,进行处理与分析,实现对运动目标的行为理解,以完成更高一级的检测任务。


企业差异化路径渐显


随着 AI 时代的到来,计算机视觉赛道的商业化进程不断加速,计算机视觉已经成为传统产业不可或缺的重要环节。


而计算机视觉龙头企业也逐渐呈现出不同方向的差异化经营战略,有的发力云端平台、有的聚焦于前端软硬件一体方案、有的专注医疗影像分析、有的深入金融领域。


以 “AI 四小龙” 为例,商汤科技、依图科技、旷视科技、云从科技在各自道路上的差异化战略开始显现,百花齐放的行业盛世雏形正逐渐形成。


商汤科技创立于 2014 年,专注于计算机视觉与深度学习底层法的研究开发,以原创技术为核心赋能产业,应用覆盖行业范围最为广泛。当前商汤科技正在集中于计算机视觉的后端市场,聚焦于云端、平台的搭建,将自身定位于基础平台型公司。


例如在安防领域,商汤正在全力打造城市级视觉中心平台,希望通过自身强大的 AI 算法协助城市级别的海量数据处理。


此外商汤还联合湖北省博物馆打造“虚拟曾侯乙编钟”,通过 AR 技术让观众敲响两千年前的古代乐器;与故宫文化合作,在“金榜题名”互动式展览中将孔子等比例还原,让现代人也能与孔圣人行礼,实现“跨时空互动”。

计算机视觉成为AI最热门分支 国内“AI四小龙”分别都有怎样的布局?

旷视科技成立于 2011 年,深耕金融安全、城市安防、手机 AR、商业物联,工业机器人五大核心行业,致力于为企业级用户提供全球领先的人工智能产品和行业解决方案。


旷视科技的发展战略与商汤截然相反,作为一个以人工智能算法起家的“轻”企业,旷视正在从计算机视觉算法后端向前端覆盖。为摆脱依靠软件平台变现难的问题,旷视科技的研发工作向产业链上游的硬件端延伸,推出了人工智能摄像头、边缘计算设备等。


依图科技成立于 2012 年,致力于将计算机视觉人工智能创新性研究与行业应用相结合,具备较为先进的算法和极强的工程应用能力。依图科技强调优质算法基础上产品化、工程化能力的重要性,并将安防和医学影像分析作为其发展的重要战略。


依图科技与北京协和医院、华西医院、浙江省人民医院、复旦大学附属肿瘤医院等多家顶级三甲医院合作,推出了 care.ai 医疗智能全栈式产品解决方案,为医院提供跨科室的多场景应用系统和数据分析平台。


云从科技于 2015 年成立,孵化于中科院重庆研究所,源于云从科技深厚的国家队背景,云从科技与国内大型银行合作密切。


云从自主研发的金融行业解决方案已覆盖金融各个领域,包括银行、互联网金融、证券、基金、保险、汽车金融等。目前,云从科技在金融领域的布局,短期内以抢占银行线下网点智慧化改造市场为主,长期则是切入金融机构核心风控业务。


除了 “AI四小龙”,还有一些计算机视觉企业同样凭借先进技术走上了差异化的发展道路,在AI市场独树一帜的同时确定了自身的领先地位。


以影谱科技为例,作为 AI 影像生产行业领航者,影谱科技对于计算机视觉应用的另一大爆发点——智能影像有着极为深刻的认知。


作为 AI 视觉生成技术的最佳代表,影谱科技定义了 AI 影像生产引擎 AGC,推出全新的智能影像检索、生成、渲染及创建工具集、云服务,升级的数字人解决方案,及高质量光照与物理模拟系统等,以 AI 生成技术赋能传媒、文教、体育等多个产业;同时,推出 AI+DT 深度融合的AI数字孪生引擎 ADT,用于提供商品数字模型和商业空间感知解决方案,全面构建影像级、全模态、全场景、可交互的 AI 数字商业生态。


正是在影谱科技的独家技术支持下,央视网体育首位虚拟 AI 主播正式推出上线,首次亮相即创造流量高峰。近日,影谱科技还与高端生活电器企业海尔智护达成战略合作,将基于影谱 AI 数字孪生平台共建家庭数智生态体系,把人工智能及数字化能力充分应用到智能制造、消费体验、数字化管理等环节中,为智能家电和消费者搭建“数字桥梁”。


总的来说,差异化的战略不仅有利于计算机视觉企业的成长,也将充分激发全行业发展潜力,打造出一个“百家争鸣”的良性市场竞争格局。


视觉技术 “多点开花”


计算机视觉涉及多个技术分支,包括人脸识别、物体识别、场景识别、影像识别、手势识别、视频结构化、OCR(光学字符识别)等。其中人脸识别可以说是布局最为广泛且最为外界熟知的技术,几乎所有企业均有布局。


人脸识别是一种身份鉴定的识别技术,非接触性和非强制性特征使其在各类场景中广泛应用,比如金融领域的身份验证、零售环节的面部识别支付、商业服务领域的自动识别客户等方面。其中,“AI 四小龙” 的人脸识别准确率甚至已超过 99%。


不过计算机视觉的发展并不局限于单点技术的爆发。事实上,商汤科技、旷视科技、影谱科技等企业在多项技术上其实均有布局。


比如商汤科技布局了智能影像、医学图像、智能汽车等技术,近日还推出了集算力、算法、平台于一身的 SenseCore 商汤 AI 大装置。可通过自动化生产,自适应应用的方式,全面解析物理世界所涉及的各种错综复杂的数据应用。简单地说,有了 AI 大装置这种基础设施,在城市中的商圈、园区、街道等各种场景,都可以实现虚拟与现实的智能化连接;


旷视科技打造了 Brain++ AI 生产力平台,核心技术除人脸识别,还包括计算机摄影学、智能视觉传感器、机器人导航和定位等,“物体识别”“文本识别”“图像分类”“物体检测”等功能均可快速实现,从而支持旷视科技向垂直领域快速扩张;


影谱科技通过构建影像商业化引擎 ACM、影像工业化引擎 AGC、数字孪生引擎 ADT 三重引擎,深度覆盖智慧文娱、智慧媒体、智慧科教、数字商业等核心场景,提供一站式智能影像解决方案,助力关键产业数智化升级。


从数据收集、到算法模型,再到算力提升,虽然计算机视觉技术在不断进步,但与此同时,多个行业痛点问题也随之浮现。


首先是计算机视觉迫切需要填补海量数据计算需求所面临的算力缺口,这意味着企业需要高额的成本用于算力训练;其次计算机视觉的应用场景仍有拓展余地,而不应总将注意力聚焦在无人驾驶、数字娱乐、安防监控、医疗等少数领域;最后,一旦市场进入平稳发展的饱和期,企业或将面临市场的筛选和淘汰。


不过“祸兮福之所倚,福兮祸之所伏”,这些问题的出现也代表着计算机视觉尚有广阔的市场空间可供挖掘。随着计算机视觉技术日渐成熟,企业商业化落地能力不断提高,计算机视觉市场规模或将迎来突破性发展。


未来,伴随着计算机从理论到应用的速度加快,高质量的各种视觉数据不断沉淀,相信无论是在农业还是工业领域,无论是视频直播还是游戏,一定还会有更多好玩炫酷的计算机视觉应用逐一亮相。


文章来源: DeepTech深科技,Nuist目标检测

免责声明

我来说几句

不吐不快,我来说两句
最新评论

还没有人评论哦,抢沙发吧~