CN|EN

博云视觉副总裁冯栋:智慧城市为何不“智慧”?数字视网膜直击痛点

[ 亿欧导读 ] “自闭”(无差别视频汇聚、算力带宽瓶颈明显、视频内容难注意)和“弱视”(摄像头功能单一、感知能力参差不齐、丢失部分信息)是当前视频监控两大突出问题,对这些问题的投入和关注已经成为不可回避的事实。
博云视觉,智慧城市,智能摄像头,视频监控,人工智能图片来自“亿欧网”

在构建智慧城市的大背景下,随着人工智能技术赋能行业兴起,“视频监控+AI”成为越来越多的企业所切入的领域。根据前瞻产业研究院《2019年中国视频监控产业全景图谱》中的数据显示,视频监控市场近5年来一直保持着18%左右的稳定增长。但是,大多数摄像头并不智能。在2019全球智博会的论坛上,博云视觉创始人兼CEO陈杰表示,“自闭”(无差别视频汇聚、算力带宽瓶颈明显、视频内容难注意)和“弱视”(摄像头功能单一、感知能力参差不齐、丢失部分信息)是当前视频监控两大突出问题,对这些问题的投入和关注已经成为不可回避的事实。

让摄像头自己具备识别能力是如今智慧城市的主要解决方案,但传统的摄像头不便拆卸,新安装的具备识别能力的摄像头,如人脸识别摄像头、车辆识别摄像头等又各自为政,无法做到汇融并和底层打通,难以进行完整的交通场景分析。如果让包含识别、推理等运算的复杂AI能力在摄像头端运行,又会面临算力不足的问题,且在每个摄像头中加载大量的AI算力和专用硬件模组,将会是一笔巨额成本。

基于此,中国工程院院士兼中国计算机学会理事长高文提出的“数字视网膜”理念广为产学各界重视。“数字视网膜”不仅能看,还能够感知,是一种非常理想的智慧城市摄像头体系。如今,“数字视网膜”已从理论逐渐走向现实,包括博云视觉在内,已有一批公司成为积极的践行者。

推动视觉特征编码标准化进程,是初心,也是使命

承载数字视网膜的摄像头不仅可以实现视频高性能压缩编码传输,还可以为后续的行业智能分析应用提供编码后的特征数据支撑。其中,视频特征的紧凑表达是数字视网膜的核心技术之一。特征组织是整个视频分析中最为关键的一个环节,如何快速、准确且在占用码流更少的情况下将特征组织起来是需要解决的重要问题。国际标准MPEG CDVS(Compact Deor for Visual Search,面向视觉搜索的紧缩视觉特征描述子)为此提供了答案。

2015年9月,MPEG CDVS国际标准正式颁布,在这项标准中,北京大学通过与美国斯坦福大学、华为、三星、意法半导体、意大利电信等多家公司合作竞争,最终对这项标准的专利贡献达到了60%以上,MPEG CDVS国际标准也成为了多媒体领域内由我国主导制定的首项ISO国际标准。而在此过程中,陈杰自2010年还在北京大学读博的时候,就已经开始参与这项标准的制定。

博云视觉的定位是一家提供标准化的视觉人工智能技术的科技公司,推进视觉特征编码标准化进程始终贯穿于博云视觉成立前后。在MPEG CDVS颁布后,博云视觉又积极投入到下一代国际标准MPEG CDVA(Compact Deors for Video Analysis,面向视频分析的紧凑视觉描述子)中。

2017年7月,新一代人工智能产业技术创新战略联盟成立,博云视觉成为首批联盟理事单位成员;同年8月,在大连第62次AVS工作组会上,博云视觉联合北京大学、阿里巴巴提交了“视觉特征编码”标准需求提案;同年10月,在第119次ISO/IEC JTC MPEG国际标准会议上,CDVA标准进入工作组草案阶段。从CDVS到CDVA,博云视觉既是参与者,也是见证者。

在2019全球智博会论坛结束后,博云视觉副总裁冯栋接受了亿欧的专访。在被问及为何会选择以标准化人工智能技术支撑创业理想时,冯栋表示,这不是选择,而是使命。以前的国际标准基本都是由国外主导,直到CDVS标准颁布,中国第一次在多媒体领域主导了ISO国际标准。未来,中国还要贡献更多的力量。与此同时,带着标准去探索人工智能技术产业化落地的方向,也是AI企业当下的重要任务。

从理论到实践,“数字视网膜”为城市大脑赋予真正的“智慧”

针对城市大脑的视觉系统架构中存在的海量数据传输带宽占用高、存储空间需求大、云端算力挑战高等诸多瓶颈,博云视觉基于数字视网膜技术,赋予端侧一定的AI处理能力。让端侧对视频流中的内容主动进行特征提取,使上传到云端的视频数据,一方面通过高效编码作为数据存储,另一方面经过特征提取直接作为智能大脑的“可读物”。

在此过程中,数字视网膜终端进行视频与特征双流编码,支持特征实时汇聚和视频按需调取;边缘计算服务器或特征盒可支持对已建摄像机实现视频图像增强、全目标结构化、融合特征提取以及特征压缩与传输;在云端,高性能云脑图搜引擎实现数据的分布式管理,同时大数据云脑亦可开展更深层次的数据挖掘、推理与决策的相关工作。

整个过程很好地平衡了端、云两侧的成本与效率关系,形成了“端-边-云-用”标准化城市智能视觉特征联网。通过特征化处理信息不仅能够降低传输带宽压力、减小数据总量,还可以有效提高检索速度,让摄像头终端真正与“城市大脑”实现即时联动。

在“用”这一环节,目前,博云视觉将重点放在了安防智能化的应用落地上。在公共安全方面,博云视觉提供了平安城市解决方案,采用人工智能、大数据、视频融合与分析等技术,整合多维感知信息数据,为各级公安机关治安防控、侦察破案、情报研判等提供服务。

冯栋表示:“整个解决方案是对公安场景下的事前、事中和事后而言的,尤其是事后案件的侦破研判方面,我们通过精准追踪技战法,可以更精准的刻画出嫌疑目标的轨迹信息,精确分析目标落脚点等线索信息,极大提升公安破案效率。”目前,该方案已在青岛城阳区天网项目中成功落地。

在城市交通方面,博云视觉联合智能交通领域企业海信网科,打造了全景感知摄像机、精确废片预审引擎等一系列软硬件产品,通过全路网感知来提升通行效率,赋能交通行业。其中,全景感知摄像机结合路网信息的360°交通状态进行感知,打造“会思考”的视频巡检机器人,实现城市道路交通事故、人员异常聚集等6类警情的实时自动沿路扫查,达到城市路网全覆盖的警情自动巡检;精确废片预审引擎则基于深度学习及AI图像识别技术,对违法图片进行预审与筛除,旨在解决大量废片导致的信息审不完、行政复议多、作弊难发现等问题,有效提升交警的工作效率。

从理论到实践,博云视觉正在把“数字视网膜”向产业化落地的方向推进。

场景化能力始终是AI企业面临的巨大挑战

提及在实现技术落地过程中遇到的困难,冯栋表示,“场景化”是一个巨大的挑战。“其实在技术实力上,各家的算法已不具备太大的差距,核心就是产品在项目里真正的交付,因此在行业竞争中,拼的是交付力,这和场景化是离不开的。”他解释道。

从技术深耕到行业、产业,是人工智能必然要走的路,同样也是博云视觉三年来的发展脉络。2015年12月,博云视觉在北京成立。2018年6月,博云青岛人工智能产业基地落地。冯栋告诉亿欧:“以前我们在北京的时候只顾蒙头做技术、做产品,到了青岛后,我们扎根到行业里做产品,优化技术。可以说,青岛是博云的破冰之旅。”

实际上,醉心于技术本身,缺乏产品化和场景化的能力是目前大多数AI企业存在的问题。对用户来讲,AlphaGo大胜世界围棋冠军之类的技术“荣耀”太过遥远,也无法为之买单。AI企业应该尽可能地向技术落地的场景化产品转移,为用户、产业赋能。

在2019全球智博会上,阿里巴巴副总裁华先胜便指出,在AI繁荣的背后,超过90%的AI公司在亏损,实验室与真实世界之间也存在巨大的差异,并且很多成熟的技术与用户的实际需求并不匹配。

人工智能的现实意义,是一种落于脚下的全新思维,一种真实便捷的解决方案,并非是那种无法触手可及的技术展示,产生变现价值的无疑在于前者。

博云视觉的定位是一家提供标准化的视觉人工智能技术的科技公司,谈到解决方案,冯栋表示:“目前我们的解决方案是定制化比较多,不过,未来肯定是标准化更多。由于行业跨度较大,博云视觉成立三年,还不足以应对那么大范畴的行业应用需求导入。”解决方案标准化实际上是技术产业化落地趋于成熟的一种体现,博云视觉正在逐步推进这种标准化进程。“我们已经把公安的产品标准化,目前已形成标品买卖,其实对公司来讲,在产品投入上也会相应减少很多。今年,我们会实现交通产品的标准化。”

冯栋进一步解释道:“我们之所以强调标准化,是因为只有标准化才能解决城市的问题。现在AI企业有很多家,到最后肯定要统一起来。

实现技术的产业化落地,其实为AI企业提供了巨大的市场空间,但缺乏场景化能力却成了AI企业普遍遇到的问题。在未来,当人5G、工智能技术成熟落地,与行业、产业深度融合后,众多AI企业的市场又在哪里?又如何脱颖而出?对此,冯栋表示:“技术在迭代,场景也在迭代,后续的新技术迭代特征如何去兼容历史抽离出来的特征,其实是一直没有被解决的问题,在未来也会继续,因为技术的发展不会停滞。”的确如此,技术在快速迭代,技术差距也会周期性地缩小,唯一不变的主题便是技术落地,这也将成为AI企业不变的竞争方向。