基于视觉的驾驶系统行人检测及测距

摘要:

保障行人安全是道路交通安全系统的重要目标之一,这使行人检测作为驾驶辅助系统(advanced driver assistance systems,ADAS)中的核心组成部分。其中获取准确的行人距离十分关键,对此本系统在行人检测模型的基础上加入了行人距离预测分支,提出了一种基于车载视频的行人检测与测距方法,在使用单目摄像头的情况下,可以在检测行人的同时完成对行人与摄像头之间距离的预测。下图为行人检测测距系统流程示意图:

同时,本课题将该模型部署到了基于树莓派 3B 和 Intel NCS2 神经网络计算加速棒的嵌入式平台上,实现了一个简单的行人距离预警系统,系统从摄像头或者视频文件读取视频流,当行人距离摄像头的距离过近时,系统发出预警。实际运行结果如上图所示。

方法优点:

  • 同时完成行人检测和测距,采用深度神经网络的方法,对摄像头或视频文件获取的视频流进行处理,对于距离太近的行人发出预警信号。
  • 相比传统使用激光雷达测距的方法,极大的降低了成本。
  • 轻量化的模型,兼容国产人工智能处理芯片(海思,瑞芯微等),可达到实时处理的要求。
  • 行人检测 mAP 达到 98%以上,距离预测误差小于 5%。

安全帽佩戴情况检测

摘要:

在建筑施工现场,为避免建材从高处坠落造成人员伤亡,所有进入施工区域的人都被要求佩戴安全帽。而常有工人不遵守安全规范,摘下或忘戴安全帽,有着严重的安全隐患。本课题组针对这一问题,基于监控视频对建筑工地上人员的安全帽佩戴情况进行检测识别。如图所示,佩戴安全帽与不佩戴安全帽、佩戴其他类型帽,分别以黄色、红色与蓝色框标出。该课题完成了对安全帽佩戴检测的自动识别。课题中采用深度神经网络的方法,对不同类型的带帽人员以及不戴帽人员进行检测和良好的属性区分,方法具有一定的实时性。

优点:

  • 实现对安全帽佩戴的自动检测,采用深度神经网络的方法,对不同类型的带帽人员以及不戴帽人员进行检测和良好的属性区分,实时性较强。
  • 轻量化的模型,兼容国产人工智能处理芯片(海思,瑞芯微等),可达到实时处理的要求。
  • 模型的 mAP 可以达到 90%以上。
  • 通过使用多线程完成对多路视频的并行处理。

应用及成果: 开发的系统已经在杭州市江干区住建局成功使用。

单菜品属性识别系统

摘要:

本系统通过计算机视觉技术提供了一种菜品食材等属性信息的识别方法。通过对菜品细粒度特征的识别,实现了百种预设菜品的主要食材、菜品口味特色、适宜人群推荐、相似菜品推荐、以及菜系、烹饪方式等属性信息的识别。如下图为自动菜品结账系统系统流程示意图。

优点:

  • 细粒度识别与多标签学习相结合,优化多属性学习,标签不均衡问题,相对于现有人工智能的细粒度菜品识别方法,拓展了菜品的口味特色、菜系、烹饪方式等多属性信息,提高了识别精度。
  • 轻量化的模型,兼容国产人工智能处理芯片(海思,瑞芯微等),可达到实时处理的要求。
  • 百种菜品的识别精度达到现存方法中最高,属性识别精度达到 95%以上。

应用及成果: 本项目获微软亚洲研究院 2019 学术日 Real World Scenario Award 奖。

多菜品识别系统

摘要:

本系统实现基于视觉的自动菜品结算系统,通过对菜品种类及食材的识别,获取具体的摄入菜品种类和数量,实现营养成分的估计,提供了一种基于细粒度识别的菜品自动结算及饮食健康管理方法。实现了共计百种食物的识别。如下图为自动菜品结账系统系统流程示意图。

优点:

  • 检测和检测相结合,按照大类检测和细致类别检索相结合的识别,相对于现有人工智能的检测识别方法,具有速度优势并且具有识别类别扩展性。当识别的类别发生增补是无需重新训练模型。
  • 轻量化的模型,兼容国产人工智能处理芯片(海思,瑞芯微等),可达到实时处理的要求。
  • 200 道菜的识别性能达到 98%以上。

应用及成果: 钱学明、彭豪、侯兴松、邹屹洋、李纬.一种基于细粒度识别的菜品自动结算及饮食健康管理方法:(专利受理)

货柜商品识别系统

摘要:

智能无人货柜得益于其体积小巧,售卖场景多样、用户购物交互体验强的优点,受到大众的欢迎。摈弃了现有基于计算机视觉技术的智能无人货柜识别商品类目少的缺点。本系统将计算机视觉的检测与检索技术相结合,共同实现了智能无人货柜的近百种商品识别系统。下图为本系统的实现流程示意图。

优点:

  • 检测和检测相结合,按照大类检测和细致类别检索相结合的识别,相对于现有人工智能的检测识别方法,具有速度优势并且具有识别类别扩展性。当识别的类别发生增补是无需重新训练模型。
  • 轻量化的模型,兼容国产人工智能处理芯片(海思,瑞芯微等),可达到实时处理的要求。
  • 高识别性能 100 类典型的商品识别性能达到 99.5%,能够对人为产生商品倾倒、损毁和杂物入侵具有实时报警。

应用及成果: 开发的系统已经在山东新北洋信息技术股份有限公司测上线应用。

人员口罩检测(或者特定服饰等)

摘要:

当前我国大范围爆发了新型冠状病毒(2019-nCoV)感染,我们在支持疫情一线的医护人员的同时,也要做好个人的防护措施。其中佩戴口罩对于防止疫情蔓延至关重要,但仅靠人工监督,效率太低且耗费大量人力。本项目基于这个问题,提出了一套对是否佩戴口罩自动检测和预警系统。如下图为口罩检测系统流程示意图。

方法优点:

  • 实现对口罩佩戴的自动检测,采用深度神经网络的方法,对是否佩口罩进行检测和良好的属性区分,实时性较强。/li>
  • 轻量化的模型,兼容国产人工智能处理芯片(海思,瑞芯微等),可达到实时处理的要求。
  • 识别性能达到 99%以上。

行人检测、检索系统

摘要:

本系统可从监控视频中检测出所有行人,使用截图功能设定目标人物,可自动定位到其他时段出现的该行人。如下图所示,截取行人正面照片,可定位到该行人被监控摄像拍到的侧面以及背影。可以看到,目标人物的其他时间点所拍摄到的照片,均在排列靠前的搜索结果中。该系统中,对象(行人、车辆等)采用深度特征描述,采用特征匹配和搜索的方法,可以在历史数据中找出当前对象相似的目标。

基于司机状态识别的辅助驾驶方法研究

摘要:

本系统对司机状态识别来达到辅助驾驶的功能,通过对司机状态进行拍摄监测,通过检测模型来得到司机实时的面部区域和手部区域,进而对面部区域进行关键点检测和对手部区域进行分心状态识别,从而对司机是否疲劳驾驶和分心驾驶作出判断,并对司机进行提醒预警,起到辅助驾驶的作用。共实现了对司机闭眼、打哈欠两种疲劳状态以及玩手机分心状态的监测,其中,对唇部打哈欠、眼部睁闭眼状态识别的准确率分别达到 99.07%、94.6%。如下图为驾驶员驾驶状态监测系统流程示意图。

本系统通过对当前摄像头前人物的眼部特征进行监测、处理识别,可判断出其是否处于疲劳状态,演示效果如图所示,右上角概率设为非疲劳的预测值,当人物闭眼时,标记框为红色并报警,当人物睁眼时标记框为绿色,判断其为非疲劳状态。

方法优点:

  • 在整个检测过程中,对面部和手部区域分别进行处理,当后续需要增加识别手部其他状态时,无需重新训练检测和面部关键点检测的模型,只需再次训练手部状态识别这一小部分模型,具有状态识别可扩展性。
  • 轻量化模型,整个系统在 GTX 1080 显卡下可达每秒 22 帧,满足将来在人工智能芯片上布控的速度要求。
  • 针对唇部状态的识别率达到了 99%以上,眼部状态的识别率也高达 94.6%。

应用及成果: 该算法可以较好地应用到司机辅助驾驶的功能使用中,来起到事故的主动防御作用,达到更安全的出行。

基于AI与大数据学习的高铁受电弓状态监视

摘要:

自动检测受电弓状态、受损情况、弓角异常、打火等及预警。实现满足电车工控机运行条件的可视化QT软件,覆盖实用的基础功能,安装简便,适用简易。

监控视频之对象检测及检索

摘要:

设计算法和应用软件,实现对行人、车辆、人脸等对象的检测和检索。

人脸表情分类系统

摘要:

本系统可以从摄像头和本地视频中读取数据,对数据中的人脸表情进行happy(高兴)、sad(悲伤)、feared(害怕)、angry(生气)、disgusted(困惑)、 surprise(惊喜)、nothing(无)八分类。并根据视频中的人脸实时统计出每种表情所占的比例。

基于AI的管廊智能运维

摘要:

基于管廊机器人拍摄的视频画面进行自动的积水、异物入侵、支架脱落、管线走线不规范、乱拉线缆等进行实时的检测并预警。 目前该系统已应用于西安沣西一期24公里的地下管网的自动运维,并在郑州管廊推行试点中。

多目标跟踪检测

摘要: