基于Vgg-Unet模型自动驾驶场景检测

阅读量：

1.VGG

VGG的全称为Visual Geometry Group（VG），该组织隶属于牛津大学科学工程系，在该领域开发了一系列以VGG命名的卷积神经网络模型，并广泛应用于人脸识别和图像分类等领域。值得注意的是，在实际应用中，默认情况下其输入尺寸设定为224×244像素RGB图像。为了提升模型泛化能力，在训练阶段需要对数据集中的所有图像计算其通道均值参数，并将此均值参数作为输入供其卷积网络进行处理。在设计过程中采用了大小为3×3或1×1的滤波器，并且每个卷积操作均遵循固定模式进行处理。整个网络架构包含多个连续的卷积层以及三个完全连接层（FC）。具体而言，在不同配置下可实现从最小规模的VGG11（包含8个卷积层和3个完全连接层）到最大规模的VGG19（包含16个卷积层和3个完全连接层）之间的多种组合方式。此外需要注意的是，在传统的VGG架构设计中并未在每一个卷积操作之后引入池化操作，并且未在不同的卷积层级之间共享相同的池化操作次数。

架构图

2.Unet模型：

UNet是一种领先的语义分割技术，在性能上远超同类算法，并广泛应用于医学影像分析等领域。在基本工作流程上与传统的方法相似，在神经网络架构设计上具有显著差异性特点：相比于传统的卷积神经网络而言，在CNN中处理的是整个图像级别的分类任务，在UNet中则是在更高层次的空间粒度进行操作以实现更精细的目标识别功能

主要代码如下：

复制代码

    def get_vgg_encoder(input_height=224,  input_width=224, channels=3):
    
    if channel == 'channels_first':
        img_input = Input(shape=(channels, input_height, input_width))
    elif channel == 'channels_last':
        img_input = Input(shape=(input_height, input_width, channels))
    
    x = Conv2D(64, (3, 3), activation='relu', padding='same',
               name='block1_conv1', data_format=channel)(img_input)
    x = Conv2D(64, (3, 3), activation='relu', padding='same',
               name='block1_conv2', data_format=channel)(x)
    x = MaxPooling2D((2, 2), strides=(2, 2), name='block1_pool',
                     data_format=channel)(x)
    f1 = x
    # Block 2
    x = Conv2D(128, (3, 3), activation='relu', padding='same',
               name='block2_conv1', data_format=channel)(x)
    x = Conv2D(128, (3, 3), activation='relu', padding='same',
               name='block2_conv2', data_format=channel)(x)
    x = MaxPooling2D((2, 2), strides=(2, 2), name='block2_pool',
                     data_format=channel)(x)
    f2 = x
    
    # Block 3
    x = Conv2D(256, (3, 3), activation='relu', padding='same',
               name='block3_conv1', data_format=channel)(x)
    x = Conv2D(256, (3, 3), activation='relu', padding='same',
               name='block3_conv2', data_format=channel)(x)
    x = Conv2D(256, (3, 3), activation='relu', padding='same',
               name='block3_conv3', data_format=channel)(x)
    x = MaxPooling2D((2, 2), strides=(2, 2), name='block3_pool',
                     data_format=channel)(x)
    f3 = x
    
    # Block 4
    x = Conv2D(512, (3, 3), activation='relu', padding='same',
               name='block4_conv1', data_format=channel)(x)
    x = Conv2D(512, (3, 3), activation='relu', padding='same',
               name='block4_conv2', data_format=channel)(x)
    x = Conv2D(512, (3, 3), activation='relu', padding='same',
               name='block4_conv3', data_format=channel)(x)
    x = MaxPooling2D((2, 2), strides=(2, 2), name='block4_pool',
                     data_format=channel)(x)
    f4 = x
    
    # Block 5
    x = Conv2D(512, (3, 3), activation='relu', padding='same',
               name='block5_conv1', data_format=channel)(x)
    x = Conv2D(512, (3, 3), activation='relu', padding='same',
               name='block5_conv2', data_format=channel)(x)
    x = Conv2D(512, (3, 3), activation='relu', padding='same',
               name='block5_conv3', data_format=channel)(x)
    x = MaxPooling2D((2, 2), strides=(2, 2), name='block5_pool',
                     data_format=channel)(x)
    f5 = x
    
    return img_input, [f1, f2, f3, f4, f5]
    
    def _unet(classes, encoder, l1_skip_conn=True, input_height=416,
          input_width=608, channels=3):
    
    img_input, levels = encoder(
        input_height=input_height, input_width=input_width, channels=channels)
    [f1, f2, f3, f4, f5] = levels
    
    o = f4
    
    o = (ZeroPadding2D((1, 1), data_format=channel))(o)
    o = (Conv2D(512, (3, 3), padding='valid' , activation='relu' , data_format=channel))(o)
    o = (BatchNormalization())(o)
    
    o = (UpSampling2D((2, 2), data_format=channel))(o)
    o = (concatenate([o, f3], axis=-1))
    o = (ZeroPadding2D((1, 1), data_format=channel))(o)
    o = (Conv2D(256, (3, 3), padding='valid', activation='relu' , data_format=channel))(o)
    o = (BatchNormalization())(o)
    
    o = (UpSampling2D((2, 2), data_format=channel))(o)
    o = (concatenate([o, f2], axis=-1))
    o = (ZeroPadding2D((1, 1), data_format=channel))(o)
    o = (Conv2D(128, (3, 3), padding='valid' , activation='relu' , data_format=channel))(o)
    o = (BatchNormalization())(o)
    
    o = (UpSampling2D((2, 2), data_format=channel))(o)
    
    if l1_skip_conn:
        o = (concatenate([o, f1], axis=-1))
    
    o = (ZeroPadding2D((1, 1), data_format=channel))(o)
    o = (Conv2D(64, (3, 3), padding='valid', activation='relu', data_format=channel, name="seg_feats"))(o)
    o = (BatchNormalization())(o)
    
    o = Conv2D(classes, (3, 3), padding='same',
               data_format=channel)(o)
    
    model = get_segmentation_model(img_input, o)
    
    return model

全部评论 (0)

还没有任何评论哟~

基于Vgg-Unet模型自动驾驶场景检测

1.VGG VGG全称是VisualGeometryGroup属于牛津大学科学工程系，其发布了一些列以VGG开头的卷积网络模型，可以应用在人脸识别、图像分类等方面,VGG的输入被设置为大小为224x2...

3D 点云检测自动驾驶场景

记录学习的过程以及学习的资源,只记录关键框架,方便复习.防止混淆概念.如有错误,指正即可,勿喷谢谢.虽然是个菜鸟但也要努力提升自己 2017年PointNet 平移不变性如何获得?靠TNet,类比点的...

【自动驾驶仿真测试场景】

作者：胡说出品：汽车电子与软件本文内容主要围绕自动驾驶汽车测试场景的内涵、作用、尺度、视角以及数据来源等方面进行了详细阐述。 01. 场景要素和场景分类在进行测试场景构建时，首先需要明确测试场景...

carla自动驾驶模型（带车道线检测）

carla自动驾驶模型（带车道线检测）平台搭建： ①python3.5（点击下载）提取码：pt7q ②carla0.8.2（点击下载）提取码：q77e ③RLCARLA项目（点击下载）提取码：...

自动驾驶仿真场景 ud

暂无描述

基于改进YOLOv5s的面向自动驾驶场景的道路目标检测算法

摘要:在复杂道路场景中检测车辆、行人、自行车等目标时，存在因多尺度目标及部分遮挡易造成漏检及误检等情况，提出一种基于改进YOLOv5s的面向自动驾驶场景的道路目标检测算法。首先，利用深度可分离卷积替换...

为驾驶安全护航，基于目标检测模型实现驾驶疲劳检测

驾驶疲劳一直都是驾驶安全的重要影响因素，对于长时间驾驶车辆的驾驶员来说需要及时的休息以避免出现安全问题，但是实际生活中，因为各种各样的影响因素的存在，很多疲劳驾驶的行为依旧存在，如何有效及时地发现潜在...

基于Deeplabv3模型实现自动驾驶车辆的实时对象检测

团队名称 Intel启动队问题陈述使用计算机视觉技术和英特尔®AI分析工具套件为自动驾驶车辆开发实时对象检测模型。参赛团队需要创建一个深度学习模型，用于准确检测行人、车辆、交通标志和交通信号等对象...

一文读懂自动驾驶仿真测试场景与场景库

引言据美国兰德公司研究：从统计学角度出发，自动驾驶汽车需要在真实或者虚拟环境中至少进行110亿英里的里程测试，才能证明自动驾驶系统比人类驾驶员更可靠；然而，基于里程的测试方法具有测试周期长、效率低、...

【论文笔记】：YOLOv8-QSD 自动驾驶场景小目标检测算法

摘要 YOLOv8QSD网络是一种新型的无锚点驾驶场景检测网络，建立在YOLOv8的基础上，在保证检测精度的同时保持效率。该网络的骨干网采用结构重参数化技术来转换基于多样化分支块（DBB）的模型。

是否确定退出登录?

基于Vgg-Unet模型自动驾驶场景检测

1.VGG

2.Unet模型：

全部评论 (0)

相关文章推荐

基于Vgg-Unet模型自动驾驶场景检测

3D 点云检测 自动驾驶场景

【自动驾驶仿真测试场景】

carla自动驾驶模型（带车道线检测）

自动驾驶仿真场景 ud

基于改进YOLOv5s的面向自动驾驶场景的道路目标检测算法

为驾驶安全护航，基于目标检测模型实现驾驶疲劳检测

基于Deeplabv3模型实现自动驾驶车辆的实时对象检测

一文读懂自动驾驶仿真测试场景与场景库

【论文笔记】：YOLOv8-QSD 自动驾驶场景小目标检测算法

3D 点云检测自动驾驶场景