政府 網(wǎng)站建設(shè)方案推廣產(chǎn)品
AVOD理解
4:RPN->Fusion
RPN:
從RPN得到的輸出top_anchors,ground_plane,class_label等作為AVOD檢測部分網(wǎng)絡(luò)的輸入.將top_anchors投影到BEV面,得到其的坐標(biāo)(x1,z1,x2,z2),再交換坐標(biāo)為(z1,x1,z2,x2);讀取圖像上的2D框的信息.根據(jù)原始的feature map選擇mask確定輸入
ROI_pooling:
根據(jù)初始的feature map以及RPN后的top_anchors信息,進(jìn)行crop_and_resize,生成7*7的bev_rois,img_rois
Fusion
融合網(wǎng)絡(luò)被與后面的全連接網(wǎng)絡(luò)放到了一起.
5:Fusion->fully connection
Layers:
根據(jù)config文件,設(shè)置layers,輸入bev_rois, img_rois, input_weights(bev_mask,img_mask),class,top_anchors.
Fully connection
代碼全連接部分.
Output:
Classification:預(yù)測的分類,背景/車
**Offsets:**10個回歸值,3D-boxes的底面的四個坐標(biāo)(不涉及高度)以及代表高度的兩個h.一個是地面與地平面的距離,一個是頂面