結(jié)合Segformer與增強(qiáng)特征金字塔的文本檢測(cè)方法
摘要: 針對(duì)自然場(chǎng)景文本檢測(cè)算法中的小尺度文本漏檢、類文本像素誤檢以及邊緣定位不準(zhǔn)確的問(wèn)題,提出一種基于Segformer和增強(qiáng)特征金字塔的文本檢測(cè)模型。該模型首先采用基于混合Transformer (mix Transformer, MiT)的編碼器生成多尺度特征圖;然后,在具有特征金字塔結(jié)構(gòu)解碼器的上采樣部分,提出級(jí)聯(lián)融合注意力模塊,通過(guò)全局平均池化、全局最大池化和Ghost模塊獲... (共15頁(yè))
開(kāi)通會(huì)員,享受整站包年服務(wù)