97精品全国免费观看视频,久久久久久亚AV无码专区,高清黄色大片

當前位置： OFweek 人工智能網(wǎng) > 計算機視覺 > 正文

什么是NLP？NLP的兩個核心任務是什么？

2021-01-06 10:31

金翅創(chuàng)客

關注

如上圖所示，左邊的圖是直接使用Faster RCNN中的RPN來進行候選框提取，可以看出，這種候選框太粗糙了，效果并不好。而右圖是使用CTPN＋RNN進行候選框提取，利用許多小候選框來合并成一個大文本預測框，可以看出這個算法的效果非常不錯。

當然，CTPN也有一個很明顯的缺點：對于非水平的文本的檢測效果并不好。

3、SegLink

SegLink（CTPN＋SSD）：通常用于自然場景下，檢測多角度文本。

【文獻】Detecting Oriented Text in Natural Images by Linking Segments

上圖的綠色框的檢測效果才是我們的終極目標。那么怎么基于原來經(jīng)典的目標檢測算法做相應的優(yōu)化以適應這種檢測效果的要求呢？

SegLink采取了一個思路那就是：讓模型再學習一個參數(shù)θ，這個θ表示文本框的旋轉角度，也就是我們最終要回歸的參數(shù)從原來的（x，y，w，h）變成（x，y，w，h，θ）。除此之外，SegLink還提出了Segment和Linking兩個重要概念。

Segment可理解為文本行的任意一部分，一個完整的文本行中包含多個segment（上圖黃色框）。每個segment用link（上圖綠色線）連接組合起來。

4、EAST

EAST：采取FCN思路，做特征提取和特征融合，局部感知NMS階段完成檢測。網(wǎng)絡的簡潔使得檢測準確率和速度都有進一步提升。（針對自然場景下使用較多）。

【文獻】EAST： An Efficient and Accurate Scene Text Detector

通過上圖我們知道，一個文本檢測有多個階段，EAST的作者認為，一個文本檢測算法被拆分成多個階段其實并沒有太多好處，實現(xiàn)真正端到端的文本檢測網(wǎng)絡才是正確之舉。所以EAST的pipeline相當優(yōu)雅，只分為FCN生成文本行參數(shù)階段和局部感知NMS階段，網(wǎng)絡的簡潔是的檢測的準確性和速度都有了進一步的提高。

EAST網(wǎng)絡分為特征提取層＋特征融合層＋輸出層三大部分。EAST就是借助FCN架構直接回歸出文本行的（x，y，w，h，θ）＋置信度＋四邊形的四個坐標！非常簡潔！當然還有其他檢測算法，這里就不一一介紹啦。

學習鏈接：

https：／／www．cnblogs．com／skyfsm／p／9776611．html

04

自然場景文本識別

1、CNN＋RNN＋CTC（如CRNN）：使用目前最為廣泛的一種文本識別框架。需要自己構建字詞庫（包含常用字、各類字符等）。

【文獻】An End－to－End Trainable Neural Network for Image－based Sequence Recognition and Its Application to Scene Text Recognition

【講解及優(yōu)化】

https：／／blog．csdn．net／qq＿14845119／article／details／78934334

【開源代碼】

https：／／github．com／solivr／tf－crnn

學習鏈接：