訂閱
糾錯
加入自媒體

“搜狗聽寫”有何“殺手锏”?走近搜狗的人工智能戰(zhàn)略

就在一周前搜狗宣布赴美上市計劃的那天,搜狗公司CEO王小川在員工內部信中寫了這樣一句話:“已經沒有人會懷疑搜狗的生存問題了,唯一的懸念是搜狗是否能在搜索領域實現顛覆,是否能在人工智能領域引領重大的創(chuàng)新!币粫r間,王小川的“懸念”成為看點——8月8日,搜狗正式迎來了第一款語音技術產品“搜狗聽寫”。

語音實時轉文字背后有深度學習技術

搜狗聽寫的定位是“文字工作者的速記工具”。針對寫文章、采訪錄音、會議記錄、筆記整理 、日常記事等場景,以實現高效記錄和信息輸入。

搜狗聽寫最亮眼的功能在于“聽寫”和“轉寫”兩種模式!奥爩憽蹦J较,錄音的同時可以實時識別結果;而“轉寫”模式下則可以離線錄音,錄音完成后一次性獲取文字結果。

“搜狗聽寫”有何“殺手锏”?走近搜狗的人工智能戰(zhàn)略

除此之外還有諸如支持手機邊聽邊改、無線標重點(藍牙打點)、多客戶端同步、信息分享、摘要、斷點續(xù)錄等人性化功能,另外,針對圖書館、咖啡廳等安靜場所,搜狗聽寫提供耳語識別技術——人說話音量低至30分貝時,依然可以準確識別。

被牛露云稱作“大殺器”的一個功能,是搜狗聽寫與搜狗輸入法的個人詞庫已經打通,可以視為媒體撰稿人之間文字互通的功能。

“搜狗聽寫”有何“殺手锏”?走近搜狗的人工智能戰(zhàn)略

關于下載,搜狗聽寫除了支持Android、ios版本之外,還開發(fā)了Windows版,Windows版特別針對會議場景,觀眾可以直接看到會議演講者的實時字幕,字幕可能是直接文字的轉寫結果,也有可能是雙語、多語對照結果,觀眾甚至可以直接掃碼獲取當天的錄音和文本結果。

這樣一款語音識別產品,實際上是基于深度學習技術,以提升復雜場景識別效果。

說到深度學習,離不開三要素:有沒有大數據,有沒有好的深度學習算法,以及能不能讓深度學習算法在深度學習平臺上高效運轉。

搜狗語音交互中心技術總監(jiān)陳偉介紹,“搜狗輸入法每天語音識別的PV是2.6億次,產生的語料規(guī)模是22萬小時!标P于算法,搜狗早期較多使用深度神經網絡,隨后嘗試了CN算法、LSTM的算法,現在轉為CN+LSTM+DN的端到端的算法,可以更高效,準確率更高。

有了數據+算法,接下來就是運算,如何高效的給出模型以快速部署到線上,關鍵在于搜狗的深度學習平臺!拔覀兛梢栽谧杂械纳疃葘W習平臺上調動上百塊算卡,快速的給出模型!标悅フf。

實際上,目前市場上已有一些同類型的產品,例如科大訊發(fā)早期推出的訊飛聽見等,相比之下,搜狗是否存在優(yōu)勢呢?搜狗語音交互中心負責人王硯峰表示:

第一,訊飛對應的產品,如訊飛聽見、訊飛錄音寶等,是不能支持長時間錄音、并且免費轉寫的。而搜狗是首次做了長時錄音設置,并且支持免費轉寫。

第二,搜狗的產品是面向垂直場景,包括記者采訪的場景、作家寫作的場景等等。這些功能雖小,但它體現在具體場景下,怎么絞盡腦汁的想盡辦法,幫朋友解決問題。

第三,搜狗聽寫支持手機端和windows,還有語音實時轉文字、邊聽邊改、標重點、快速查找、多端同步、不限時長錄音等功能。

此外,依托搜狗日均超過2.6億次的語音請求,提供海量的真實語料數據,可以使得機器不斷學習,不斷提升識別準確率,可應用的場景也越來越廣泛。

但對于搜狗轉寫免費會持續(xù)多長時間這個問題,王硯峰表示,目前肯定是免費的,至于之后會不會收費,并不完全確定。至少按照現有的產品形態(tài),肯定是在相當長的時間內不考慮使用這個產品來賺錢。作為一家互聯網公司,通過技術來收取技術服務費不是搜狗的商業(yè)邏輯。至少到現在為止,搜狗還不想通過產品收費的方式來進行商業(yè)變現。

“搜狗聽寫”有何“殺手锏”?走近搜狗的人工智能戰(zhàn)略

搜狗語音交互中心負責人王硯峰

1  2  下一頁>  
聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號