超碰97亚洲日韩国产,pornhub欧美在线观看

<nav id="ec0e5"><strike id="ec0e5"></strike></nav>

當(dāng)前位置： OFweek 人工智能網(wǎng) > 正文

寫在「文心一言」發(fā)布前夕

2023-03-16 10:10

比當(dāng)然可以比，有什么不能比的。

文 / 書航 2023.3.15

這篇寫得非常急，因?yàn)檫^了 12 點(diǎn)還不推送，這些預(yù)測(cè)就發(fā)不出去了。但此前我一直打聽多方消息，到了這個(gè)時(shí)候，感覺把它們整理出來還是對(duì)大家有點(diǎn)用處。

百度從官宣有「文心一言」這么個(gè)東西到發(fā)布成品用了一個(gè)月多一點(diǎn)，這件事本身并不稀奇。因?yàn)槲男囊谎院臀男拇竽Ｐ偷年P(guān)系就是 ChatGPT 和 GPT-3 的關(guān)系。

百度的大模型已經(jīng)訓(xùn)練很久了，做個(gè)前端應(yīng)用出來沒那么難。相信這一個(gè)月的時(shí)間里，絕大部分都是用在談商務(wù)合作，找人宣傳，內(nèi)部測(cè)試各種刁鉆古怪的用例，以及找 bug 上面。

百度的工具箱里不只有文心大模型，還有支撐它的底層技術(shù)，包括它使用自研芯片來訓(xùn)練。BAT 均宣布了自研芯片用于內(nèi)部訓(xùn)練，百度對(duì)外宣布的「昆侖」已經(jīng)到第二代，采用 7nm 制程，同時(shí)也強(qiáng)調(diào)通用性。而第三代會(huì)在明年部署。

盡管百度也會(huì)將自己的各個(gè)模塊比如芯片層、框架層和模型層等分別拓展其對(duì)外兼容性和開發(fā)者生態(tài)，但它依然認(rèn)為，都是自己家的東西協(xié)同起來，效果肯定好于一堆通用的方案拼起來的（我們倒是可以將華為的5G技術(shù)和OpenRAN陣營(yíng)，或者x86、ARM陣營(yíng)和RISC-V陣營(yíng)之間的比較，作為這個(gè)觀點(diǎn)的證據(jù)）。

今天 GPT-4 就發(fā)布了，但非常值得注意的是 OpenAI 這一次公布的技術(shù)細(xì)節(jié)少之又少，跟以前作為慷慨的服務(wù)于全人類的非盈利研究機(jī)構(gòu)的感覺大不一樣。這也說明如果某個(gè)東西真的是好東西，制作它的人不可能太慷慨。

所有人都在注視「中國(guó)的 ChatGPT」，放眼全球似乎也只有中國(guó)有機(jī)會(huì)在現(xiàn)在的時(shí)間點(diǎn)做出美國(guó)公司之外開發(fā)的競(jìng)品。能做出來有這個(gè)東西，跟這東西是不是一樣的品質(zhì)，是兩個(gè)不同的問題。

復(fù)旦做的 MOSS 發(fā)布倒是最早，但被罵的很慘。當(dāng)然作為學(xué)術(shù)實(shí)驗(yàn)項(xiàng)目，口碑不與未來的應(yīng)用前景關(guān)聯(lián)，所以可能不是最重要的東西。真正要出產(chǎn)品的公司，其實(shí)都在猛打預(yù)防針，不斷降低國(guó)內(nèi)外關(guān)注者的心理預(yù)期。具體地說，就是先肯定自己現(xiàn)在一定是做不出 ChatGPT 這么好的效果，會(huì)出更多問題，會(huì)更笨拙。

比如，小冰前陣子說的「小冰鏈」的說辭是，在全功能但高成本、低效率的大模型中，拆出一部分可以快速商用的做成產(chǎn)品，可能加上一些人工調(diào)優(yōu)，會(huì)比當(dāng)前的小冰模型更勝任聊天機(jī)器人等角色。即使不考慮類 GPT 的技術(shù)，小冰此前也自主實(shí)現(xiàn)了其中一些用例，比如文章、圖片、視頻的生成，以及盡可能的多輪對(duì)話。這些已經(jīng)做出來的東西，其實(shí)也沒必要扔掉，反正外面看來都是在同一個(gè)黑箱里面。

那么，百度可能會(huì)怎樣說呢？如果我們?yōu)g覽百度的工具箱，可以發(fā)現(xiàn)除了芯片和全技術(shù)棧之外，還有一個(gè)東西很可能被忽略：知識(shí)圖譜。

目前我們知道的百度知識(shí)圖譜最新數(shù)據(jù)來自 2020 年，具體表述是「百度打造了世界上最大的多源異構(gòu)知識(shí)圖譜，擁有超過 50 億實(shí)體和 5500 億事實(shí)，并在不斷演進(jìn)和更新，每天的調(diào)用次數(shù)超過 400 億次」。

在深度學(xué)習(xí)突飛猛進(jìn)的同時(shí)，知識(shí)圖譜似乎已經(jīng)被人遺忘，也長(zhǎng)久沒有進(jìn)展。然而此前一直有很多 AI 研究人員相信直接建立實(shí)體與事件的對(duì)應(yīng)關(guān)系，是讓「黑箱」變白，讓 AI 決策過程透明化的關(guān)鍵。當(dāng)然我們知道，截至目前這并沒有發(fā)生。

主要問題是建立知識(shí)圖譜的過程太讓人抓狂了。如果部分采用機(jī)器生成，那就可能產(chǎn)生錯(cuò)誤的對(duì)應(yīng)關(guān)系——就像百度有時(shí)候會(huì)在搜索框下面提取出的讓人啼笑皆非的「答案」。（谷歌也這樣。一個(gè)著名的例子是它把研究殺滅 WannaCry 勒索病毒的科學(xué)家標(biāo)注為了該病毒的作者。）

如果用人工來梳理——開什么玩笑，是吧？

但是現(xiàn)在，假設(shè) GPT 及同類技術(shù)可以產(chǎn)出符合倫理規(guī)范，符合邏輯，而且正確率高于商業(yè)應(yīng)用所需要的閾值的答案，那么這部分人類打標(biāo)簽的工作，包括標(biāo)記知識(shí)圖譜，以及清洗深度學(xué)習(xí)語料等工作，如果可以讓成熟的 GPT 自己內(nèi)循環(huán)的話，就不再是看起來不可能的任務(wù)了。

所以，即使中文的優(yōu)質(zhì)語料沒有英文那么多，也有可能通過成熟的 GPT 們代替人工清理過往的素材，核對(duì)和搭建知識(shí)圖譜，再喂進(jìn)去實(shí)現(xiàn)自我增強(qiáng)。當(dāng)然，這只是一種理論上的假設(shè)。

實(shí)際上，不論是否將知識(shí)圖譜，或其它現(xiàn)有資源融入文心大模型，現(xiàn)在我們已知它的問題就不算少了。在「文心一格」也就是畫圖應(yīng)用中，經(jīng)常出現(xiàn) prompt 不能正確認(rèn)知的情況，我或許可以在明天摸到「文心一言」的時(shí)候一起舉例說明。

但是，一個(gè)可能證明了他們將知識(shí)圖譜引入大模型的例子，是文心一格可以正確了解「米線」「佛跳墻」這些中國(guó)菜肴，它們翻譯過后可能產(chǎn)生歧義。相信百度會(huì)特別用力宣傳這方面的例子，因?yàn)樗鼈儎偝闪r(shí)侯的宣傳語就是「更懂中文」。

為了揚(yáng)長(zhǎng)避短，避免在算力上正面交鋒，以上各種說法都是為了挽救一部分需要訓(xùn)練才能涌現(xiàn)的能力。涌現(xiàn)能力是 all or nothing，跟 ChatGPT 比了不行是意料之中的，如果有地方勝出，那就是意外收獲嘛。

國(guó)產(chǎn)目前就是從 me too 到 me better 的階段，比當(dāng)然可以比，MOSS 都可以比，有什么不能比的。這就是明天我們面對(duì)「文心一言」時(shí)候應(yīng)有的正確預(yù)期。

原文標(biāo)題 : 寫在「文心一言」發(fā)布前夕

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號(hào)的作者撰寫，觀點(diǎn)僅代表作者本人，不代表OFweek立場(chǎng)。如有侵權(quán)或其他問題，請(qǐng)聯(lián)系舉報(bào)。

發(fā)表評(píng)論

共0條評(píng)論，0人參與

登錄登錄即可訪問所有OFweek服務(wù)

用戶名/郵箱/手機(jī)：
密碼：
忘記密碼？
用其他賬號(hào)登錄： QQ | 微信 | 新浪微博

請(qǐng)輸入評(píng)論內(nèi)容...

請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字

暫無評(píng)論

暫無評(píng)論

圖片新聞

最新發(fā)布

最新活動(dòng)更多

即日-6.16
立即報(bào)名>> 【在線會(huì)議】Solution Talks |Computex 2025關(guān)鍵趨勢(shì)深讀
6月20日
立即下載>> 【白皮書】精準(zhǔn)測(cè)量安全高效——福祿克光伏行業(yè)解決方案
7月3日
立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
7月22-29日
立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
7.30-8.1
火熱報(bào)名中>> 全數(shù)會(huì)2025（第六屆）機(jī)器人及智能工廠展
7月31日
免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)

一周熱點(diǎn) 月點(diǎn)擊榜

企業(yè)服務(wù) 廣告服務(wù) 獵頭服務(wù) 薪酬報(bào)告

人工智能獵頭職位更多

掃碼關(guān)注公眾號(hào)
OFweek人工智能網(wǎng)
獲取更多精彩內(nèi)容

文章糾錯(cuò)

x

_*文字標(biāo)題：

_*糾錯(cuò)內(nèi)容：

聯(lián)系郵箱：

_*驗(yàn) 證碼：

看不清，點(diǎn)擊換一張

粵公網(wǎng)安備 44030502002758號(hào)

感谢您访问我们的网站，您可能还对以下资源感兴趣：

99久久免费精品国产对白

中文字字幕在线中文乱码6互动交流久久久性爱视频性久久久久美女黄免费 97久久精品人人

<style id="53wq0"><tfoot id="53wq0"><font id="53wq0"></font></tfoot></style><style id="53wq0"></style>

<fieldset id="53wq0"></fieldset>