5個(gè)方向,測(cè)試文心一言和chatGPT的不同
3月16日,百度如約發(fā)布了對(duì)標(biāo)chatGPT的中文版「文心一言」。
百度是國(guó)內(nèi)乃至全球大廠中第一個(gè)發(fā)布大語(yǔ)言模型的公司,但同時(shí)李彥宏也承認(rèn),內(nèi)測(cè)體驗(yàn)并不完美,但他表示文心一言的進(jìn)步空間很大。
總的來(lái)說(shuō),整場(chǎng)發(fā)布會(huì)雖然沒有透露更多內(nèi)容,也沒有面向個(gè)人用戶開放,但百度還是表達(dá)了自己的核心觀點(diǎn):介紹能力、承認(rèn)差距、展望未來(lái)。
而發(fā)布會(huì)后,百度也開放了內(nèi)測(cè)權(quán)限,我們?cè)谀玫綑?quán)限后第一時(shí)間與chatGPT做了對(duì)比,看看它們有什么不同。
因?yàn)橹饕獪y(cè)試對(duì)象是文心一言,所以這些問題基本都圍繞百度發(fā)布會(huì)上透露的五個(gè)方向:文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解和多模態(tài)生成。
1 文學(xué)創(chuàng)作
從用詞上來(lái)看,文心一言和chatGPT開頭的場(chǎng)景描寫幾乎一模一樣。但整首詩(shī)的風(fēng)格卻不同,文心一言自始至終都是壓抑的、悲觀的,chatGPT卻給了一個(gè)堅(jiān)定且有希望的ending。
古詩(shī)創(chuàng)作文心一言上來(lái)就copy了一首家喻戶曉的詩(shī)詞。chatGPT的回答更標(biāo)準(zhǔn),也作了詩(shī)名。
在故事創(chuàng)作上,文心一言似乎有些不合邏輯,人被貓咬了卻把貓抱到了醫(yī)院,直接忽略了人。且結(jié)尾也有些胡言亂語(yǔ),一邊不能忘記湯姆帶來(lái)的恐懼和不安,又要給它建造紀(jì)念碑,視為英雄?
chatGPT的故事似乎更有邏輯性,也更符合我的恐怖要求。
2 商業(yè)文案創(chuàng)作
在商業(yè)文案創(chuàng)作上,文心一言給出的答案更符合我的要求和想法,chatGPT的答案相對(duì)啰嗦。
這一個(gè)則是文心一言完勝,chatGPT不僅用英文回答,而且還搞錯(cuò)了品牌,將悅刻翻譯為YOOZ。
這段開場(chǎng)白文心一言更符合我的需求和想法,chatGPT似乎搞錯(cuò)了對(duì)象。
3 數(shù)理推算
這是一道小學(xué)奧數(shù)題,也難住了文心一言和chatGPT。文心一言直接擺爛,回答的內(nèi)容里有錯(cuò)誤代碼;chatGPT則是一本正經(jīng)的胡說(shuō)八道,看似步驟很多在一步步解題,實(shí)際上最后的答案也是錯(cuò)的。
第二個(gè)問題是一道從網(wǎng)上down下來(lái)的騰訊面試題,文心一言顯然沒有讀懂題意,最后的答案完全風(fēng)馬牛不相及。chatGPT的回答看似步驟合理,但最后的結(jié)果卻是錯(cuò)的。
4 中文理解
一段《三體》中的摘抄,我更喜歡chatGPT的回答,不僅描述片段的大意,還給出了反問。文心一言的答案貌似偏離了題意。
一個(gè)來(lái)自趙本山小品的梗,都沒有理解。
5 多模態(tài)生成
因?yàn)閏hatGPT還不具備圖片生成能力,所以只能用文字描述。
總結(jié):
從上述問題的答案來(lái)看,文心一言和chatGPT都不完美。
最直觀的差距,應(yīng)該說(shuō)是一種感覺。明明知道兩個(gè)都是機(jī)器人,但chatGPT給我一種更像人的感覺。文心一言的優(yōu)勢(shì),似乎更商業(yè)化一些,在商業(yè)文案創(chuàng)作上完勝chatGPT,這可能是未來(lái)全量開放后,被調(diào)用最多的一個(gè)功能。
在測(cè)試之后我還試著問了一些帶有價(jià)值觀看法的問題,chatGPT會(huì)表示自己是AI語(yǔ)言模型,不能夠道德判斷或?qū)(gè)人行為做出價(jià)值評(píng)估。
更大范圍的感觸并不是具體的產(chǎn)品差異,而是背后的技術(shù)差距。百度也承認(rèn)差距的存在,也就意味著我們還有時(shí)間來(lái)做完善。
但至少?gòu)?到1的突破我們做到了,從1到100就繼續(xù)努力吧。
以上是我們向文心一言和chatGPT提出的問題,考慮到文心一言目前尚在小范圍內(nèi)測(cè),如果你有想問的問題,歡迎留言,我們幫你問。
原文標(biāo)題 : 圍繞5個(gè)大方向,我們測(cè)試了文心一言和chatGPT的不同

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
6月20日立即下載>> 【白皮書】精準(zhǔn)測(cè)量 安全高效——福祿克光伏行業(yè)解決方案
-
7月3日立即報(bào)名>> 【在線會(huì)議】英飛凌新一代智能照明方案賦能綠色建筑與工業(yè)互聯(lián)
-
7月22-29日立即報(bào)名>> 【線下論壇】第三屆安富利汽車生態(tài)圈峰會(huì)
-
7.30-8.1火熱報(bào)名中>> 全數(shù)會(huì)2025(第六屆)機(jī)器人及智能工廠展
-
7月31日免費(fèi)預(yù)約>> OFweek 2025具身機(jī)器人動(dòng)力電池技術(shù)應(yīng)用大會(huì)
-
免費(fèi)參會(huì)立即報(bào)名>> 7月30日- 8月1日 2025全數(shù)會(huì)工業(yè)芯片與傳感儀表展
推薦專題
- 1 AI 眼鏡讓百萬(wàn) APP「集體失業(yè)」?
- 2 大廠紛紛入局,百度、阿里、字節(jié)搶奪Agent話語(yǔ)權(quán)
- 3 深度報(bào)告|中國(guó)AI產(chǎn)業(yè)正在崛起成全球力量,市場(chǎng)潛力和關(guān)鍵挑戰(zhàn)有哪些?
- 4 上海跑出80億超級(jí)獨(dú)角獸:獲上市公司戰(zhàn)投,干人形機(jī)器人
- 5 國(guó)家數(shù)據(jù)局局長(zhǎng)劉烈宏調(diào)研格創(chuàng)東智
- 6 下一代入口之戰(zhàn):大廠為何紛紛押注智能體?
- 7 百億AI芯片訂單,瘋狂傾銷中東?
- 8 Robotaxi新消息密集釋放,量產(chǎn)元年誰(shuí)在領(lǐng)跑?
- 9 格斗大賽出圈!人形機(jī)器人致命短板曝光:頭腦過于簡(jiǎn)單
- 10 一文看懂視覺語(yǔ)言動(dòng)作模型(VLA)及其應(yīng)用