訂閱
糾錯
加入自媒體

嫌棄ChatGPT數(shù)學太差,學而思曝自研數(shù)學大模型!

ChatGPT數(shù)學太差了,數(shù)學AI還得看學而思!

 嫌棄ChatGPT數(shù)學太差,學而思曝自研數(shù)學大模型!

跟自帶流量出道即巔峰的選秀新星一樣,ChatGPT一誕生就被全世界追捧,被競相效仿。誰都想借著這股東風,扶搖直上。各大科技公司聞風而動,陸續(xù)推出了相近的LLMs(大語言模型),一方面不愿甘居人后,錯過風口;一方面博出位,以便推動他們各自的核心業(yè)務。逐漸地,各行各業(yè)都開始參與其中。

現(xiàn)在輪到教育行業(yè)了!5月5日的消息,學而思正在進行自研數(shù)學大模型的開發(fā)工作,他們把這個數(shù)學大模型叫做MathGPT。MathGPT主攻數(shù)學領域的解題和講題算法,主要面向全球數(shù)學愛好者和科研機構。

據(jù)學而思透露,MathGPT為公司核心項目,由CTO田密負責。今年春節(jié)前,已啟動相應的團隊建設、數(shù)據(jù)、算力準備和技術研發(fā),目前已取得階段性成果。此外,還將成立一支海外算法和工程團隊,在全球范圍內(nèi)招募優(yōu)秀的人工智能專家加入。

類ChatGPT們數(shù)學太差,學而思只好出手

像雨后春筍般涌現(xiàn)的大語言模型,在語言翻譯、摘要、理解和生成等任務上都有了接近“人”的水平,甚至有些地方比人的水平更高。

但是,唯獨在數(shù)學這塊上,無論是強如GPT—4、Bingchat,還是更年輕的文心一言、天工、式說3.0,或者是基于LLaMA開源而來的各類LLMs都表現(xiàn)得像智力“未開化”一樣。簡單的數(shù)學問題能答,稍微復雜一點就會自己把自己繞暈。有些題能做出正確答案,但是解題過程讓人看得一頭霧水。

 嫌棄ChatGPT數(shù)學太差,學而思曝自研數(shù)學大模型!

更別說什么幾何代數(shù)、線性代數(shù)了,難為AI嘛這不是!用學而思的話來說,“通用語言模型更像一個‘文科生’”。

“這種不足是由LLM的自身特點決定的!睂W而思AI團隊負責人介紹,LLM來自對海量語言文本的訓練,因此最擅長語言處理。行業(yè)內(nèi)偏向基于LLM大模型做閱讀、寫作類應用,但如果想要在數(shù)學能力上有突破,就需要研發(fā)新的大模型。

學而思希望通過MathGPT彌補和攻克大語言模型的三個問題:第一,題目要解對,現(xiàn)在GPT結(jié)果經(jīng)常出現(xiàn)錯誤;第二,解題步驟要穩(wěn)定、清晰,現(xiàn)在GPT的解題步驟每次都不一樣,而且生成內(nèi)容經(jīng)常很冗余;第三,解題要講的有趣、個性化,現(xiàn)在GPT的解釋過于“學術”和機械,對孩子的學習體驗很不友好。

謀而后動。學而思能有這樣的底氣,一方面因為他們“靠數(shù)學起家”,另一方面由于他們在AI領域布局良久。早在2017年,學而思便成立了AI lab 人工智能實驗室。到目前為止,學而思已有20年的數(shù)學教學經(jīng)驗,積累了龐大的數(shù)學相關數(shù)據(jù),用來訓練數(shù)學模型水到渠成。

大勢所趨,教育行業(yè)擁抱AI

近日,美國在線教育龍頭Chegg股價幾近“腰斬”,暴跌50%!只是因為該公司CEO在不久前的財報電話會議上承認,“ChatGPT正開始從在線學習平臺Chegg手中奪取市場份額”。據(jù)統(tǒng)計,今年3月以來,學生對ChatGPT的興趣大增,對Chegg的產(chǎn)品興趣則減少。

而就在今年3月,Chegg宣布推出自己的人工智能聊天機器人CheggMate,由OpenAI最新、最先進的人工智能模型GPT-4支持。CheggMate可以隨時隨地回答學生的問題,且能保證準確性;還能針對不同的學生提供相應的測試。此外,CheggMate還可以跟學生交互,學生可以不斷追問,它會給出相應的解釋。

 嫌棄ChatGPT數(shù)學太差,學而思曝自研數(shù)學大模型!

除了Chegg,同為教育領域的美國在線教育公司多鄰國(Duolingo)、可汗學院、Speak在此之前已經(jīng)宣布接入OpenAI GPT—4,用以提升用戶體驗和提高教學工作效率以及學習效果。

2月份的時候,網(wǎng)易有道開始了AIGC(AI Generated Content人工智能自動生成內(nèi)容)在教育場景的落地研發(fā)工作。在學而思宣布MathGPT的同一天,網(wǎng)易有道也公布了基于“子曰”大模型開發(fā)的AI口語老師相關視頻。據(jù)介紹,“子曰”為該網(wǎng)易有道自研的教育場景下的類ChatGPT模型,基于其研發(fā)的AI口語老師不同于以往機械發(fā)音的AI,其發(fā)音更像一個真實的老師。

在今天舉行的訊飛星火認知大模型成果發(fā)布會上,科大訊飛正式宣布推出“訊飛星火認知大模型”?拼笥嶏w董事長劉慶峰表示,星火認知大模型在多題型可解析數(shù)學能力上已領先ChatGPT。同時,推出首款搭載星火大模型的AI學習機T20pro。

 嫌棄ChatGPT數(shù)學太差,學而思曝自研數(shù)學大模型!

還有鉛筆、金太陽、高途等教育相關企業(yè)投入AI研發(fā)和運用。

相比較之下,學而思選擇的道路和其他人有所不同,不基于現(xiàn)有LLM做微調(diào)和接口調(diào)用、不做通用LLM,而是自研基于專業(yè)領域的“數(shù)學大模型”MathGPT。而MathGPT較之其他的路徑孰優(yōu)孰劣,還是要看落地后的實際應用。

教育行業(yè)基于AI,開始了新一輪的改變和進化。教育行為中人和AI的關系也進入到了一個全新的階段,AI能不能最終滿足教育行業(yè)的殷切期盼,還有待時間驗證。

聲明: 本網(wǎng)站所刊載信息,不代表OFweek觀點?帽菊靖寮,務經(jīng)書面授權。未經(jīng)授權禁止轉(zhuǎn)載、摘編、復制、翻譯及建立鏡像,違者將依法追究法律責任。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    掃碼關注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號