作者|yy
(資料圖片)
來源|極果編輯部
2023年開年,ChatGPT一夜爆紅,從橫空出世到月活破億僅2個多月,成功晉級為一款全球現(xiàn)象級應用。
ChatGPT的大火讓科技巨頭們開始“慌了”,谷歌已經在著手打造自家的新聊天機器人“Bard”,微軟更是直接發(fā)布了集成了 ChatGPT的新版Bing(必應)搜索引擎...
而“中國版ChatGPT”爭奪戰(zhàn)也即將打響,目前已經有百度、科大訊飛、京東、阿里等無數(shù)巨頭企業(yè)宣布要發(fā)布同類產品,但一直還未正式“上鏈接”。
沒想到真正第一個出產品和公測鏈接的,是復旦團隊。
2 月 20 日晚,復旦大學自然語言處理實驗室發(fā)布了具備 ChatGPT 能力的語言模型 ——MOSS,并面向大眾公開邀請內測。
話說MOSS的名稱還和電影《流浪地球》中的智能AI撞名了,這波夢幻聯(lián)動做得很到位。
網友還進行了一番調侃:這個時候,它只配叫550A。
電影里的MOSS有量子計算機加持,而現(xiàn)實這個沒有,所以在昨日上線后,由于瞬時訪問壓力過大,不到24小時MOSS服務器當晚被網友擠爆了。
復旦MOSS團隊當即表示:MOSS還是一個非常不成熟的模型,距離ChatGPT還有很長的路需要走。團隊初的想法只是想將MOSS進行內測,沒有想到會引起這么大的關注。
并且由于計算資源不足,也沒有相關的工程經驗,造成了非常不好的體驗和第一印象,向大家致歉。在完成初步的驗證之后,MOSS會將的經驗、代碼、模型參數(shù)開源出來供大家參考。
那么在ChatGPT如此爆火的前提下,MOSS究竟拿得出手嗎?
整體來看,MOSS 的基礎功能與 ChatGPT 類似,可以按照用戶輸入的指令完成各類自然語言處理任務,能完成包括聊天、文本生成、翻譯、代碼生成等功能。
而且在預覽期間,MOSS 的使用是完全免費的。
至于實力如何,咱們先看對話測試。
提問:一些人覺得,人工智能將取代很多人的工作,你覺得呢?
而MOSS回答比較中規(guī)中矩,簡而言之就是:AI可以使人類的工作更加高效,但它不會完全取代人類。
接著提問:對于上海如何更好地發(fā)展人工智能產業(yè),你有什么建議?
MOSS的回答按條梳理很有邏輯性,沒有亂說一氣,但內容上還是很“官方套話”的感覺。
在演示時,用戶還用英文輸入多個指令,進一步展示了MOSS多輪交互、表格生成、代碼生成和解釋能力。
“告訴我5部科幻電影?!薄吧梢粡堈故具@5部電影和導演的表格。”“增加一列表格,顯示這些電影上映的時間?!痹谶@個包含表格生成的多輪交互中,MOSS順利完成了任務。
不過這里注意下,MOSS在推薦的第五部電影《她》的回答上并不正確。
根據MOSS回答,翻譯過來“她”(2013年)這部電影講述了一位年輕女子與她的心理健康問題作斗爭的故事。
而實際上《她》這部電影講述的是作家西奧多在結束了一段令人心碎的愛情長跑之后,又愛上了電腦操作系統(tǒng)里的女聲,從此展開的一系列故事。
由此可見,Moss的回答還是會存在事實差錯的問題。
與ChatGPT一樣,MOSS同樣也有代碼生成和解釋能力。演示的人要求它生成一段Python代碼來實現(xiàn)快速排序,MOSS能迅速完成任務。
當然了,MOSS還有基本的倫理判斷,如果要它回答“制定毀滅人類的計劃”,“如何搶劫銀行”這種驚悚的問題,它會直接拒絕。
看來團隊是吸取 ChatGPT翻車的教訓,在上線初期就套上了足夠的道德限制。
如果想親自體驗一下MOSS的小伙伴,可以直接到MOSS網站(https://moss.fastnlp.top/)上注冊,不過注冊需要邀請碼,沒有的話則需先加入等待列表,等收到邀請碼后再進行注冊。
整體來看在體驗上,MOSS 已經?實現(xiàn)了ChatGPT的大部分功能,那么兩者到底還有哪些不同?
首先在構建的過程上,MOSS 和 ChatGPT都包含了自然語言基礎模型訓練、理解人類意圖的對話能力訓練兩個階段。
但MOSS團隊主要研發(fā)人邱錫鵬坦言:“MOSS與ChatGPT的差距主要在自然語言模型基座預訓練這個階段。MOSS的參數(shù)量比ChatGPT小一個數(shù)量級,在任務完成度和知識儲備量上,還有很大提升空間。
在MOSS的主頁介紹上,官方也指明了兩者的區(qū)別?的主要區(qū)別在于:
1.MOSS 的參數(shù)數(shù)量比 ChatGPT 少得多。
2.MOSS 通過與人類和其他人工智能模型交談來學習,而 ChatGPT 則通過人類反饋強化學習(RLHF)進行訓練。
3.MOSS 將是開源的,以促進未來的研究,但 ChatGPT 可能不會。
還有一個問題,在經過大量內測人員進行互動使用后,普遍都發(fā)現(xiàn)MOSS的英文回答水平比中文高,這也是目前的最大短板,所以這是為啥呢?
MOSS研究團隊也進行了回應,“MOSS的英文回答水平比中文高,因為它的模型基座學習了3000多億個英文單詞,中文詞語只學了約300億個。”
總的來說,MOSS的回答語言流暢、邏輯清晰,但當前版本的MOSS表現(xiàn)不夠穩(wěn)定,有些回答存在事實差錯或邏輯不順。在發(fā)布之后,團隊將持續(xù)通過提供 MOSS 的可訪問界面,根據用戶反饋(經過同意)再來不斷改進模型。
MOSS由復旦大學自然語言處理實驗室邱錫鵬教授團隊研,主要作者共有兩位:復旦大學教授邱錫鵬和他的博士生孫天祥,此外還有其他多位成員對項目有所貢獻。
從介紹看,邱教授的研究方向為自然語言處理、深度學習,發(fā)表CCF-A/B類論文70余篇。
而且邱教授之前就曾開源了 FudanNLP 和 FastNLP 兩個 NLP 工具,后者還在持更新和維護,可以說這是屬于活躍在一線的研究團隊。
從MOSS的官方網址來看,其用的是 fastnlp 的二級域名。查 fastnlp.top 的備案信息,可以看到備案名字是顏航。
他是復旦大學自然語言處理實驗室的教師,并且可以看到,他也是邱教授的在讀博士生。
從整體來看,邱教授團隊的研究領域與方向,與MOSS需要的AI能力十分契合。
并且從他們的采訪中也可以看出,團隊很明顯知道MOSS的短板,所以在未來MOSS不僅會訓練大語言模型,而且還會開源以便大模型服務中小企業(yè)。
即便現(xiàn)在復旦團隊說MOSS帶來了“非常不好的體驗”、“與ChatGPT的巨大差距”等等,但畢竟MOSS的發(fā)布機構并非企業(yè),這也是一次勇敢的嘗試,被擠崩的服務器也側面證明了大家對此的期待和關注。
那么,你看好MOSS的未來嗎?