挺进朋友人妻的身体里l_2021天堂无码视频_小说区图片区综合久久关美脚_一本热久久sm色国产_高清无码中文字幕网站

> 通信 >

每日看點!語言智能的新發(fā)展與新挑戰(zhàn)

時間:2023-02-22 09:51:40       來源:光明網(wǎng)

語言智能是人工智能的一個領(lǐng)域,主要關(guān)注人類語言的智能分析和處理,涉及語音識別、自然語言理解、自然語言生成、機器翻譯等領(lǐng)域。近日,最能體現(xiàn)語言智能水平的ChatGPT引發(fā)各界的廣泛關(guān)注,人們懷著極大的興趣在討論和嘗試著這項嶄新的技術(shù)成果?;蚺d奮,或迷?;蚩只?。興奮的是語言智能技術(shù)真的使計算機能像人類一樣和我們自如地聊天解惑了,并且話語自如、有理有據(jù),可以拒絕不合理的提問,效果如此之好,竟引發(fā)了轟動效應(yīng);惶恐的是ChatGPT具有超強的生成能力,不僅可以聊天,還可以寫文章、作詩、編碼程序等,這樣的話,ChatGPT就會代替人類和語言相關(guān)的工作和崗位,給人類生活帶來顛覆性變化;迷惑的是我們的語言智能研究下一步朝著哪個方向走?如何理性地分析ChatGPT取得的突破和主要不足?趕上或超越它的機會和落腳點在哪里?對于語言智能的飛速發(fā)展,我們要有科學(xué)理性的態(tài)度,既要熱情擁抱人工智能的新發(fā)展,讓它更好地服務(wù)于人類社會,又要預(yù)防它帶給我們的消極影響,看到我們的不足和差距,迎頭趕上。


(資料圖片僅供參考)

一、ChatGPT的功能與不足

ChatGPT是由openAI研發(fā)的一種人工智能聊天機器人程序,它是基于GPT3.5架構(gòu)的大型語言模型并通過強化學(xué)習(xí)進(jìn)行訓(xùn)練,可以和人類以自然語言對話的形式進(jìn)行交互,還可以用于相對復(fù)雜的語言工作比如文本生成,自動問答,自動摘要等,同時具備一定的編寫和調(diào)試計算機程序的能力。ChatGPT 的出現(xiàn)是語言智能領(lǐng)域的一大進(jìn)步,標(biāo)志著語言智能技術(shù)可以融合于信息搜索、人機交互、對話生成等方面,應(yīng)用場景的落地具有廣闊空間,潛力無窮。

首先,ChatGPT是一個基于深度學(xué)習(xí)的大規(guī)模預(yù)訓(xùn)練對話模型,主要功能是對話聊天,它通過強化學(xué)習(xí)來理解提問者的話語意圖,能夠較好地引入人類反饋,具備主動承認(rèn)錯誤,區(qū)分問題是否符合倫理要求,質(zhì)疑不正確的問題等,并通過清晰的邏輯思路來組織話語,距離人類的聊天方式和口氣越來越近。相對于以前的對話系統(tǒng),ChatGPT的主要突破在以下幾點:

(一)超強的生成能力可以完成多種任務(wù)。ChatGPT除了與人對話聊天外,還能按照輸入的關(guān)鍵詞和表達(dá)的意圖寫小說、寫論文、創(chuàng)作詩歌、作圖、編寫和糾正程序代碼。還可以用在教案生成、資料查詢、智能教學(xué)、智能創(chuàng)作和設(shè)計,在醫(yī)療、法律、教育、咨詢服務(wù)等領(lǐng)域具有廣闊應(yīng)用前景。

(二)與搜索引擎相結(jié)合,基于海量數(shù)據(jù),實現(xiàn)更為符合人類需求的查詢結(jié)果,實現(xiàn)交互式搜索,給用戶帶來全新的體驗

(三)交互能力大幅度提升。除了具有廣博的知識,它還能很好地組織自己的話語,思路清晰,邏輯嚴(yán)密,“因此”“而且”“但是”等話語連接詞使用恰當(dāng),幾乎接近人類語言的能力。還能主動承認(rèn)錯誤,拒絕不合理的提問等等。

ChatGPT的主要功能在于提供信息和社交能力,有望成為人在精神陪伴,面對挫折困難的時候提供引導(dǎo)和安慰的幫手??傊珻hatGPT已經(jīng)成為互聯(lián)網(wǎng)時代的語言智能的技術(shù)領(lǐng)跑者,給人類社會帶來更加智能化和便捷化的服務(wù)。

當(dāng)然,作為一種新興人工智能模型,ChatGPT也存在一些問題和不足,主要在于:

(一)盡管對話能力和交互能力大幅度提升,但經(jīng)常出現(xiàn)事實性錯誤。由于它是數(shù)據(jù)驅(qū)動的模型,對于數(shù)據(jù)背后的真實世界的狀態(tài),原理和規(guī)則等缺乏足夠的認(rèn)知,因此會出現(xiàn)一本正經(jīng)地胡說八道情況。不符合常理的話語會經(jīng)常出現(xiàn)。

(二)對于一般知識了解廣泛,但無法提供專業(yè)性較強、有深度、有洞見的問題答案。例如對它進(jìn)行物理學(xué)測試,簡單常識性問題回答較好,越是難度增加,答案不能令人滿意。說明ChatGPT掌握的知識并不深入、不專業(yè)。

(三)基于多層復(fù)雜神經(jīng)網(wǎng)絡(luò)搭建的深度學(xué)習(xí)模型,目前還不能解釋其算法邏輯,經(jīng)常出現(xiàn)事實性錯誤,產(chǎn)出的結(jié)果不具有安全性保障。如果被惡意利用,將造成嚴(yán)重的安全隱患,或危害法律。

二、ChatGPT 的工作范式

ChatGPT是一個基于transformer神經(jīng)網(wǎng)絡(luò)架構(gòu)和生成預(yù)訓(xùn)練技術(shù)的大型語言模型,通過對超大型文本語料的訓(xùn)練,來獲得語言知識和世界知識。同時它還引入基于人類偏好的強化學(xué)習(xí)方法,將其應(yīng)用于自然語言建模。訓(xùn)練的語料,除了海量無標(biāo)注數(shù)據(jù),ChatGPT還利用標(biāo)注精細(xì)的專門語料庫,訓(xùn)練機器更高的適應(yīng)性和更準(zhǔn)確的知識。這些知識是怎么被機器獲得和輸出的呢?ChatGPT使用的transformer神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)對數(shù)據(jù)進(jìn)行訓(xùn)練,可以輸入序列,將其轉(zhuǎn)化為對應(yīng)的輸出序列,知識是通過神經(jīng)網(wǎng)絡(luò)訓(xùn)練得到的。在訓(xùn)練過程中,ChatGPT使用了海量的自然語言文本數(shù)據(jù)來學(xué)習(xí)單詞的嵌入表示,以及上下文之間的關(guān)系,這些知識被編碼在神經(jīng)網(wǎng)絡(luò)的參數(shù)中,輸出的結(jié)果都生成于這些參數(shù)之中。收到用戶的問題時,ChatGPT會將其輸入到神經(jīng)網(wǎng)絡(luò)中,神經(jīng)網(wǎng)絡(luò)會根據(jù)它學(xué)到的知識回答問題,反饋給用戶。超強的記憶力是它的重要特征。ChatGPT作為一個現(xiàn)象級的技術(shù)產(chǎn)品,在生成內(nèi)容方面無疑是革命性的,代表著人工智能大模型加大數(shù)據(jù)范式方法的成功,也說明采用統(tǒng)計模型方法模擬人類語言智能的新發(fā)展。ChatGPT在大模型的基礎(chǔ)上,采用人類反饋強化學(xué)習(xí)的訓(xùn)練機制和提示引導(dǎo)模式,促使模型逐漸順應(yīng)人類思考邏輯,趨向人類認(rèn)知和習(xí)慣,這是它的一大創(chuàng)新。

三、對未來語言智能走向的影響

ChatGPT除了對人類生活帶來影響,對語言智能領(lǐng)域的研究范式和發(fā)展走向也會帶來巨大的沖擊。從大量的語言數(shù)據(jù)中學(xué)習(xí),挖掘語言規(guī)律和語義關(guān)系,極大地改進(jìn)了自然語言理解和生成的質(zhì)量,取得驚喜的使用效果,使我們對大語言模型有了新的認(rèn)知和思考:大模型范式是否成為未來語言智能的主流技術(shù)?學(xué)術(shù)界和企業(yè)界從事多年的自然語言處理研究還需要繼續(xù)搞下去嗎?ChatGPT會給AI領(lǐng)域的研究帶來怎樣的影響?

預(yù)訓(xùn)練模型的出現(xiàn)代表了自然語言處理技術(shù)的飛躍,減少了對特征工程的依賴,逐漸帶動整個領(lǐng)域研究范式的轉(zhuǎn)變。這種范式轉(zhuǎn)變帶來的影響主要體現(xiàn)在:

一是自然語言處理研究子領(lǐng)域的逐漸弱化,例如詞性標(biāo)注、命名實體識別、句法分析、指代消解等問題,它們在大模型+大數(shù)據(jù)獨領(lǐng)風(fēng)騷的背景下,將會逐漸失去吸引力,甚至被淡忘和遺棄。

二是自然語言處理不同子領(lǐng)域的技術(shù)方法和技術(shù)框架日趨統(tǒng)一。多少年來,為了讓機器理解人類語言,人們想盡各種方法來標(biāo)注詞性,理解語義。ChatGPT的出現(xiàn),讓人們看到了語言預(yù)訓(xùn)練模型威力,通過這種范式處理自然語言效果會更好。

第三,從全球語言智能的發(fā)展來看,大模型范式的一路領(lǐng)航勢必導(dǎo)致技術(shù)、資源、用戶的高度趨合,最終走向技術(shù)和資源的單極壟斷。

四、未來發(fā)展

盡管ChatGPT在智能交互方面獲得驚人的能力,但它畢竟是一個預(yù)訓(xùn)練語言模型,基于預(yù)存知識和模型回答問題,并不具備真正的理解能力和創(chuàng)造能力,不能理解自己輸出的內(nèi)容。面對語言智能的新發(fā)展和新挑戰(zhàn),未來可以著重考慮以下幾個著力點。

(一)深度學(xué)習(xí)模型的優(yōu)化。結(jié)合人類語言習(xí)得,語言使用規(guī)律和習(xí)慣,推進(jìn)深度學(xué)習(xí)模型研究,提高語義理解能力,更好模擬人類語言能力。

(二)多模態(tài)語言理解與生成。隨著多模態(tài)數(shù)據(jù)的不斷增加,如何在多模態(tài)語言理解任務(wù)中有效融合多種信息來源,提高語言理解的準(zhǔn)確性是當(dāng)前語言智能研究的一個重要方向。ChatGPT主要是文本的自動生成,多模態(tài)的語言理解和生成問題尚未完全解決。需要未來深入研究多模態(tài)學(xué)習(xí)和多模態(tài)生成技術(shù)。

(三)領(lǐng)域知識圖譜的構(gòu)建。雖然ChatGPT可以搜索眾多信息,對一般問題回答較好,但相對有深度和專業(yè)性較強的問題卻表現(xiàn)得力不從心。如何更好地利用知識圖譜的語義信息,提高自然語言處理任務(wù)的準(zhǔn)確性,更好地服務(wù)于各類專業(yè)性用戶,也是未來可以發(fā)展的一個領(lǐng)域。

(四)加強人工智能倫理和數(shù)據(jù)安全等問題的研究。ChatGPT是生成型人工智能,不是簡單地分析和處理數(shù)據(jù),很可能會引發(fā)道德和法律方面的違規(guī)行為。比如,對信息數(shù)據(jù)來源無法進(jìn)行事實核查,存在個人數(shù)據(jù)和商業(yè)秘密泄露,或提供虛假信息的隱患。學(xué)生使用ChatGPT寫論文是否算抄襲等等,因此加強科技倫理研究,建立數(shù)據(jù)安全法規(guī)的約束機制,增強人們對技術(shù)變革的現(xiàn)代智慧是非常迫切的任務(wù)。

作者:李佐文,系北京外國語大學(xué)人工智能與人類語言重點實驗室教授、博士生導(dǎo)師

標(biāo)簽: ChatGPT

消息推送
首頁
頻道
底部
頂部