榮登榜首!科大訊飛刷新機(jī)器常識(shí)推理水平世界紀(jì)錄
4月12日,由科大訊飛(002230)承建的我國(guó)首個(gè)認(rèn)知智能國(guó)家重點(diǎn)實(shí)驗(yàn)室,以76.06%的成績(jī)登頂常識(shí)推理挑戰(zhàn)賽CommonsenseQA 2.0,刷新世界紀(jì)錄,在讓機(jī)器“能理解、會(huì)思考”上邁出一大步!
CommonsenseQA 2.0是艾倫人工智能研究院(Allen Institute for AI)于2021年主導(dǎo)發(fā)布的國(guó)際常識(shí)推理評(píng)測(cè)數(shù)據(jù)集,旨在評(píng)估機(jī)器對(duì)常識(shí)知識(shí)的理解及掌握水平,吸引了包括Google、Allen Institute for AI、華盛頓大學(xué)等眾多國(guó)際頂尖機(jī)構(gòu)參與挑戰(zhàn)。 科大訊飛首次參賽,即創(chuàng)新性地提出ACROSS模型,以全新深度學(xué)習(xí)算法絕對(duì)優(yōu)勢(shì),刷新機(jī)器常識(shí)推理水平世界紀(jì)錄。
從做“選擇題”到做“判斷題”
機(jī)器學(xué)會(huì)常識(shí)推理有多難?
常識(shí)推理(Commonsense Reasoning)是 NLP 最重要的前進(jìn)方向之一,其目的是幫助計(jì)算機(jī)學(xué)習(xí)常識(shí)知識(shí),并利用所掌握的知識(shí)進(jìn)行深層次的理解及推理。該領(lǐng)域的進(jìn)展及技術(shù)突破對(duì)人工智能發(fā)展具有重要的意義。
當(dāng)前典型的閱讀理解模型所關(guān)注的問(wèn)題類型主要是事實(shí)類問(wèn)題,這類型的問(wèn)題答案往往能直接在原文中找到,然而如何基于常識(shí)和背景知識(shí)進(jìn)行推理以獲得答案仍舊是一個(gè)巨大的挑戰(zhàn)。CommonsenseQA正是為了訓(xùn)練機(jī)器像人類一樣基于先驗(yàn)知識(shí)結(jié)合現(xiàn)實(shí)情況作答能力而設(shè)置的數(shù)據(jù)集。 當(dāng)人們回答問(wèn)題時(shí),往往會(huì)利用自身了解的知識(shí)結(jié)合特定的背景來(lái)判斷問(wèn)題答案,比如常識(shí)、背景知識(shí)、空間關(guān)系、科學(xué)事實(shí)、社會(huì)慣例等。
CommonsenseQA 1.0任務(wù)示例
如上圖任務(wù)示例中的第一個(gè)問(wèn)題,“我可以站在河上的什么地方看水流而不會(huì)弄濕自己?”可以從選擇項(xiàng)中推斷我是在橋上。這種知識(shí)對(duì)人類而言似乎很好理解,但是如何讓機(jī)器學(xué)會(huì)常識(shí)及背景知識(shí)并進(jìn)行準(zhǔn)確推理,仍然是一個(gè)巨大的挑戰(zhàn)。
CommonsenseQA 2.0是一個(gè)二元分類數(shù)據(jù)集,包含14343個(gè)問(wèn)題,主要分為訓(xùn)練/開(kāi)發(fā)/測(cè)試集,需要判斷常識(shí)性陳述是對(duì)還是錯(cuò)。1.0版本所考察的問(wèn)題,是基于現(xiàn)有常識(shí)知識(shí)庫(kù)ConceptNet中的知識(shí)三元組構(gòu)建的,這使得機(jī)器在處理該任務(wù)時(shí),有能直接聚焦參考的知識(shí)。相比較1.0的“選擇題”,2.0“判斷題”挑戰(zhàn)難度更高,僅給定一個(gè)主題實(shí)體或概念、一個(gè)常識(shí)類關(guān)系(且關(guān)系不一定在現(xiàn)有知識(shí)庫(kù)出現(xiàn)),讓人類以自然語(yǔ)言的方式去構(gòu)造機(jī)器較難掌握的常識(shí)知識(shí)。
該構(gòu)造方法所構(gòu)造的常識(shí)推理問(wèn)題具有龐大的想象空間,大部分在當(dāng)前知識(shí)庫(kù)中并未覆蓋,無(wú)疑顯著增加了機(jī)器處理該類問(wèn)題的難度。同時(shí),該評(píng)測(cè)任務(wù)數(shù)據(jù)構(gòu)造過(guò)程中,還通過(guò)人與機(jī)器不斷博弈對(duì)抗的方式,不斷迭代設(shè)計(jì),最終確定的問(wèn)題集合基本是當(dāng)前主流算法都完成得不好的問(wèn)題。
CommonsenseQA 2.0任務(wù)問(wèn)題示例
CommonsenseQA 2.0任務(wù)所覆蓋的常識(shí)問(wèn)題類型示例
目前以科大訊飛為代表的中國(guó)人工智能力量在常識(shí)推理領(lǐng)域中已有很大的進(jìn)步,但是仍遠(yuǎn)低于人類94.1%的水平,可見(jiàn)在常識(shí)性推理方向仍有很大挑戰(zhàn)和進(jìn)步空間。
科大訊飛提出ACROSS創(chuàng)新方法破解難題
在CommonsenseQA 2.0這項(xiàng)頗具挑戰(zhàn)的常識(shí)推理評(píng)測(cè)任務(wù)上,業(yè)界主流的中等大小預(yù)訓(xùn)練模型方法也只能取得55%的水平,略高于隨機(jī)猜測(cè)平均水平。此前國(guó)際上該任務(wù)的最優(yōu)方法,通過(guò)1750億級(jí)參數(shù)量大小的GPT3模型生成針對(duì)CommonsenseQA 2.0常識(shí)推理問(wèn)題的相關(guān)知識(shí),并基于T5模型進(jìn)行融合處理,該方法取得了73%的準(zhǔn)確率。
本次由科大訊飛承建的認(rèn)知智能國(guó)家重點(diǎn)實(shí)驗(yàn)室團(tuán)隊(duì)創(chuàng)新提出的面向常識(shí)知識(shí)推理的ACROSS(Automatic Commonsense Reasoning on Semantic Spaces)模型, 是繼2016年科大訊飛提出神經(jīng)聯(lián)想模型NAM(Neural Association Model),并取得Winograd Schema Challenge冠軍后的又一力作。
該模型實(shí)現(xiàn)了統(tǒng)一語(yǔ)義空間下外部知識(shí)的有效融合,顯著改進(jìn)了超大規(guī)模預(yù)訓(xùn)練模型所存在的問(wèn)題, 在CommonsenseQA 2.0任務(wù)上取得76%的準(zhǔn)確率。
該評(píng)測(cè)的常識(shí)推理問(wèn)題,不論在ConceptNet等知識(shí)庫(kù),或者互聯(lián)網(wǎng)上,都較難找到直接的答案。從人類進(jìn)行常識(shí)知識(shí)運(yùn)用及推理的習(xí)慣出發(fā),對(duì)于一個(gè)復(fù)雜的問(wèn)題,首先需要查閱相關(guān)知識(shí)庫(kù)或典籍,其次會(huì)借助互聯(lián)網(wǎng)搜索去查找相關(guān)信息。ACROSS模型正是借鑒該思路,充分收集知識(shí)庫(kù)、互聯(lián)網(wǎng)相關(guān)信息,在統(tǒng)一的語(yǔ)義空間中進(jìn)行融合處理,最后賦予超大規(guī)模預(yù)訓(xùn)練模型更強(qiáng)的知識(shí)輸入,實(shí)現(xiàn)準(zhǔn)確的常識(shí)知識(shí)推理。 該方法結(jié)果也一定程度上證明了機(jī)器已初步具備對(duì)于各類復(fù)雜文本信息及知識(shí)的深入理解及運(yùn)用能力。
我國(guó)在常識(shí)推理領(lǐng)域的技術(shù)攻堅(jiān)還在繼續(xù)。人工智能技術(shù)的下一步發(fā)展,必須要突破常識(shí)推理這一瓶頸,才能在教育、醫(yī)療、養(yǎng)老等國(guó)計(jì)民生場(chǎng)景中,讓人工智能產(chǎn)品更具備實(shí)用價(jià)值。“讓機(jī)器能聽(tīng)會(huì)說(shuō)、能理解會(huì)思考”是清晰可預(yù)見(jiàn)的未來(lái),科大訊飛求索未止。
責(zé)任編輯:孫知兵
免責(zé)聲明:本文僅代表作者個(gè)人觀點(diǎn),與太平洋財(cái)富網(wǎng)無(wú)關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,請(qǐng)讀者僅作參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。
如有問(wèn)題,請(qǐng)聯(lián)系我們!
- 榮登榜首!科大訊飛刷新機(jī)器常識(shí)推理水平世2022-04-14
- 億聯(lián)網(wǎng)絡(luò)跌4.7% 中信證券長(zhǎng)江證券在其高點(diǎn)2022-04-14
- 以嶺藥業(yè)龍虎榜:機(jī)構(gòu)凈賣出1.39億元2022-04-14
- 中國(guó)鐵物龍虎榜:機(jī)構(gòu)凈賣出1.31億元2022-04-14
- 保利置業(yè)集團(tuán)附屬發(fā)行公司債券35億2022-04-14
- 名門(mén)地產(chǎn)申請(qǐng)破產(chǎn)重整2022-04-14
- 華僑城A:3月合同銷售金額28.9億2022-04-14
- 蕪湖自今日起取消二手房限售2022-04-14
- 亞洲水泥(中國(guó))(00743.HK)料一季度股東應(yīng)占2022-04-14
- 京能置業(yè)近三個(gè)交易日累計(jì)漲幅達(dá)26.65%2022-04-14
- 安踏體育(02020.HK)第一季度安踏品牌產(chǎn)品零2022-04-14
- 《敢達(dá)爭(zhēng)鋒對(duì)決》近戰(zhàn)天花板出場(chǎng),天蝕敢達(dá)2022-04-14
- 建信信托:服務(wù)新發(fā)展格局,支持實(shí)體經(jīng)濟(jì)發(fā)2022-04-14
- 泰達(dá)宏利基金:多重因素影響A股走勢(shì),市場(chǎng)2022-04-14
- 申萬(wàn)宏源:3月國(guó)內(nèi)面臨輸入性通脹壓力2022-04-14
- 抗疫,韻達(dá)福建省公司在行動(dòng)2022-04-14
- 冷軋卷板板塊股票有哪些?相關(guān)的有八一鋼鐵2022-04-14
- 大梁茗酒主題曲《度你》首發(fā) 演繹人間邛派2022-04-14
- 霧芯科技(RLX.US)盤(pán)前漲3.32%報(bào)2.18美元 2022-04-14
- 香港中華煤氣(0003.HK)“沽售”評(píng)級(jí) 預(yù)測(cè)22022-04-14
- 全球汽車制造巨頭Stellantis(STLA.US)盤(pán)前2022-04-14
- 融捷股份一季度凈利同比預(yù)增12385%-15159%2022-04-14
- 恒生指數(shù)周四漲0.67% 餐飲股領(lǐng)漲2022-04-14
- 中國(guó)航空科幻IP《南天門(mén)計(jì)劃》“NFT”數(shù)字2022-04-14
- 達(dá)美航空(DAL.US)盤(pán)前漲1.02%報(bào)41.44美元 2022-04-14
- 億航智能(EH.US)盤(pán)前漲2.15%報(bào)11.89美元 2022-04-14
- 三湘印象收深交所問(wèn)詢函 要求說(shuō)明商譽(yù)減值2022-04-14
- 航宇科技擬12億元投建航空發(fā)動(dòng)機(jī)燃?xì)廨啓C(jī)用2022-04-14
- 因收購(gòu)?fù)杏瓉?lái)“債務(wù)危機(jī)”的曲美,走過(guò)至2022-04-14
- 3.3萬(wàn)股東遭埋!翻倍大牛股上演“天地天”2022-04-14
精彩推薦
- 保利置業(yè)集團(tuán)附屬發(fā)行公司債券35億
- 名門(mén)地產(chǎn)申請(qǐng)破產(chǎn)重整
- 華僑城A:3月合同銷售金額28.9億
- 蕪湖自今日起取消二手房限售
- 亞洲水泥(中國(guó))(00743.HK)料一季度股東...
- 京能置業(yè)近三個(gè)交易日累計(jì)漲幅達(dá)26.65%
- 安踏體育(02020.HK)第一季度安踏品牌產(chǎn)...
- 申萬(wàn)宏源:3月國(guó)內(nèi)面臨輸入性通脹壓力
- 冷軋卷板板塊股票有哪些?相關(guān)的有八一...
- 霧芯科技(RLX.US)盤(pán)前漲3.32%報(bào)2.18美元...
- 香港中華煤氣(0003.HK)“沽售”評(píng)級(jí) 預(yù)...
- 全球汽車制造巨頭Stellantis(STLA.US)盤(pán)...
- 達(dá)美航空(DAL.US)盤(pán)前漲1.02%報(bào)41.44美...
- 億航智能(EH.US)盤(pán)前漲2.15%報(bào)11.89美元...
- 京投發(fā)展:一季度簽約銷售金額為9.86億,...
閱讀排行
- 榮登榜首!科大訊飛刷新機(jī)器常識(shí)...
- 億聯(lián)網(wǎng)絡(luò)跌4.7% 中信證券長(zhǎng)江證...
- 以嶺藥業(yè)龍虎榜:機(jī)構(gòu)凈賣出1.39億元
- 中國(guó)鐵物龍虎榜:機(jī)構(gòu)凈賣出1.31億元
- 《敢達(dá)爭(zhēng)鋒對(duì)決》近戰(zhàn)天花板出場(chǎng)...
- 建信信托:服務(wù)新發(fā)展格局,支持...
- 泰達(dá)宏利基金:多重因素影響A股...
- 抗疫,韻達(dá)福建省公司在行動(dòng)
- 大梁茗酒主題曲《度你》首發(fā) 演...
- 融捷股份一季度凈利同比預(yù)增1238...