【財經(jīng)分析】打造細(xì)分領(lǐng)域數(shù)據(jù)優(yōu)勢 釋放行業(yè)版ChatGPT生產(chǎn)力
新華財經(jīng)北京4月27日電(郭興華)4月26日,“企業(yè)數(shù)據(jù)精準(zhǔn)確權(quán)與AIGC全球合規(guī)論壇”在清華經(jīng)管學(xué)院舉辦。4月11日,國家互聯(lián)網(wǎng)信息辦公室發(fā)布《生成式人工智能服務(wù)管理辦法(征求意見稿)》。4月7日,阿里系“通義千問”官宣內(nèi)測,結(jié)合此前召開發(fā)布會的百度“文心一言”,我國多模態(tài)人工智能大模型開啟了追趕ChatGPT的競賽。2022年底GhatGPT火速圈粉以來,大量資本和研發(fā)進(jìn)入這一賽道,人工智能的發(fā)展進(jìn)入百米沖刺的階段。OpenAI官方發(fā)文稱,集成算法、算力和預(yù)訓(xùn)練數(shù)據(jù)的AI模型即將進(jìn)入強人工智能時代,人類可能正面臨著有史以來最重大的一次生產(chǎn)力水平躍遷。盡管我國企業(yè)目前推出的GPT類產(chǎn)品在性能上與ChatGPT-4相比有不小的差距,但是我們?nèi)匀豢梢栽谝恍┓矫媾c之競爭,并非常有可能做的更好。
優(yōu)質(zhì)數(shù)據(jù)集的價值將越來越重要
【資料圖】
多模態(tài)人工智能大模型的開發(fā)工作主要涉及三個部分,算力、算法和投喂數(shù)據(jù)。根據(jù)OpenAI官方資料和專家分析,ChatGPT在算法方面的創(chuàng)新不多,目前的“驚艷”效果主要得益于算力的大幅提升和數(shù)據(jù)集的不斷完善。得益于AI賽道投入的增多和市場規(guī)模的擴大,作為追趕者面臨的算力成本投入將呈現(xiàn)下降的趨勢。然而,優(yōu)質(zhì)數(shù)據(jù)集作為一種自帶版權(quán)和產(chǎn)權(quán)屬性的資產(chǎn),其使用成本并不一定會隨著時間的推移而下降。未來的如何構(gòu)建優(yōu)質(zhì)數(shù)據(jù)集共贏體系,為AI持續(xù)提供高質(zhì)量預(yù)訓(xùn)練數(shù)據(jù),將成為AI大模型競爭的核心。
數(shù)據(jù)來源盡量廣泛。根據(jù)OpenAI官方公開的信息,GPT-3的預(yù)訓(xùn)練數(shù)據(jù)來源主要包括英文維基百科及其所有鏈接網(wǎng)頁、Common Crawl項目中的Web抓取數(shù)據(jù)、新聞文章、書籍、論文等文本資源以及其他公共語料庫和數(shù)據(jù)集。這些數(shù)據(jù)都是從互聯(lián)網(wǎng)上搜集而來的,以保證覆蓋面廣、樣本多樣化。
數(shù)據(jù)質(zhì)量要求較高。OpenAI團隊指出,對大規(guī)模的自然語言處理預(yù)訓(xùn)練數(shù)據(jù),進(jìn)行篩選和清洗是非常重要的步驟,可以提高模型的訓(xùn)練效果和泛化能力。在預(yù)處理數(shù)據(jù)時,需要去除文本中的噪聲、錯誤數(shù)據(jù)和無用信息。為了避免偏見和不平衡的數(shù)據(jù)分布,需要對數(shù)據(jù)集進(jìn)行均衡和采樣。標(biāo)注和歸一化處理。標(biāo)注是將不同類型的文本數(shù)據(jù)進(jìn)行分類和標(biāo)記,以便進(jìn)行有監(jiān)督學(xué)習(xí)。歸一化則是將不同格式和語言的數(shù)據(jù)進(jìn)行相應(yīng)的轉(zhuǎn)換和統(tǒng)一。
清華大學(xué)技術(shù)創(chuàng)新研究中心數(shù)權(quán)經(jīng)濟研究室主任鐘宏表示,多模態(tài)人工智能大模型正以前所未有的進(jìn)化速度顛覆舊有模式,迅速催生了新業(yè)態(tài)、新技術(shù)和新的應(yīng)用。但是圍繞著數(shù)據(jù)安全、隱私保護和AI失控的一系列潛在風(fēng)險成為了影響發(fā)展的關(guān)鍵問題。因此,全球急需共同構(gòu)建AIGC時代下的數(shù)字信任體系,為“數(shù)字智人”技術(shù)的發(fā)展、商業(yè)化的應(yīng)用和數(shù)字治理來建立規(guī)則。中國的大型科技企業(yè)需要廣泛接入數(shù)據(jù)資源來訓(xùn)練人工智能模型,大型央國企的數(shù)據(jù)資源如何去接入人工智能相關(guān)的服務(wù),這些問題給時代提出了全新的挑戰(zhàn)。為此,清華經(jīng)管學(xué)院、螞蟻集團共同啟動《共建數(shù)字信任體系服務(wù)科技創(chuàng)新生態(tài)高質(zhì)量發(fā)展研究》課題,依托清華在數(shù)據(jù)要素、數(shù)字商品、數(shù)字資產(chǎn)領(lǐng)域的智能確權(quán)與合規(guī)理論體系,發(fā)揮螞蟻集團在區(qū)塊鏈、AI等數(shù)字智能科技優(yōu)勢,聯(lián)合多方研究建立面向人工智能時代的數(shù)字信任體系,以推動我國AIGC健康發(fā)展。
車聯(lián)網(wǎng)賽道,構(gòu)建面向自動駕駛模型訓(xùn)練的共享大數(shù)據(jù)集
依托我國在新能源汽車產(chǎn)業(yè)的優(yōu)勢,構(gòu)筑用于訓(xùn)練5G智能網(wǎng)聯(lián)車的“ChatGPT”數(shù)據(jù)集將是一個潛力巨大的投資賽道。在推動汽車行業(yè)數(shù)據(jù)要素流通應(yīng)用的過程中,一直存在兩個難題。首先,數(shù)據(jù)所屬權(quán)難界定。當(dāng)同樣的數(shù)據(jù)被多次交易時,如何充分保障數(shù)據(jù)擁有者、數(shù)據(jù)服務(wù)商、數(shù)據(jù)使用者的利益是存在難度的。其次,數(shù)據(jù)共享與隱私保護之間的矛盾突出。企業(yè)間的合作必然牽連到數(shù)據(jù)合作。如果對數(shù)據(jù)僅進(jìn)行脫敏處理,合作企業(yè)亦能通過數(shù)據(jù)的關(guān)聯(lián)性分析出用戶敏感信息,從而出現(xiàn)隱私風(fēng)險;如果企業(yè)對數(shù)據(jù)進(jìn)行過度處理,共享數(shù)據(jù)的實用價值就大大降低,制約了企業(yè)的深度合作和高速發(fā)展。
中汽創(chuàng)智科技有限公司CEO李豐軍表示,中汽創(chuàng)智牽頭,聯(lián)合中汽協(xié)、汽車企業(yè)和清華大學(xué)技術(shù)創(chuàng)新研究中心共同進(jìn)行《汽車行業(yè)數(shù)據(jù)確權(quán)與合規(guī)標(biāo)準(zhǔn)化》研究,希望以清華、DAMA等機構(gòu)專家在《企業(yè)數(shù)據(jù)確權(quán)與全球合規(guī)趨勢報告(2023)》中提出的“企業(yè)數(shù)據(jù)精準(zhǔn)確權(quán)”理論體系為基礎(chǔ),針對汽車行業(yè)建立有影響力的團體標(biāo)準(zhǔn),解決汽車行業(yè)數(shù)字化、智能化發(fā)展過程中面臨的數(shù)據(jù)確權(quán)難、合規(guī)難等問題。中汽創(chuàng)智打造的“汽車大數(shù)據(jù)可信共享空間(車數(shù)空間)”按照“數(shù)據(jù)二十條”中“原始數(shù)據(jù)不出域、數(shù)據(jù)可用不可見”的要求,基于股東方汽車企業(yè)沉淀的大量的車聯(lián)網(wǎng)數(shù)據(jù)和生態(tài)合作方的行業(yè)數(shù)據(jù),面向異業(yè)合作,實現(xiàn)了智能網(wǎng)聯(lián)汽車大數(shù)據(jù)在跨行業(yè)應(yīng)用場景中,向企業(yè)提供模型、核驗等產(chǎn)品和服務(wù),并且包括用途可控可計量的數(shù)據(jù)共享流通服務(wù)。同時,中汽創(chuàng)智正針對“自動駕駛算法”這類需要大數(shù)據(jù)訓(xùn)練集進(jìn)行訓(xùn)練的人工智能產(chǎn)品,面向車企同業(yè)合作,探索車企間的數(shù)據(jù)聯(lián)盟,幫助各個車企建立起面向自動駕駛模型訓(xùn)練的共享大數(shù)據(jù)集,助力車企自動駕駛研發(fā),實現(xiàn)合作與共贏。
輔助診療賽道,AI大模型需要與傳統(tǒng)工具相結(jié)合
醫(yī)學(xué)是最早通過AI的方法來處理數(shù)據(jù),提高診斷準(zhǔn)確率的AI應(yīng)用領(lǐng)域之一。基于醫(yī)學(xué)領(lǐng)域的高質(zhì)量數(shù)據(jù),可以很好的釋放AI生產(chǎn)力,賦能醫(yī)學(xué)的相關(guān)領(lǐng)域,比如:在醫(yī)學(xué)研究方面,可以有效進(jìn)行疾病機制研究等;在臨床診療方面,可以有效輔助提升、規(guī)范診療措施,以及進(jìn)一步進(jìn)行個性化的精準(zhǔn)診療;在新藥研發(fā)方面,可以在靶標(biāo)發(fā)現(xiàn)、苗頭及先導(dǎo)化合物發(fā)現(xiàn)等方面有效輔助藥物研發(fā),大幅節(jié)省時間和經(jīng)費。
然而,萬方醫(yī)學(xué)研究院院長楊風(fēng)雷博士認(rèn)為,有效利用醫(yī)學(xué)數(shù)據(jù)前,需要解決一些問題,比如數(shù)據(jù)的確權(quán)問題,數(shù)據(jù)的權(quán)利方可能包括患者、醫(yī)生、醫(yī)院、政府等不同的相關(guān)方。這些數(shù)據(jù)的多維特征包括個人隱私和信息保護等問題。
楊風(fēng)雷表示,多模態(tài)人工智能大模型的性能總體上讓人刮目相看,有潛力解決醫(yī)學(xué)領(lǐng)域相當(dāng)多的問題。但是,它們也有一些不足,比如:一些答案中存在錯誤;由于數(shù)據(jù)分布和不同提示產(chǎn)生回復(fù)隨機性等所帶來的輸出不一致;以及模型部署和資源消耗巨大等。這些問題,尤其是前兩個問題違背了醫(yī)學(xué)倫理,而這些不足卻是傳統(tǒng)的基于規(guī)則的AI輔助診療系統(tǒng)的優(yōu)勢。因此,考慮到醫(yī)學(xué)領(lǐng)域的安全要求高特點,近期或者相當(dāng)長一段時間內(nèi),結(jié)合各自優(yōu)勢,采用新舊工具相結(jié)合的方式,可能是比較好的選擇。
數(shù)字經(jīng)濟學(xué)家陳曉華在接受采訪時表示,AI是新一輪科技革命和產(chǎn)業(yè)變革的引領(lǐng)者,也是數(shù)字經(jīng)濟時代持續(xù)賦能經(jīng)濟社會發(fā)展,推動產(chǎn)業(yè)優(yōu)化的新動能。在基礎(chǔ)設(shè)施層面,隨著東數(shù)西算工程的持續(xù)落地,我國算力供給格局將進(jìn)一步優(yōu)化,從而降低相關(guān)企業(yè)研發(fā)與運營的算力成本。從模型層與應(yīng)用層的角度來看,我國擁有海量的用戶群體與數(shù)據(jù)積累,一旦跨過商業(yè)化拐點,各企業(yè)將加速融入此類技術(shù)并結(jié)合自身場景優(yōu)勢實現(xiàn)新一輪產(chǎn)業(yè)創(chuàng)新與升級。而從監(jiān)管和治理層面,國家網(wǎng)信辦首個AIGC監(jiān)管文件征求意見稿發(fā)布,意味著我國AI行業(yè)的標(biāo)準(zhǔn)化步伐正加速推進(jìn),未來我國AI產(chǎn)業(yè)生態(tài)將更加規(guī)范有序可持續(xù)發(fā)展。(郭興華,系中國經(jīng)濟信息社區(qū)塊鏈?zhǔn)紫治鰩煟?/p>
編輯:王春霞
關(guān)鍵詞:
責(zé)任編輯:孫知兵
免責(zé)聲明:本文僅代表作者個人觀點,與太平洋財富網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實,對本文以及其中全部或者部分內(nèi)容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關(guān)內(nèi)容。
如有問題,請聯(lián)系我們!
- 【財經(jīng)分析】打造細(xì)分領(lǐng)域數(shù)據(jù)優(yōu)勢 釋放2023-04-27
- 中國海油一季度歸母凈利潤達(dá)321億元2023-04-27
- 中國電信加入AI大模型大戰(zhàn):相關(guān)產(chǎn)品進(jìn)入內(nèi)2023-04-27
- 郵儲銀行衡水市分行多措并舉筑牢金融反詐防2023-04-27
- 天天速訊:步長制藥2022年度分配預(yù)案:擬102023-04-27
- 跟著Move Fre和專家一起養(yǎng)關(guān)節(jié)|預(yù)防骨關(guān)2023-04-27
- 五礦資本:一季度實現(xiàn)凈利9.54億元 同比增2023-04-27
- 潤澤科技跌10.34% 安信證券昨剛喊買入 焦2023-04-27
- 火山的女兒食物食品禮物怎么獲得2023-04-27
- 每日動態(tài)!一季度全國法拍房掛拍11萬套,住宅2023-04-27
- 天天熱文:僅有一家份額提升!最新國產(chǎn)手機2023-04-27
- 被控受賄1.93億!杭州市委原書記周江勇案開2023-04-27
- 沃爾沃袁小林:抓住產(chǎn)品、品牌、體系力應(yīng)對2023-04-27
- 司弘法律:彰顯國企擔(dān)當(dāng) 打造不良資產(chǎn)處置2023-04-27
- 漢鐘精機:擬不超6020萬元收購浙江科恩特142023-04-27
- 當(dāng)前快報:“空調(diào)有顏 生活有FUN”科龍空2023-04-27
- 民生銀行廣州分行:以優(yōu)質(zhì)金融服務(wù)助力高質(zhì)2023-04-27
- 恒豐金融布局人工智能領(lǐng)域,向海南經(jīng)濟特區(qū)2023-04-27
- 綠色數(shù)字化金融實施,加拿大宏利推出嶄新投2023-04-27
- 業(yè)績失速,九號公司如何保持“動平衡”2023-04-27
- 波音一季度收入同比增加 虧損收窄 每日精選2023-04-27
- 【世界獨家】元公司2023年第一季度凈利潤同2023-04-27
- 天天資訊:中國電信加入AI大模型大戰(zhàn):相關(guān)2023-04-27
- 天天觀天下!恒生指數(shù)27日收漲0.42% 中國2023-04-27
- 寧波銀行一季度凈利65.98億元 同比增15.35%2023-04-27
- 這個數(shù)字,不簡單2023-04-27
- 電池級碳酸鋰止跌反彈:今日報價漲4000元/2023-04-27
- 臺電 T40S 平板電腦公布:2K 全貼合屏、2023-04-27
- 實體零售大爆發(fā)!如何搶占風(fēng)口?社區(qū)經(jīng)濟趨2023-04-27
- 全球熱文:買什么保險好又保障又便宜,值得2023-04-27
精彩推薦
- 火山的女兒食物食品禮物怎么獲得
- 每日動態(tài)!一季度全國法拍房掛拍11萬套,...
- 當(dāng)前快報:“空調(diào)有顏 生活有FUN”科...
- 臺電 T40S 平板電腦公布:2K 全貼合...
- 2023上海黃浦區(qū)衛(wèi)健委衛(wèi)生專技人員報名...
- 東土科技(300353.SZ):2022年工業(yè)互聯(lián)網(wǎng)...
- 天合光能轉(zhuǎn)債價格“虛火” 熱議
- 幸福藍(lán)海4月27日盤中跌幅達(dá)5%
- 獨家資金:今日主力買進(jìn)前10股_全球視訊
- 浦東大步邁向國際消費中心,三年欲達(dá)四...
- 動態(tài):真假牛肉怎么辨別?教你一招輕松...
- 蔬菜店怎么經(jīng)營才能好?開業(yè)前市場調(diào)查
- 白珊瑚現(xiàn)在多少錢一克?2017白珊瑚最新...
- 蘋果7什么時候上市? 蘋果7全球預(yù)售價曝光
- 【新要聞】武漢有哪些著名的特色小吃?...
閱讀排行
-
中國海油一季度歸母凈利潤達(dá)321億元
上一篇2023-04-27 18:00:52