消息:大數據挖掘技術創新 提升人崗匹配效率
美國時間8月4日—8日在阿拉斯加州召開的KDD2019(國際數據挖掘與知識發現大會)上,我國數據挖掘領域的創新技術以論文的形式獲得發表。
“很多時候靜態文本無法充分表達人們內心最深層的需求,而動態交互行為的文本偏好信息恰能輔助你理清內心真實的需求。”北京大學計算機科學技術研究所研究員嚴睿表示,為了更好地為求職者和崗位之間達成匹配,北大團隊與BOSS直聘自然語言處理中心通過引入記憶模塊,首次利用簡歷文檔和崗位描述文檔歷史交互行為下的信息來學習潛在偏好的信息,把人類求職經歷中的“偏好”體現在數據的“記憶”中。
KDD大會評審對該論文的反饋認為:“全球范圍看,以往數據挖掘技術主要應用于電商、金融等大領域,而在具有公共屬性行業的人力資源行業卻很少見,具有創新意義。”
“KDD的投稿今年采用雙盲式評審,并且不設置作者對審稿人意見的辯駁環節。作者并沒有為自己申辯的機會。盡管如此,針對我們發表的這篇文章,3位評審都對方法的創新性給予了高度肯定。”BOSS直聘自然語言處理中心負責人宋洋介紹,讓評審認可的創新性在于,新模型加入了“真實世界”,也可以說是“真實情感”。
人類的記憶是有偏好的,讓數據也長出“記憶”,能更準確地挖出大數據中有用的信息。之前的研究集中于對比“簡歷與崗位”在文本上的匹配度,而在現實世界中,除了靜態文本信息外,動態行為交互信息(例如求職招聘雙方各自的面試歷史記錄)中蘊含著對預測匹配更有幫助的因素。
“我們發現,雙方的偏好也決定著匹配的準確度。”宋洋表示,團隊利用記憶網絡對面試歷史記錄這一外部知識進行學習,并加入到模型參數中去,從而提升人崗匹配效果。
讓數據長出“記憶”,是不是符合人類群體的“記憶”?這個方法究竟能不能提高匹配準確度呢?這些都需要實踐檢驗。
“我們基于BOSS直聘的數據集采用5個評測指標對模型進行驗證。”宋洋解釋,社會公共類的調查沒有真人實驗,但可以固定一個時間窗口來取求職者和招聘者雙方的歷史面試記錄,用來預測之后一段時間樣本集合內的求職者和招聘者雙方是否發生匹配,這與實際情況是一致的,實驗結果也證明全新的數據挖掘技術優于當前最優的人崗匹配方法。
據悉,作為世界數據挖掘領域最高級別的學術會議,今年KDD研究論文錄取率僅為14%,阿里巴巴、今日頭條等中國企業也有論文一并收入。BOSS直聘首席科學家薛延波應邀在大會“人才與管理計算”工作坊上分享了關于職業科學的研究。
相關專家認為,中國由于人口基數大、互聯網應用發展成熟等特點,是大數據的主要產出國,如何有效地利用數據,提高現有諸如職位對接、商務對接等的有效率,將真實世界的特點融入到大數據向知識的轉化中,亟待大數據挖掘技術的創新。例如,互聯網上存在著數億規模的求職者簡歷以及崗位招聘信息,有效的數據挖掘技術將大大提升人崗匹配效率,減少耗費比,對國民經濟帶來良性作用的同時,讓每個人都能發揮出自己的價值。
責任編輯:孫知兵
免責聲明:本文僅代表作者個人觀點,與太平洋財富網無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。
如有問題,請聯系我們!