aaa视频网站,国产最新进精品视频,国产主播一区二区,999热精品视频,а√天堂资源8在线官网在线,国产免费不卡av,麻豆国产视频

基于gpu加速的招聘職位智能推薦方法

文檔序號:6370011閱讀:263來源:國知局
專利名稱:基于gpu加速的招聘職位智能推薦方法
技術領域
本發(fā)明一般涉及計算機推薦引擎領域,具體涉及基于GPU加速的招聘職位智能推薦方法。
背景技術
網上招聘和和網上求職已經成為當今社會人才交流的一種主要方式。用人單位和應聘者在第三方的人才招聘網站上注冊賬號,相互之間進行搜索和交流,以尋求最滿意的對象。人才招聘網站擁有大量的職位,一個應聘者登錄網站之后,只能從職位列表中瀏覽職位,或者依靠關鍵字去搜索可能適合自己的職位。職位列表往往數量巨大,應聘者無法在短時間內找到自己感興趣的職位;而使用關鍵字搜索,應聘者使用的關鍵字的數量和精確性很有限,搜索出來的職位數量常常很大,很難找到適合自己的職位。為了解決這種情況,招聘網站可以為應聘者推薦職位,網站主動地把可能適合的職位推送給應聘者。這就是招聘網站的推薦系統。現在招聘網站的推薦方法,主要是采用基于統計的方法,也即統計所有職位被瀏覽的次數以及被關注的程度,得到職位的熱度,然后把熱度最高的職位推薦給應聘者。這種推薦方法存在如下缺點(一)為每一個應聘者所推薦的職位都是一樣的,缺乏個性化;(二)那些雖然熱度不高但很適合應聘者的職位不能被推薦到;(三)傳統的計算只使用CPU進行數值運算,面對海量的應聘者和職位數據,計算性能極低。在提高數據挖掘的運算性能方面,很多企業(yè)和科研單位采用計算機集群,利用集群的并發(fā)性來提高計算速度,但是基于成本的考慮,很多單位無法布置昂貴的的計算機集群。而GPU相對成本較低,性價比高,并且大部分普通用戶PC上裝配的GPU使用率很低,將軟件的大規(guī)模計算任務分配到GPU上,能有效提高GPU的利用率,從而實現高性能、低功耗的最終目標。GPU英文全稱Graphic Processing Unit,中文翻譯為“圖形處理器”。GPU從誕生之日起就以超越摩爾定律的速度發(fā)展,運算能力不斷提升。業(yè)界很多研究者注意到GPU進行計算的潛力,于 2003 年 SIGGRAPH 大會上提出了 GPGPlXGeneral-purpose computing ongraphics processing units)的概念。GPU在處理能力和存儲器帶寬上相對于CPU有明顯優(yōu)勢,在成本和功耗上也不需要付出太大代價。目前最頂級的英特爾Core i7 965處理器,在默認情況下,它的浮點計算能力只有NVIDIA GeForce GTX 280的1/13。GPU通用計算通常采用CPU+GPU異構模式,由CPU負責執(zhí)行復雜邏輯處理和事務處理等不適合數據并行的計算,由GPU負責計算密集型的大規(guī)模數據并行計算。這種利用GPU強大處理能力和高帶寬彌補CPU性能不足的計算方式極大地發(fā)掘計算機潛在性能,在成本和性價比方面有顯著的優(yōu)勢。在2007年NVIDIA推出CUDA(Compute Unified DeviceArchitecture,統一計算設備架構),GPU通用計算擺脫了受硬件可編程性和開發(fā)方式的制約,開發(fā)難度大大降低。
發(fā)明內容
本發(fā)明針對當前招聘職位推薦技術的不足,提供了基于GPU加速的招聘職位智能推薦方法。本發(fā)明的目的在于,通過記錄應聘者的訪問歷史,把訪問數據表達為適合GPU處理的矩陣格式,利用GPU強大處理能力和高帶寬彌補CPU性能不足的計算方式,同時使用數千個GPU線程進行計算,使用歐幾里德距離公式計算應聘者兩兩之間的相似程度,然后根據應聘者的屬性信息,智能地預測所有職位對應聘者的適合程度,最后把最合適的職位推薦給應聘者。具體的技術方案如下所述?;贕PU加速的招聘職位智能推薦方法,包括以下步驟
(a)記錄應聘者的注冊和訪問信息,注冊的信息作為應聘者靜態(tài)屬性,訪問的信息作為應聘者動態(tài)屬性;
(b)根據應聘者的動態(tài)屬性,計算應聘者對職位的評分,形成評分矩陣;
(C)根據應聘者的靜態(tài)屬性、動態(tài)屬性和對職位的評分,計算所有應聘者中任意兩個之間的相似度,形成相似度矩陣;
(d)利用評分矩陣和相似度矩陣,預測應聘者對職位的評分,形成預測矩陣;
(e)根據步驟(d)中預測出來的評分,去除應聘者關注過的職位,然后按評分從高到低的順序對職位進行排序,取最前面設定個數Q的職位作為推薦職位。上述的基于GPU加速的招聘職位智能推薦方法,步驟(a)中所記錄的靜態(tài)屬性包括年齡、最高學歷、工作經驗、現居城市、專長、期望職位和期望薪酬范圍;所記錄的動態(tài)屬性包括職位的瀏覽次數、是否關注了職位、是否投遞了簡歷和職位的搜索次數。上述的基于GPU加速的招聘職位智能推薦方法,在步驟(b)中,應聘者對職位的評分的計算方法如下首先設定各種動態(tài)屬性的權重,其次把各種動態(tài)屬性的數值與相應的權重相乘,最后把所有乘積相加所得的和作為職位評分。上述的基于GPU加速的招聘職位智能推薦方法,在步驟(b)中,對數值進行運算時,使用GPU加速,一個GPU線程計算一個應聘者對于一個職位的評分,最終生成評分矩陣;評分矩陣的大小為M*N, M為職位數量,N為應聘者數量,矩陣的元素(i, j)表示應聘者j對于職位i的評分。上述的基于GPU加速的招聘職位智能推薦方法,在步驟(C)中,在計算任意兩個應聘者之間的相似度時,對于應聘者A,需要計算應聘者A和其他所有應聘者的相似度,此時根據應聘者A的屬性分為兩種情況
(c-1)應聘者A不存在動態(tài)屬性利用應聘者A的靜態(tài)屬性計算與其他應聘者的相似度;計算方法如下首先設定各種靜態(tài)屬性的權重,其次對兩個應聘者的所有靜態(tài)屬性進行比較,當某種靜態(tài)屬性相同時,則把相應的權重累加起來,最后得到的累加和作為相似度;
(c-2)應聘者A存在動態(tài)屬性利用應聘者A的動態(tài)屬性計算與其他應聘者的相似度;計算兩個應聘者的相似度的方法如下從步驟(b)生成的評分矩陣中,分別讀取評分矩陣中這兩個應聘者的評分向量,運用歐幾里德距離的方法計算這兩個向量的距離,把這個距離作為這兩個應聘者的相似度。上述的基于GPU加速的招聘職位智能推薦方法,在步驟(C)中,每兩個應聘者的相似度由一個GPU線程進行運算,運算的結果保存為相似度矩陣的一個元素;相似度矩陣大小為N*N, N為應聘者的數量,矩陣元素(i, j)的值表示應聘者i和應聘者j的相似度。上述的基于GPU加速的招聘職位智能推薦方法,在步驟(d)中,預測矩陣的生成過程如下
(c-3)把評分矩陣(M*N)和相似度矩陣(N*N)讀入到顯存;
(c-4)使用GPU計算評分矩陣與相似度矩陣的乘積,得到矩陣(M*N),此矩陣即為預測矩陣。上述的基于GPU加速的招聘職位智能推薦方法,在步驟(e)中,為每一個應聘者計算預測評分最大的Q個職位,其計算方法如下對于步驟(d)中求出的預測矩陣,每一個GPU線程讀取一個列向量,即一個應聘者對所有職位的預測評分向量,然后把此應聘者關注過的職位的對應元素的值設置為0,然后求取向量中前Q個最大的元素,把這些元素對應的職位構成一個推薦職位向量;最終把所有應聘者的推薦向量合并得到推薦矩陣。 與現有技術相比,本發(fā)明具有如下優(yōu)點和效果
(一)把應聘者的注冊信息和訪問信息表達成適合GPU處理的矩陣形式,整個推薦過程利用GPU的高性能的并發(fā)運算能力和高帶寬特性進行計算,大大縮短計算時間;
(二)與傳統的CPU計算相比,在同等的硬件成本的條件下,在處理海量的應聘者數量和職位數量時,性能可以提高十倍、甚至百倍以上;
(三)通過計算應聘者之間的相似性,分析與應聘者最為相似的應聘者所關注的職位,為應聘者推薦職位,這可以為應聘者推薦個性化的職位,與傳統的基于統計的推薦方法相t匕,推薦結果更適合應聘者;
(四)使用這種新型推薦方法,可以把那些并不熱門但卻可能適合應聘者的職位推薦給應聘者,而這是傳統技術的推薦方法所力不能及的;
(五)本發(fā)明在處理海量數據時,避開了傳統的昂貴的計算機集群技術,而采用高性價比的GPU技術,最終實現高性能、低功耗、低成本的目標。


圖I為智能推薦方法的原理圖。圖2為實施方式中基于GPU加速的招聘職位智能推薦方法的流程圖。
具體實施例方式以下結合附圖對本發(fā)明的實施方式作進一步說明,但本發(fā)明的實施不限于此。圖I為智能推薦方法原理圖,應聘者注冊和訪問招聘網站的信息被記錄為靜態(tài)和動態(tài)屬性信息,儲存在數據庫中;根據應聘者的屬性信息生成“相似度矩陣”和“評分矩陣”;根據“相似度矩陣”和“評分矩陣”計算生成“預測矩陣”,此矩陣包含了應聘者對所有職位的評分的預測值;最后根據“評分矩陣”和“預測矩陣”生成“推薦矩陣”,此矩陣包含了為應聘者推薦的職位的數據。本實施例需要獨立顯卡的支持,顯卡選擇NVIDIA GeForce GTX 590,核心頻率為612MHz,有1024個流處理單元,顯存為DDR5 3G。如圖2,基于GPU加速的招聘職位智能推薦方法的主要流程包括以下步驟
(I)當應聘者在招聘網站注冊為用戶時,網站記錄應聘者的靜態(tài)屬性,靜態(tài)屬性包括年齡、最高學歷、工作經驗、現居城市、專長、期望職位和期望薪酬范圍;當應聘者注冊成功,并訪問網站進行職位搜索和瀏覽時,網站記錄應聘者的動態(tài)屬性,動態(tài)屬性包括職位的瀏覽次數、是否關注了職位、是否投遞了簡歷和職位的搜索次數。為了節(jié)約數據的儲存空間和方便計算,各類信息都以數字形式儲存,取值如表I所示。表I
類別名稱取值
靜態(tài)屬性^
最高學歷數字,比如I (代表“大專,
工作經驗數字,比如2 (代表“二年,
現居城市數字,比如020 (代表“廣州3
專長數字,比如0123(代表rtJava編程
期望職位數字,比如1234 (代表“程序員,
期望薪酬葙圍數字,比如3(代表“5000-7000元,
動態(tài)屬性職位瀏覽次數數字
是否關注數字,關注為I否則為0
是否投遞筒歷數字,投遞為I否則為0
搜索次數數字
(1-1)靜態(tài)屬性中的“最高學歷”,依據下列對應關系取值“初中”為1,“高中”為2,“大專”為3,“本科”為4,“碩士”為5,“博士”為6。( 1-2)靜態(tài)屬性中的“現居城市”,其值為對應城市的電話區(qū)號。(1-3)靜態(tài)屬性中的“專長”,其值為招聘網站上此應聘者的專長對應的編號。專長編號的編制方法是根據招聘網站上所有職位的專長技能按職位類別進行排序,排序后的序號為相應專長的編號。
(1-4)靜態(tài)屬性中的“期望職位”,其值為招聘網站上此應聘者的期望職位的編號。期望職位編號的編制方法是招聘網站上所有職位按職位名稱進行排序,排序后的序號為相應職位的編號。(1-5)靜態(tài)屬性中的“期望薪酬范圍”,其值為薪酬范圍對應的編號。薪酬范圍編號的編制方法是1 :1000-3000 元,2 =3000-5000 元,3 :5000-7000 元,4 :7000-9000 元,5 9000元以上。(2)根據應聘者的動態(tài)屬性,計算應聘者對其瀏覽過的職位的評分,形成評分矩陣。計算評分時,我們采用加權求和的方式
(2-1)創(chuàng)建評分矩陣,大小為M*N(M為職位數量,N為應聘者數量),矩陣的元素(i,j)表示應聘者j對于職位i的評分,所有元素值初始化為0 ;
(2-2)設定各類動態(tài)屬性的權重“職位瀏覽次數”權重為0. 3,“是否關注”為0. 2,“是 否投遞簡歷”為0. 4,“搜索次數”為0. I ;
(2-3)運用GPU進行評分計算,每一個GPU線程計算一個應聘者對一個職位的評分。計算方法為各類動態(tài)屬性的數值與相應的權重的乘積相加,即,評分=職位瀏覽次數X 0.3+是否關注X 0. 2 +是否投遞簡歷X 0. 4 +搜索次數X 0. I。(2-4)把步驟(2-3)的計算結果存為評分矩陣的對應元素的值。(3)計算應聘者兩兩之間的相似度,形成相似度矩陣。如果應聘者是新注冊會員,則網站只有他的靜態(tài)屬性;如果是操作過相關職位的老會員,則網站擁有他的靜態(tài)屬性和動態(tài)屬性。計算步驟如下
(3-1)創(chuàng)建相似度矩陣,大小為N*N (N為應聘者的數量),矩陣元素(i,j)表示應聘者i和應聘者j的相似度,所有元素值初始化為0 ;
(3-2)對于新注冊會員,利用應聘者A的靜態(tài)屬性計算與其他應聘者的相似度。計算步驟如下
(3-2-1)設定各種靜態(tài)屬性的權重,年齡權重為0.05,最高學歷為0. 1,工作經驗為0. 15,現居城市為0. I,專長為0. 2,期望職位為0. 2,期望薪酬范圍為0. 2 ;
(3-2-2)利用GPU計算此會員與其他應聘者的相似度,每個GPU線程負責其與另一個應聘者的靜態(tài)屬性的比較當某種靜態(tài)屬性相同時,則把相應的權重累加起來,最后得到的累加和即為相似度;
(3-3)對于老會員,利用應聘者A的動態(tài)屬性計算與其他應聘者的相似度。使用GPU進行高性能計算,每個GPU線程兩個應聘者之間的相似度,線程從步驟⑵生成的評分矩陣中分別讀取這兩個應聘者的評分向量,運用歐幾里德距離的方法計算這兩個向量的距離,把這個距離作為這兩個應聘者的相似度;
(3-4)把步驟(3-2)或者步驟(3-3)的計算結果存為相似度矩陣的對應元素。(4)利用評分矩陣和相似度矩陣,預測應聘者對職位的評分,形成預測矩陣;步驟為(M為職位數量,N為應聘者數量)
(4-1)把評分矩陣(大小為M*N)和相似度矩陣(大小為N*N)讀入到顯存;
(4-2)使用GPU計算評分矩陣與相似度矩陣的乘積,得到一個矩陣,矩陣大小為M*N。(4-3)步驟(4-2)生成的矩陣就是預測矩陣(大小為M*N),矩陣的元素(i,j)表示我們預測應聘者j對于職位i的評分。
(5)為應聘者推薦職位,形成推薦矩陣。步驟(d)中生成的預測矩陣,每一個列向量都表示對應的應聘者對各個職位的預測評分,只要把其中應聘者已經關注過的職位去除,在剩下的職位中選取預測評分最高的前5個職位,就可以把它們推薦給應聘者。推薦矩陣的生成步驟如下(N為應聘者的數量)
(5-1)創(chuàng)建推薦矩陣,大小為5*N,矩陣的元素(i,j)的值就是應聘者j的第i個推薦職位,所有元素值初始化為0 ;
(5-2)把步驟(2)求出的評分矩陣和步驟(4)中求出的預測矩陣讀入顯存;
(5-3)在GPU中,創(chuàng)建N個GPU線程,每個線程負責一個應聘者的職位推薦計算。GPU線程讀取從評分矩陣和預測矩陣中分別讀取一個列向量,即一個應聘者對 所有職位的評分向量和預測評分向量,這兩個向量長度一樣,元素一一對應。然后對預測評分向量作如下操作對于預測評分向量的每個元素e,如果評分向量的對應元素的值不為0,則把元素e的值設為0,否則不改變。(5-4)每個GPU線程求取預測評分向量中元素值最大的前5個元素的位置,把這些位置數據存入到推薦矩陣中對應的列上。(5-6)當預測評分矩陣的每一列都處理完畢之后,推薦矩陣就完成了。
權利要求
1.基于GPU加速的招聘職位智能推薦方法,其特征在于,包括以下步驟 (a)記錄應聘者的注冊和訪問信息,注冊的信息作為應聘者靜態(tài)屬性,訪問的信息作為應聘者動態(tài)屬性; (b)根據應聘者的動態(tài)屬性,計算應聘者對職位的評分,形成評分矩陣; (C)根據應聘者的靜態(tài)屬性、動態(tài)屬性和對職位的評分,計算所有應聘者中任意兩個之間的相似度,形成相似度矩陣; (d)利用評分矩陣和相似度矩陣,預測應聘者對職位的評分,形成預測矩陣; (e)根據步驟(d)中預測出來的評分,去除應聘者關注過的職位,然后按評分從高到低的順序對職位進行排序,取最前面設定個數Q的職位作為推薦職位。
2.根據權利要求I所述基于GPU加速的招聘職位智能推薦方法,其特征在于步驟(a)中所記錄的靜態(tài)屬性包括年齡、最高學歷、工作經驗、現居城市、專長、期望職位和期望薪酬范圍;所記錄的動態(tài)屬性包括職位的瀏覽次數、是否關注了職位、是否投遞了簡歷和職位的搜索次數。
3.根據權利要求I所述基于GPU加速的招聘職位智能推薦方法,其特征在于在步驟(b)中,應聘者對職位的評分的計算方法如下首先設定各種動態(tài)屬性的權重,其次把各種動態(tài)屬性的數值與相應的權重相乘,最后把所有乘積相加所得的和作為職位評分。
4.根據權利要求I所述基于GPU加速的招聘職位智能推薦方法,其特征在于在步驟(b)中,對數值進行運算時,使用GPU加速,一個GPU線程計算一個應聘者對于一個職位的評分,最終生成評分矩陣;評分矩陣的大小為M*N,M為職位數量,N為應聘者數量,矩陣的元素(i, j)表示應聘者j對于職位i的評分。
5.根據權利要求I所述基于GPU加速的招聘職位智能推薦方法,其特征在于在步驟(c)中,在計算任意兩個應聘者之間的相似度時,對于應聘者A,需要計算應聘者A和其他所有應聘者的相似度,此時根據應聘者A的屬性分為兩種情況 (c-1)應聘者A不存在動態(tài)屬性利用應聘者A的靜態(tài)屬性計算與其他應聘者的相似度;計算方法如下首先設定各種靜態(tài)屬性的權重,其次對兩個應聘者的所有靜態(tài)屬性進行比較,當某種靜態(tài)屬性相同時,則把相應的權重累加起來,最后得到的累加和作為相似度; (c-2)應聘者A存在動態(tài)屬性利用應聘者A的動態(tài)屬性計算與其他應聘者的相似度;計算兩個應聘者的相似度的方法如下從步驟(b)生成的評分矩陣中,分別讀取評分矩陣中這兩個應聘者的評分向量,運用歐幾里德距離的方法計算這兩個向量的距離,把這個距離作為這兩個應聘者的相似度。
6.根據權利要求I所述基于GPU加速的招聘職位智能推薦方法,其特征在于在步驟(c)中,每兩個應聘者的相似度由一個GPU線程進行運算,運算的結果保存為相似度矩陣的一個元素;相似度矩陣大小為N*N,N為應聘者的數量,矩陣元素(i,j)的值表示應聘者i和應聘者j的相似度。
7.根據權利要求I所述基于GPU加速的招聘職位智能推薦方法,其特征在于在步驟(d)中,預測矩陣的生成過程如下 (c-1)把評分矩陣(M*N)和相似度矩陣(N*N)讀入到顯存; (c-2)使用GPU計算評分矩陣與相似度矩陣的乘積,得到矩陣(M*N),此矩陣即為預測矩陣。
8.根據權利要求I所述基于GPU加速的招聘職位智能推薦方法,其特征在于在步驟(e)中,為每一個應聘者計算預測評分最大的Q個職位,其計算方法如下對于步驟(d)中求出的預測矩陣,每一個GPU線程讀取一個列向量,即一個應聘者對所有職位的預測評分向量,然后把此應聘者關注過的職位的對應元素的值設置為O,然后求取向量中前Q個最大的元素,把這些元素對應的職位構成一個推薦職位向量;最終把所有應聘者的推薦向量合并得到推薦矩陣。
全文摘要
本發(fā)明提供基于GPU加速的招聘職位智能推薦方法,應用于人才招聘網站上的推薦引擎。本發(fā)明把應聘者的注冊信息和訪問信息表達成適合GPU處理的矩陣形式,利用GPU強大處理能力和高帶寬彌補CPU性能不足的計算方式,使用數千個GPU線程進行并發(fā)計算。本發(fā)明使用歐幾里德距離公式計算應聘者兩兩之間的相似程度,然后根據應聘者的屬性信息,智能地預測所有職位對應聘者的適合程度,最后把最合適的職位推薦給應聘者。本發(fā)明在處理海量數據時,避開了傳統的昂貴的計算機集群技術,而采用高性價比的GPU技術,最終實現高性能、低功耗、低成本的最終目標。
文檔編號G06Q50/10GK102708525SQ20121015909
公開日2012年10月3日 申請日期2012年5月22日 優(yōu)先權日2012年5月22日
發(fā)明者楊忠明, 林泳, 林鎮(zhèn)澤, 秦勇, 蔡昭權, 黃翰 申請人:華南理工大學
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1