導讀:目前基於使用者畫像的標籤體系在各行各業開始得到應用,對於涉及範圍廣,專業知識深的網際網路招聘領域來說,建立標籤體系的難點是什麼呢?應該如何建立標籤體系?怎麼驗證標籤體系的準確性?文章對這三個問題展開了分析探討,與大家分享。
電商行業客觀來說屬於比較簡單的toC領域,知識網路是比較容易理解的通用知識,可透過使用者的購買習慣、偏好、商品品類等建立標籤體系。醫療行業屬於專業性強的領域,建立標籤體系必須要懂醫療技術的專家團隊才可以,但是易於操作的是,只需要醫療一個領域專家就可以完成專業的標籤體系建設。
但對於招聘行業來說,行業、職位涉及範圍廣,且專業性強,因為各行各業的公司和求職者都會透過招聘平臺建立聯絡,而且有很多高精專的職位和候選人,怎麼評估B/C端之間專業技能、工種、行業之間的匹配度,確是一大難點,而且理論上來說需要集齊各個行業、各種職位的專家人員才能建立起招聘行業的標籤體系,但這在現實中要怎麼操作呢?
那麼機器是否可以自動完成招聘領域的標籤體系建設呢?用NLP抽取職位JD中的描述並將其聚類,比如抽取Java、spring、Unix、Visio、Excel等工具技能,原型設計、互動設計、需求分析等工作內容技能,使用者運營、產品運營、資料運營等工作方向技能,這是網際網路從業者最熟悉的開發、產品、運營的工作內容和技能,如果機器可以識別這些類別標籤就很完美了。
但現實卻是看似的完美與和諧,萬一Java是出現在了招聘專員的職位描述中呢?使用者寫的是“負責招聘Java工程師”,假如Visio出現在Java工程師的描述中呢?假如Excel出現在運營專員的職位描述中呢?這些技能還是不是這個崗位的核心能力?
首先,Java出現在招聘專員出其實是可以用硬規則過濾掉的,比如限制職位和技能的關係,也就是說不是所有技能都滿足所有職位,有的技能只適用於某些職位,在其他職位內就是無效資訊。
其次,需求分析是不是產品經理的技能標籤呢?有的人說肯定是了,這個回答可以說對也可以說不對,對是因為需求分析確實是產品的必備能力和工作內容,不對是因為所有的產品經理都需要需求分析,那這個能力還是該產品經理區別於其他產品經理的能力嗎?
最後Excel會出現在運營專員內、也會出現在招聘專員內,也會出現在統計專員內,那麼它還是個核心的技能標籤嗎?
透過以上分析可得到以下歸納性的總結:
- 不是所有技能都適用於所有的職位,應該定義每個職位的核心技能標籤體系,因為非核心的技能有時候不僅無效還會起到反作用;
- 不是所有該職位需要的技能或者做的工作內容都是該職位的技能標籤,因為它是該崗位的通用能力沒有區別度,技能標籤應該是該職位工種的核心技能且是可以區別不同職位或簡歷的。
所以透過以上分析可知,純NLP機器識別的方式不能完成招聘領域的標籤體系建設,因為機器沒辦法在一個崗位的眾多技能中篩選出哪些是重要的知識技能,哪些是不重要的知識技能。
二、如何建立招聘領域的標籤體系1. 基於靜態資訊的通用標準化標籤招聘領域的標籤大家首先可以想到的就是學歷、工作年限、薪資範圍等比較通用的職位/簡歷端匹配維度,當然這些顯性通用的標籤早已被各招聘平臺做成了結構化的篩選項。
其次還有一些比較小眾的維度要求,比如有的職位要求海外經歷、黨員、國企工作經歷、籍貫、年齡等,有些平臺也把其中的某些維度做成了平臺上的結構化標籤。
不過這些不是我們研究的重點,我們主要研究的是每個職位專業的知識方向的技能。
2. 基於靜態資訊的專業知識精細化標籤建立專業知識標籤體系的重點就是建立專業的崗位研究專家團隊,想要做某個崗位的專業知識標籤研究,肯定需要熟悉該崗位的人員,是選擇從事該崗位工作的人員呢,還是對這類崗位有所瞭解的HR人員呢?
因此就這兩類人員進行了調研與分析,最終發現從事該崗位的人雖然對所從事的崗位瞭解比較深入,但對其他相關的崗位未必瞭解,也不太瞭解招聘過程中使用者的感知與思維;
HR人員雖然在專業深度上對崗位的瞭解不是很深入,但所瞭解的崗位範圍廣,只要從事過某個行業的HR工作,基本都熟悉該行業所有的崗位與關注的重點技能,且HR經常使用招聘平臺,有使用者感知,對使用者行為與邏輯都非常瞭解,所以HR更適合做崗位專業知識研究,而且該專家團隊最好是來自各個不同行業的HR人員。
團隊建好了,大概的研究思路也有了,接下來就可以好好研究標籤體系具體的生產流程與規則了,對此進行了如下圖的總結:
體系建立的目的肯定是運用在演算法的推薦與搜尋中,初期可以透過離線的漏斗資料轉化對比(命中標籤與未命中標籤的轉化對比)來驗證該標籤體系的離線匹配效果,再者可透過灰度實驗,小流量上線實驗來驗證實際線上的匹配效果。
專業知識標籤關注的只是匹配度的準,最終線上使用肯定還要考慮使用者是否活躍,B端HR是否著急要人,C端求職者是否在找工作,如何平衡專業知識的準與使用者行為的活之間的權重也一大難點,要找到那個準與活平衡的比例區間,在這個區間內線上能實現最大的使用者達成,這方面在此不多做分析,需要演算法同學多次調整模型才能達成。
3. 基於動態資訊的使用者行為標籤基於使用者行為的使用者畫像標籤體系在電商領域中運用廣泛,在招聘領域此類標籤體系同樣適用,只不過電商領域中的“檢視-聯絡賣家-購買”行為在招聘領域變成了“檢視-開聊-達成約面”行為。
電商平臺中的協同過濾理論在招聘平臺也同樣適用,只是變成了基於相似職位的過濾和基於相似候選人的過濾。有的企業以往達成的多數是名校候選人,那麼我們就知道該企業偏好有名校教育經歷的;有的企業招聘銷售崗更傾向於在專業知識體系中的有軟體銷售經驗的候選人,那麼我們就知道該企業偏好軟體行業的銷售候選人。
透過使用者畫像體系我們可以評估使用者的偏好,以期在該使用者以後的推薦中使用其偏好,達到更好的效果。
三、招聘領域靜動態標籤體系的綜合運用靜態通用標籤是所有職類共用的標籤特徵,屬於大批次標準化的生產與運營,通用標籤生產完善了,可以實現粗礦式大步快跑節奏的匹配達成;
而專業知識標籤是每類職位專業的標籤特徵,是小批次精細化的生產與運營,在前面大步快跑達到一定匹配度之後,再結合精細化的小步快跑方式,逐步將每個職類的顆粒度劃分為更精細化的顆粒度,達到更高匹配程度;
在前面標準化、精細化兩輪分類之後資料已經被分成了一個個小類,但卻沒有衡量單個使用者偏好的特徵標籤,而動態的使用者行為標籤就是單個使用者個性化的偏好特徵標籤,使用者的偏好有可能是通用的學歷、年限特徵,也可能是專業知識中某個技術框架、某種產品品類特徵。
最終,靜態標準化通用標籤、專業知識精細化標籤、動態行為個性化偏好標籤,三者相互作用、相輔相成,提升招聘領域線上效果的匹配準確度。
本文由 @豔傑 原創釋出於人人都是產品經理,未經作者許可,禁止轉載。
題圖來自Unsplash,基於CC0協議。