ヒューレットパッカード社の社員の離職リスク予測...

24
ヒヒヒヒヒヒヒヒヒヒヒヒヒ ヒヒヒヒヒヒヒヒヒヒ ヒヒヒヒヒヒヒ @tokoroten ヒヒヒヒヒヒヒヒヒヒヒヒ http://ml-business.connpass.com/event/36234 / 2016/08/28

Transcript of ヒューレットパッカード社の社員の離職リスク予測...

Page 1: ヒューレットパッカード社の社員の離職リスク予測 第一回機械学習ビジネス研究会 #ml_business

ヒューレットパッカード社の

社員の離職リスク予測中山ところてん

@tokoroten第一回機械学習ビジネス研究会

http://ml-business.connpass.com/event/36234/2016/08/28

Page 2: ヒューレットパッカード社の社員の離職リスク予測 第一回機械学習ビジネス研究会 #ml_business

自己紹介

•ところてん

•所属• Emotion Intelligence

•職歴• 半導体計測機開発• 情報セキュリティ、ビッグデータ• ソーシャルゲームデータ分析、ソーシャルゲームゲームディレクター、広告分析• EC周りのデータ分析、興味解析、購買予測、広告 CPA最適化

Page 3: ヒューレットパッカード社の社員の離職リスク予測 第一回機械学習ビジネス研究会 #ml_business

お仕事

https://www.zenclerk.com/

• ZenClerk• クーポンを「配布しない」サービス

• 配布だけならだれでもできる• 利益が改善するように配布するようにするのがミソ

• ユーザの行動や、マウスの動きから、「クーポンを渡したら購買に転じる人」を予測• ABテストを行い、リフトを計測• 基盤作ったり、アルゴリズム作ったり、営業したり

Page 4: ヒューレットパッカード社の社員の離職リスク予測 第一回機械学習ビジネス研究会 #ml_business

お仕事

https://www.zenclerk.com/interest_widget/

• Interest Widget• マウスの動きはページスクロールから、商品への興味を予測• お客様が「興味を持ったであろう商品」を自動で記録し、提示するサービス• 興味推定アルゴリズムを作ったり、営業したり

Page 5: ヒューレットパッカード社の社員の離職リスク予測 第一回機械学習ビジネス研究会 #ml_business

出典書籍

• ヤバい予測学• ビジネス寄りの機械学習に関する書籍• 原著: The Power of Predict Who Will Click,Buy,

Lie,or Die• 原著は 2016年に改訂版が出ている

• 2章 88pより

• プライバシーの攻防、という章の中で、企業が従業員を監視・予測しているという文脈で紹介• ほかにも Target社( EC通販)の妊婦予測なども併せて紹介、購買履歴から妊婦かどうかを予測する

• 本スライドでは、書籍の内容外の私の考えには「メモ」と付けてあります

https://www.amazon.co.jp/dp/4484131250

Page 6: ヒューレットパッカード社の社員の離職リスク予測 第一回機械学習ビジネス研究会 #ml_business

HP社の離職予測•初出は 2011年の Predictive Analytics Worldというカンファレンス• http://

www.predictiveanalyticsworld.com/london/2011/agenda.php#day1-5a• 要約:離職が予測できると、コスト削減したり、原因追及したりできる

メモ: Attrition は「摩耗」「損耗」の意味がだが、ここでは「社員の減少」を意味するっぽい

Page 7: ヒューレットパッカード社の社員の離職リスク予測 第一回機械学習ビジネス研究会 #ml_business

書籍中での解説

• HPのインドのバンガロールの分析チームが開発• Flight Risk

• メモ:直訳すると「高跳びリスク」、「離職リスク」の意味

•訓練データ• 給与、昇進、昇給、勤務評価、ジョブローテーション等のデータ 2年分• 実際に社員が辞めたかどうか

•実験対象• HPの「営業の管理」部門• 「営業の管理」には専門スキルが要求されるために、育成コストが高い• M&Aにより組織成長しているため、組織内の報奨制度がつぎはぎだらけ

• メモ:報奨制度の対照実験の環境が図らずとも実現されている?

Page 8: ヒューレットパッカード社の社員の離職リスク予測 第一回機械学習ビジネス研究会 #ml_business

分析結果

• 精度・効果• フライトリスクが高い方から 40%の従業員に退職者の 75%が含まれる• 欠員補充や生産性の低下に対して、推定三億ドルのコスト削減効果

• 辞めない傾向にある社員• 給料が高い、昇給が多い、勤務評価が向上している

• メモ:もし勤務評価が悪い人をクビにしているなら、生存バイアスなのでは・・・• 頻繁なジョブローテ

• 定期的な仕事の変化が日常業務を面白いと感じさせるのでは?という考察

• 辞める傾向にある社員• 昇進の回数が多い社員、昇進に対して昇給が小幅な社員

• メモ:人員不足 ->給与据え置き昇進 -> 責任だけ増えるというコンボか?• メモ:HPの肩書を利用して、給与の他社に転職するのだと思われる

Page 9: ヒューレットパッカード社の社員の離職リスク予測 第一回機械学習ビジネス研究会 #ml_business

運用

•フライトリスクを導入したチームでは、離職率が 20%から15%に減少•フライトリスクは一年に四回更新•データの取り扱いに関して、「解釈」「限界」「悪影響」について訓練を受けたごく一部の幹部社員にのみ情報開示、自分の部下しか閲覧できない•社員名は暗号化されており、幹部が持つ暗号鍵でのみ復号可能

•メモ:• データを読むための訓練を施すというのが大変良い• 正しくデータ分析を運用するための仕組みが会社として備わっている

Page 10: ヒューレットパッカード社の社員の離職リスク予測 第一回機械学習ビジネス研究会 #ml_business

なぜ離職予測がコスト削減につながるのか?

• 書籍の中で深く触れられていなかったので、自分で計算をしてみる• 日本基準で計算しているので、エージェントコストが支配的

• 一人辞めると、年俸の 50% くらいのコストがかかると見ていい

• 離職率 20 %だと、 20%の人員に 50%のコスト増がかかるので、給与支払対して 10%のコスト増

• 考察• 超過勤務に伴う他の社員の疲弊、離職リスクの増大等を考えると、副次的な効果はもっと多そう

• 離職率が下がると、大幅なコストカットができることがわかる

• 離職率が 2pt 下がると、コストが給与の 1%分下がる

社員の基本的な数値類 unit年俸 800 /万円 年営業日 240 /日 年有給休暇 20 /日 年実労働日数 220 /日 年1日あたりコスト 3.6 /万円 日

退職に伴うコスト(生産性低下)引継ぎ日数(本人) 10 日引継ぎ日数(同僚) 10 日引継ぎによる費用 72.7 万円

採用に伴うコスト社員の採用稼働 10 日社員の採用稼働コスト 36.4 万円エージェント採用料率(年俸に対して) 40%エージェントコスト 320 万円

欠員に対する同僚の超過労働コスト欠員期間 20 日超過労働による給与割り増し 25%超過労働に伴う支払 18.2 万円

教育に対するコスト教育期間 20 日教育に対するコスト 72.7 万円

社員が一人辞めると、欠員補充に対するコスト 520 万円年俸比率 65%

Page 11: ヒューレットパッカード社の社員の離職リスク予測 第一回機械学習ビジネス研究会 #ml_business

なぜ離職予測がコスト削減につながるのか?(別試算)

•会計事務所 (PwC社 )のコンサルタントの試算•自分の推定とだいたい同じ

• 有給消化をコストとするのは…

https://www.rosei.jp/jinjour/article.php?entry_no=64795

Page 12: ヒューレットパッカード社の社員の離職リスク予測 第一回機械学習ビジネス研究会 #ml_business

原典を読んでみる

•発表資料は未公開、カンファレンス参加者にのみ公開?• HPのサイトからも見つけられず

•ヤバい予測学の著者のブログに当時の記事が載っていた• http://www.predictiveanalyticsworld.com/patimes/the-privacy-pickle

-hewlett-packards-prediction-of-employee-behavior/2716/• 割と本の内容そのままだが、一部違うことが書いてある

•ブログと書籍の内容の相違• HPの社員は離職スコアのことを知らされていない• 社員を罰するのではなく、離職率を下げるために行っている• 「ドリルダウン」はしない、全体を俯瞰してパターンを発見するのに使う

Page 13: ヒューレットパッカード社の社員の離職リスク予測 第一回機械学習ビジネス研究会 #ml_business

近しい事例を漁ってみる

• 退社予備軍を見つけ出せ―データ分析通じて離職防止• http://jp.wsj.com/articles/SB10030317691824024149004580519030769809198

• クレディ・スイス ( 金融 )• 大所帯のチームで無能なマネージャーの下で働いていると、離職しやすい• 空きポストに対して、離職リスクの高い人から優先して声掛け

• ボロメトリックス(組織分析サービス、2015年9 月 MSに買収、Officeと融合?)• 同僚との交流、必要な会議以外のイベントへの出席から離職を予測

• アルティメット・ソフトウエア(労務・給与管理システム会社)• 福利厚生の適用を放棄した社員と、離職の相関を発見

• マイクロン・テクノロジー (半導体 )• 製造部門において採用時の業務説明内容が不正確だと、離職リスクが高い• 仕事のために引っ越しをした社員は離職リスクが高い

• ウォルマート• 社員の昇進時期を予測、後任を確保するために利用。毎年16 万人が昇進

Page 14: ヒューレットパッカード社の社員の離職リスク予測 第一回機械学習ビジネス研究会 #ml_business

近しい事例を漁ってみる

• Googleは辞めそうな社員を予測している• http://japan.zdnet.com/article/20393400/• http://www.wsj.com/articles/SB124269038041932531

• 看護師の採用で「辞めない人材」を予測• https://web.archive.org/web/20160125223928/http://

www.sankeibiz.jp/macro/news/160125/mcb1601250500017-n1.htm• Pegged Software(http://www.peggedsoftware.com/ )を利用

• キーボードの打ち方や、1つのページに何秒間とどまるか、ブラウザーのタブをいつ閉じるかといったデータから、アルゴリズムを使って候補者の仕事ぶりを予測することができるという。

• 例えば、ストレスの大きい状況に直面したときの反応を試すために、数学を専門としない人に微分積分の問題を出し、固まってしまうか、別のページに移動するか、答えを入力したり修正したりするかといった反応を測定する。

Page 15: ヒューレットパッカード社の社員の離職リスク予測 第一回機械学習ビジネス研究会 #ml_business

近しい事例を漁ってみる

• Analyzing Employee Turnover- Predictive Methods• https://

www.linkedin.com/pulse/analyzing-employee-turnover-predictive-methods-richard-rosenow-pmp• 転職予測に使うアルゴリズムの説明

• Logistic Regression• Survival Analysis(生存分析)• 決定木•ランダムフォレスト

•まぁ、そうだよね…。離職予測に特別な技術は要らないみたい。

Page 16: ヒューレットパッカード社の社員の離職リスク予測 第一回機械学習ビジネス研究会 #ml_business

離職予測ができるサービス

• IBM Watson• 決定木で出力してくれるらしい(労働時間、職位、 SOの有無などが

見える)

https://www.ibm.com/blogs/watson-analytics/watson-analytics-use-case-for-hr-retaining-valuable-employees/

Page 17: ヒューレットパッカード社の社員の離職リスク予測 第一回機械学習ビジネス研究会 #ml_business

離職予測ができるサービス

• Talent Analytics• アルゴリズム不明

http://www.talentanalytics.com/predict-employee-flight-risk-predictive-talent-analytics/

Page 18: ヒューレットパッカード社の社員の離職リスク予測 第一回機械学習ビジネス研究会 #ml_business

離職予測ができるサービス

• workday• 統合人材管理ツール

http://www.workday.com/jp/applications/professional_services_automation.php

Page 19: ヒューレットパッカード社の社員の離職リスク予測 第一回機械学習ビジネス研究会 #ml_business

クラウドソーシングでのアルゴリズム作成

• CrowdANALYTIXのコンテスト• SanDiskの依頼で本番データでガチ• 複数のデータサイエンティストが競う• 賞金は 9000ドル

• SlideShareに解説が上がっていた• http://

www.slideshare.net/divyabh/employee-attrition-analysis

• 精度は 決定木> RF > KSVM > LR の順• 直観に反する順番、何かトリックがあるのかも• 特別な技術は特に要らないことが示唆される

• ジョブランクが高くて、勤続年数が長い人は残りやすい(あたりまえ)

• 末端ノードにわりと原因が現れる(黒塗り)

https://www.crowdanalytix.com/contests/employee-attrition-analysis

Page 20: ヒューレットパッカード社の社員の離職リスク予測 第一回機械学習ビジネス研究会 #ml_business

• 株式会社 susque、サブロク• 日本のストレスチェック義務化の流れと、北米の離職予測を融合• 勤怠管理+ストレスチェックから、鬱病発症予測、離職予測を実現• その会社に新入社員が入った場合の離職リスクを予測、新人選抜コストを下げる

日本での取り組み状況

http://officelife.tokyo/A/fintech/campany/102 http://r36.jp/

Page 21: ヒューレットパッカード社の社員の離職リスク予測 第一回機械学習ビジネス研究会 #ml_business

• priskHR• http://www.prisk.jp/• 文脈としてはサブロクと同一、ストレスチェック+離職予測• データマイニング機能はなさそう?• 分析レポート、コンサルティングはオプションサービス

日本での取り組み状況

Page 22: ヒューレットパッカード社の社員の離職リスク予測 第一回機械学習ビジネス研究会 #ml_business

集団分析から個人介入へ

•個人分析に向かっている• HPは「個人を罰するためにには使わない」と言っている• WSJの事例やサブロクでは個人のスコアを予測して、介入を実施

•これまともに運用できるのか?• 今でさえ「上司がアンケートを見るから、全部最高評価にしておいた」と言ってるやつがゴロゴロいる

• HPでさえ幹部に対してデータの読み方の訓練を施して、そのうえで「集団の傾向は信頼できるが、個人のスコアは信頼できない」としている

• HPでさえ取り扱いが難しい劇薬を、どのように取り扱っていくのか?• 社員 100人の会社の人事や社長のレベルで取り扱えるのか?

•どうすれば運用に乗るのか?

Page 23: ヒューレットパッカード社の社員の離職リスク予測 第一回機械学習ビジネス研究会 #ml_business

まとめ

• 離職予測は北米では一般的になっている• 採用コストは年俸の50%程度• 離職率が下げられると、大きなコスト削減

• 離職予測には特別な技術は要らない• DT、RF、 LR、生存時間分析あたりでよさそう• データさえあれば、だれでも簡単にできそう

• ここ一年に日本でも離職予測の流れが来ている• メンタルヘルス診断の義務化と、AIブームの合わせ技で、調達ドン• 良質なデータセットが手に入るようになった

• うつ病頻発(目的変数)メンタルヘルス診断の義務化(説明変数)

• でも離職予測のデータを使える人が育ってるの?• アクションをどうやってセットにして売るか?がカギっぽい(会場でのディスカッションから)

Page 24: ヒューレットパッカード社の社員の離職リスク予測 第一回機械学習ビジネス研究会 #ml_business

終わりに

•アルゴリズムの開発者は「自分のフライトリスクは高い」と語る

https://www.linkedin.com/in/anindya-sankar-dey-396479a

HP → アクセンチュア → ウォルマートラボ( ノ∀ `) アチャー