データとサイエンスの話。

先日、とある、機械学習に積極的に投資をしている、とある企業の知人から聞いた話が、昨今流行りのHRアナリティクスやデータサイエンスという観点で興味深かったかったので、書き起こしておこうと思います。

ポイントは「科学的思考」。データサイエンスが「サイエンス」を語るのであれば、科学的思考が必要なのでは?、というお話です。

知人から聞いた話を簡単にまとめると、以下のような感じです
(いろいろぼやかして書いてます)。

A社では、経営陣が、機械学習こそが次の重要な技術トレンドだ!と見定め、機械学習とそのビジネスへの適用に投資をしています。その一環として、機械学習を人事管理に生かせないか、というプロジェクトが始まりました。

チームは早速、人事にまつわる様々なデータを収集し、機械学習を生かして、データの分析を行いました。そこからは、様々な興味深い分析結果が得られたました。

「××なチームはパフォーマンスがいい」

「〇〇な人材は、成果が出ない傾向が高い」

といった形で、色々と、パフォーマンスにつながると考えられる要素が抽出されたのです。

しかし、このチームの方々は大きな問題に直面しました。

なぜ、〇〇や××がパフォーマンスにつながるのか、さっぱりわからなかったのです。データ上はパフォーマンスにつながる傾向があるのだけども、そこにどのような因果があるのか、納得できる説明ができなかったのです。

さあ、困りました。

「データ上は、これをやればパフォーマンスが上がると出ているんです」

と現場の管理職に伝えたところで、「なぜそれがパフォーマンスにつながるのか」がわからない限り、管理職が納得して動いてくれるわけがありません。

結果的に、チームはこの結果を組織運営に生かすことを断念し、別のアプローチを探ることになったのです。

なんとも、残念な、しょっぱいお話です。

まあ、後付けでこういう風に語ってしまうと、とても間抜けな話に見えてしまうのですが、プロジェクトに関わった当人たちは至極真面目に取り組んでいる人たちなわけです。その企業の機械学習への投資っぷりを考えると、かなり優秀な皆さんが関わっているんだろう、と思われます。

なのに、こうした間抜けな事故がおきてしまったのは、一体何なのか、ということを考えるのが本稿の目的です。

ここで、キーワードになるのが、「科学的思考」です。

科学的思考とは、自然界や社会で起きている現象を紐解き、新たな知識を獲得するための一連の手法のことを指します。近代から現代に至る自然科学や社会科学の発展を支えてきた、「知のお作法」と言ってもいいでしょう。

先ほどの事例で行われたことを簡単に要約すると、「データをたくさん集めて、高度な分析手法を使って、何らか興味深い示唆が得られないか探ってみること」ということになりますが、これは、科学的思考とは全く反しています。むしろ、真逆だと言ってもいいくらいです。

なぜこれに問題があるのか、を紐解くために、そもそもデータを分析する目的はなんなのか、というところから始めましょう。

HRアナリティクスのような形でヒトと組織にまつわるデータを分析する目的は、「ある組織現象(例えばハイパフォーマンスの発揮)が起きる要因は何なのか」を知ることであり、さらに言えば、「要因が現象を生む仕組み(言い換えれば、なぜ、どのようにしてその要因が現象の発生につながるのか)」や「どのような時にはその要因は有効なのか(逆に言えば、その要因が効かないような状況ってどんな場面なのか」といったことを理解することだ、と私は理解しています(もちろん、そこで得られた理解をもとに、打ち手を打つこと、がさらに上位の目的だということは言うまでもありません)。簡単にまとめると、以下の図のようになります。

%e7%8f%be%e8%b1%a1%e3%81%a8%e8%a6%81%e5%9b%a0

ちなみに、世の中には、データを分析するのだけれども、必ずしも「why」に対する答えが必要じゃない場面というのもあるのかもしれません。例えば、ウェブサイト上の消費者の動きから、「〇〇を買っている人は、××も買う可能性が高い」みたいな傾向を分析して、広告を表示する、みたいな場面が考えられます。ここでは、結果として売上が上がればいいので、なぜ〇〇の購入と××の購入がつながっているのか(=why)を知る必要はあまり無いかもしれません。

おそらく、アルファ碁のように、機械学習でゲームに勝つための能力を育てる、といった場合も同じでしょう。なぜその打ち手が優れているのかを説明できなくても、実際に勝つ可能性が高い打ち手が打てればいいからです。

しかし、HRアナリティクスのように、人事や組織運営に関わる場面では、whyが重要です。なぜならば、whyが分からないと人は納得できず、納得してもらえないと組織はなかなか動かないからです(ここが組織運営の悩ましいところです)。

そう考えると、やみくもにデータを分析して、何らかの関係性や法則性が見つかったとしても、それだけでは得るものがあまりありません。なぜならば、データは、何かと何かの間に関係があることは語ってくれても、なぜそこに関係があるのか(Why)は語ってくれないからです。

例えば、こういうことです(あえて、極端な例にしてます)。

「リクルーターとの会食で、食事を食べるのが早かった応募者の方が、入社後のパフォーマンスが高い」

ということがデータの分析から得られたとしましょう。でも、なぜ食事を食べるのが早かった学生の入社後のパフォーマンスが高いのかは、わかりません。このままでは、「食事を食べるスピードを選考基準にしましょう!」と主張しても「はあ?」と言われるだけでしょう。

ここから前に進むためには、「食事を食べるのが早い」ことが何を意味するのかを自分なりに紐解いて、それがパフォーマンス発揮にどのようにつながっているか、を仮においてみる(=仮説)必要があります。例えば、

(仮説1)食事を食べるのが早い人材は、総じて物事をやりきろうという意欲が高い。その結果、入社後のパフォーマンスも高いのだ。

とかですね。そして、それをさらなる分析で明らかにする必要があります。これを実際に検証しようとしたら、SPIのような適性テストのデータと突き合わせるとか、でしょうか。

ここで注目していただきたいのは、上記の仮説が筋がいいかどうかではありません(適当に考えた例ですからそこは勘弁してください)。仮説に、「why」に対する自分なりの仮の答え(=意欲が高いから)が含まれている、ということです。仮にこの仮説が非常に説得力あるデータで検証できたら、その説明が検証できたことになりますから、「食事を食べるのが早い応募者は、やりきる意欲が高い、そのため、パフォーマンスが上がるのである」という採用理論を構築することができます。そこまで出来れば、

対象者を絞り込んだ小規模な1Dayイベントを開いて、ランチにお弁当を出して、応募者がそのお弁当を食べるスピードを計測することで選考の判断材料にしましょう!

といった破壊的なイノベーションを提案し、周囲を説得することが可能になります。
(繰り返しになりますが、あくまでも例ですので、間に受けないでください笑)

ただし、議論はそれでは終わりではありません。

もちろん、自分が想定した仮説が、要因と現象の関係を説明する唯一のロジックだ、とは言えないかもしれませんから、他の説明方法はないかな?とさらにwhyを探求する、というのもありえます。例えば、こういう仮説も考えられます。

(仮説2)食事を食べるのが早いと、業務に費やせる時間の量が、食事を食べるのが遅い人材よりも多くなる。そのためにパフォーマンスに差がつくのだ。

これを検証するためには、自社の中堅社員の1日の時間の使い方をセンサーなどで把握して、そこで捉えた行動データと、評価データの関係を分析し、食事にかけている時間のパフォーマンスへの影響を見てみるといいでしょう。そして、仮にこれが検証できたら、さらにそれをもとに、

(仮説3) だとすると、「食事を食べるのが早い人材」がパフォーマンスを上げやすいのは、自社の様々な仕事の中でも「行動量が求められる仕事」に限られるのでは?

といった形で、理論にさらに磨きをかけていくことができます。

このようにして、一つの仮説に対して仮説に対して対立仮説をたてて検証をしてみたり、仮説が検証できた説明(=理論)をもとに次の仮説を立て、それを検証することで、現象に対する理解の厚みをましていくことができます。

これが、科学的思考の力です。

whyに関する論理的な説明を先に考えて(一般的にはこれをtheory =理論、と呼びます)、それを検証する、というアプローチをすることで、初めてwhyに対する答えに近づけるのです。さらに、仮説3で見たように、一つの仮説が検証されれば、その理論をもとに別の仮説を演繹的に積み上げ、さらに理論を発展させることができる、というのも重要です。

逆に、データを分析して何かの関係が見えたとしても、それ自体は、whyについて何も語ってくれません。whyへの答えを考えることができるのは、(私が知る限りではいまのところ)人間だけです。そもそも、whyへの答えを知りたがるのも人間だけかもしれませんが。そして、whyに対する答えがないと、次の理論の積み上げもできないのです。

もちろん、大量にデータを集めてとりあえず関係性を分析してみる、というのが全く意味がない、と言っているわけではありません。そこから、思いもしない関係性がみつかり、それをきっかけに上記の仮説検証サイクルが回り始めることもありえるからです。しかし、何度も言いますが、データを集めてとりあえず関係性を分析しただけでは、「why」に対する答えはまず手に入りません。

日立の以下の事例は、まさにいい例です。

ビッグデータで集客アップ:日立が見出した、イベント会場での「ヒトの行動パターン」とは?

①イベント会場の人の動きをセンサーで情報収集し、②そこから見えた意外な動きのパターンをもとに仮説を立て、③それをもとに会場の誘導方法を変えてみた、そうしたら、実際に効果が出たことで、仮説が検証できた、そして、次の年のイベントは、④得られた結果をもとに会場全体のレイアウトを見直し、それがうまくいくか検証する、というサイクルです。まさに、以下のくだりに、科学的思考の真髄が現れています。

もちろん、日立側が意図したとおりに来場客が動いてくれるかは分からない。今回も人の流れをセンサーで分析し、効果の検証を行う。しかし検証を行えること自体が大事だと、野宮氏は強調した。

結局のところ、本当にどうなっているか、は、自然科学にせよ社会科学にせよなかなか分からないわけで、「今までに分かっている理論から仮説を立てる」→「データを取り、検証してみる」→「その結果をもとに理論を進化させる」→「さらにそれをもとに次の仮説を立てる」というプロセスで、答えに接近していく、というのが大事なわけです。

逆に言えば、「とりあえず分析してみる」ときも、あくまでそれ自体がゴールではなく、この後の科学的思考のプロセスをスタートするきっかけなのだ、と考えて始めることが大事だ、ということです。冒頭の例に話を戻すと、そういう姿勢がチームで共有されていなかった、ということが最大の問題であると私は思います。

広告

投稿者: 吉川克彦(Katsuhiko Yoshikawa)

国際人事・組織論に関する研究者。コンサルタント。 現在はLondon School of Economics and Political Scienceにて博士課程に在籍する傍ら、リクルートマネジメントソリューションズ組織行動研究所にて客員研究員を務める。 主な研究分野は組織論、人材マネジメント論、国際経営論。 Journal of World Businessに査読付き論文が掲載されたほか、Academy of International Business, Academy of Management, Association of Japanese Business Studiesなどの学会にて研究発表の実績あり。また、日本国内でダイバーシティマネジメントについての書籍を出版。人事関連の雑誌や、新聞に論考を寄稿。 コンサルタントとして、様々な業界の日本企業の人事・組織変革を支援。主なテーマは、企業理念の浸透、ダイバーシティマネジメント(女性活躍促進を含む)、人事諸制度の再構築、海外法人における人事体制の確立、次世代リーダー育成、採用戦略の立案など。 1998年にリクルートに入社。人材、組織に関する研究、コンサルティング、サービス開発に従事。2013年に同社を退社。 1974年 兵庫県西宮市生まれ。京都大学経済学部卒。2011年にLondon School of Economics and Political Science にてMSc. Management, Organisations and Governance 修了(Distinction)。

“データとサイエンスの話。” への 1 件のフィードバック

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中