DSOC Data Science Report データサイエンティストのつながり分析 November 9, 2018 Akihito Toda R&D Group Researcher, DSOC, Sansan, Inc.
DSOC Data Science Report データサイエンティストのつながり分析 1 概要 ビッグデータの蓄積や計算技術の向上に伴い データを分析しビジネス上の課題に対してソリューションを導くデータサイエンティストが活躍している マネジメント誌 Harvard Business Review がデータサイエンティストを21 世紀で最もセクシーな職業であると表現したのが 2012 年 10 月であった それから年月が経過しても そのセクシーさにますます磨きをかけていると言える 経済産業省 (2016) は 2025 年までの予測においてデータサイエンティストのニーズがさらに高まることを示しており 企業にとってはデータサイエンティストの確保がますます課題になると指摘しているからである 本稿では そのようなデータサイエンティストがどのような人たちと名刺交換をしているのかについて 個人向け名刺アプリ Eight のデータを基に分析をしたい データサイエンティストのつながりに注目する理由は データサイエンティストに求められているスキルが多岐にわたるため 複数のスキルを身に付けることや仕事での活躍を目的にどのような人と交流をしているのかが複雑であり 目に見えないものであることから その実態を把握することに意義があると考えているためである 日経情報ストラテジー編 (2013) は データサイエンティストに求められているスキルを 3 つ挙げている 一つ目は 着眼点である データ分析を通じて顧客が持つ潜在ニーズを引き出す 既存業務の問題点を浮き彫りにするといったことのためには 何にフォーカスを当てるかといったものの見方が求められる 二つ目は IT の知識である 情報を分析することが求められるため 統計ツールの使い方やプログラミングに関する知識 データマイニングなどの手法を熟知しておく必要がある また 機械学習に代表されるようにモデルに関する知識も求められるために 統計学についての理解も不可欠である 三つ目は 業務理解と現場への説明能力である データサイエンティストは 分析した内容を他部署の人間にも分かりやすく伝える必要がある このように データサイエンティストは エンジニアリングとビジネスの両方について理解が求められる職業であり その理解が伴ってこそ仕事ができるといえる 仕事を進める上で他社の人間と接点を持つ際に どのような人と交流をしているのか データサイエンティストのつながりについて見ていきたい 2 分析対象 分析に当たっては Eightのデータについて個人を匿名化し 2017 年 1 月から2018 年 6 月の期間にユーザーが登録した名刺の情報をEightの利用規約で許諾を得ている範囲で使用した Eightのデータにおいて データサイエンティストであることを判別するために ユーザー自身の名刺情報の役職に データサイエンティスト データアナリスト データストラテジスト と記載がある人を対象とした結果 数百名のサンプルが得られた 一般的には データサイエンティストは ビッグデータを分析し 現場に働きかけてイノベーティブな商品やサービスを生み出し 業務プロセスを革新する人材 と定義される ( 日経情報ストラテジー編 2013) データサイエンティストとデータアナリストは その役割が一部異なることも見られるようだが データに携わる人材ということでやや広めに定義をしている 分析対象とした数百名が対象期間中にどれだけ名刺交換をしているかを以下で分析するが 一般的な人との違いが分かるようにランダムに抽出した数百名のユーザー ( 抽出の結果 データサイエンティストは含まれなかった ) についてのデータも参考サンプルとして結果を示した 分析では データサイエンティストと参考サンプルのそれぞれにおいて 名刺交換枚数の分布 ( ネットワーク分析では次数分布と呼ばれる ) を見た上で 名刺交換をしている相手の部署はどこかといった点について示している 名刺交換をした相手のうち本人と同じ企業に所属している人を除いたため 他社の人間との交流を見ることになる Eightは個人向け名刺アプリであるため 登録されている名刺には 業務の一環として本人の意思によらず名刺を交換したケースも含まれているかもしれないが 自主的に勉強会やイベントなどに参加し そこで受け取った名刺である可能性もあるだろう そういった可能性も踏まえ Eightの名刺情報を分析することで 本人の意思によりどれだけ幅広い交流ができているかをある程度は把握できると考える 01 2018 Sansan, Inc.
0 DSOC Data Science Report 3 分析結果 図 1は データサイエンティストがどれだけ名刺交換をしているかを表した分布である 1 データサイエンティストと参考サンプルを比較すると 多少の増減はあるが 名刺交換枚数が多くなるにつれて構成比が減少していく傾向は共通している 平均名刺交換枚数は データサイエンティストは255 枚 参考サンプルは273 枚と 参考サンプルの方が少し多いが データサイエンティストとそれほどの大差はないと言えるだろう 図 1: 名刺交換枚数の分布 ( ) 0 030 0 025 データサイエンティスト 参考サンプル 0 020 0 015 0 010 0 005 1 10 100 1 000 ( 枚 ) 名刺交換枚数 次に データサイエンティストがどのような部署に所属する人たちと名刺交換をしているかを見ていきたい ここでは 特に名刺交換枚数によって交換した相手の所属部署の分布に違いがあるかといった点を見ていく 名刺交換枚数が多い人については 社外の人と積極的に交流している可能性があり 交流によって得た情報を仕事に生かしている可能性が高い そうであるとすれば データサイエンティストとして活躍するために幅広い人脈と交流している可能性がある こうした仮説を実際に検証できることが この分析のポイントになる 1: 次数は一つのノード当たりのエッジの数と定義されるが 本稿においては 個人がノードに対応しており 個人間で名刺交換をし 名刺の情報が登録されている関係をエッジ として表している なお サンプルサイズが大きくないため Eight のユーザーと名刺交換している相手は必ずしも Eight のユーザーとは限らず また交換相手の重複もそれほど 見られないためネットワーク図やネットワーク分析における特徴を表す指標については掲載していない 02 2018 Sansan, Inc.
0 20 30 0 50 60 70 80 0 100 DSOC Data Science Report 図 2は 名刺交換相手の所属部署分布である 所属部署については データサイエンティストと名刺交換した相手の名刺情報の部署名や役職の情報から 営業 マーケティング 企画 経営 管理 研究 開発等専門部署 に分けた なお データサイエンティストは先ほども見たようにITのスキルが求められるため IT 関連の部署とも名刺交換をしている可能性が高いとして 研究 開発等専門部署 から情報システムやシステム開発の部署を独立させている 情報システム システム開発部署 には 一般企業の情報システム部門だけでなく IT 企業におけるシステム開発や設計を行っている部署も含まれており 名刺情報からでは両者を識別できないケースも見られたため 一つにまとめている 2 参考サンプルと比較して データサイエンティストは IT 関連部署との名刺交換割合が高く 先ほど述べた想定の通りである 一方 データサイエンティストにおいても 参考サンプルにおいても割合が最も高いのは 営業 マーケティング 企画の部署である データサイエンティストのうち 名刺交換枚数についてある程度サンプルサイズを確保できるように 100 枚以下 101 500 枚 501 枚以上 に分けて 交換相手の部署を見てみると 枚数が501 枚を超えるとIT 関連部署の割合がやや低下する一方で 経営 管理や研究 開発等専門部署の割合がやや上昇している 名刺交換の枚数が多いデータサイエンティストほど 仕事内容の近いIT 部門だけでなく その他の部門 部署の人と幅広く交流している姿が見られるが 大きな差が見られなかったとも言える 図 2: 名刺交換相手の所属部署分布 名刺交換枚数 501 枚以上 31 3 17 16 3 100 枚以下 32 8 32 6 16 0 18 7 101 500 枚 37 1 31 0 13 1 18 8 参考サンプル 3 8 31 6 16 7 8 0 ( ) 営業 マーケティング 企画 研究 開発等専門部署 経営 管理 情報システム システム開発部署 2: 研究 開発等専門部署 における開発は 主に技術開発を意味し システム開発を含んでいない 03 2018 Sansan, Inc.
DSOC Data Science Report 4 結論 本稿では データサイエンティストの名刺交換の特徴について見てきた 分析をした結果 分かったことをまとめてみる 第一に 名刺交換枚数についてはランダムに抽出した参考サンプル ( データサイエンティストに該当しない人 ) と特に大きな違いがないことが分かった 参考サンプルと比較してデータサイエンティストの名刺交換枚数がそれほど少なくないことが分かり 他社との交流を進めていることがうかがえる 第二に 名刺交換相手の所属部署を見ると 参考サンプルと比べてIT 関連部署の割合が高い データサイエンティストは IT エンジニアが担うことが多く IT 関連部署で働く人と交流をする機会が多いものと推察できる 第三に データサイエンティストの名刺交換枚数別に名刺交換相手の所属部署を見てみると 交換枚数が一定以上になると IT 関連部署の割合がやや低下し 他の部署との交換割合がやや高まっている 他社と積極的に交流している人ほど いろいろな所属部署の人たちと幅広く交流していることが分かった 冒頭で述べたように データサイエンティストのニーズが高まる一方で データサイエンティストとして求められるスキルは多岐にわたる そのため データサイエンティストとして他社の人材とどのように交流し スキルや経験を身に付けていくかが 今後ますます重要になってくるだろう 他社との交流を積極的にしている人ほど IT 関連の部署だけでなく幅広く交流しているという相関関係が見られたものの データサイエンティストとして活躍するためにどのような人脈を形成していけばよいのか といった点は今後の課題となった 引き続き研究を進め 改めて分析を行うこととする 5 Reference 経済産業省 (2016) IT 人材の最新動向と将来推計に関する調査結果 日経情報ストラテジー編 (2013) 日経 BP ムックデータサイエンティスト完全ガイド 日経 BP 社 04 2018 Sansan, Inc.
DSOC Data Science Report 2018 年 11 月 9 日発行担当研究員戸田淳仁 Akihito Toda 本誌は 情報提供の目的のみのために提供されるものです 本誌を利用される方は その使用について独自に評価する責任を負うものとし 明示または黙示を問わずその正確性 完全性 有用性等のいかなる保証も本誌には伴いません 掲載されている情報等は作成時点のものです 本誌の一部あるいは全部を無断で複製 転載 複写することを禁じます 問い合わせ DSOC Data Science Report 事務局 (Sansan 株式会社 DSOC 内 ) dsoc@sansan.com https://jp.corp-sansan.com/dsoc/ 2018 Sansan, Inc.