2019 21 Feb

【データサイエンスの競技者"Kaggler"が活躍する職場】社内での立ち回りやエンジニアやアナリストとの関わり方、今後のビジョンが語られた

【データサイエンスの競技者”Kaggler”が活躍する職場】社内での立ち回りやエンジニアやアナリストとの関わり方、今後のビジョンが語られた

  • このエントリーをはてなブックマークに追加

2019.02.21

  • Facebookでシェアする!
  • Twitterでツイートする!
  • はてなブックマークでブクマする!

2019年2月6日、渋谷ヒカリエにて技術者向けの大規模イベント「DeNA Technology Conference 2019」が開催されました。

本記事では、DeNAゲームサービス事業部の分析部に所属する山川要一も参加した、「パネルディスカッション:データサイエンスの競技者、Kagglerたちが活躍する職場とは」と題したセッションをレポートします。

※記事の最後にはセッション時に投影した資料を掲載していますので、そちらもご覧ください。

Kaggle、そしてDeNAのKagglerとは?

「データサイエンスの競技者、Kagglerたちが活躍する職場とは」と題した本パネルディスカッション。

登壇者は、データサイエンスグループのマネージャーとしてKaggler達を率いる原田慧、データサイエンス競技「Kaggle」のトッププレイヤーで構成されるAIシステム部のデータサイエンスグループでKagglerとして活躍する加納龍一と小野寺和樹。

さらに、システム本部AIシステム部のMLエンジニアとして鈴木翔太、ゲームエンターテインメント事業本部に属する分析部のメンバーとして山川要一が別の立場から、一緒に働くKagglerについて紹介するため本セッションに参加した。

左から原田、鈴木、加納、小野寺、山川
今回、ホワイトボードでパネルディスカッションの模様がリアルタイムで描かれていた

本題に入る前に、モデレーターを務める原田がKaggleの概要を紹介。Kaggleは機械学習モデルを構築するコンペティションのプラットフォームで、スポンサーが出したデータと問題に世界中のKagglerたちが挑み、提出した予測結果の良し悪しで順位付けされる。上位者には賞金が出たり、Kaggle上でメダルが付与され、メダルが貯まるとKaggleでのランクが上がり、MasterやGrandmasterといった称号が与えられるとのこと。

原田によれば、Grandmasterは世界でおよそ100名しかおらず、国内でも5人程度だという。また、Masterについては国内に約40名おり、その内の10名がアルバイトも含めるとDeNAに所属。原田自身もKaggleMasterだそうだ。

DeNAでも2018年4月からAI技術開発の横断部門であるAIシステム部のデータサイエンスグループにおいて、Kaggle社内ランク制度(データサイエンスチームのメンバーに対して、業務時間を使ったKaggleへの参加を認める)を導入していることにも触れ、同社のKaggleである小野寺と加納を含むチームが、昨年8月に行われた過去最大規模のKaggleコンペで第2位に入る実績を残した。

Kagglerの一人である加納は、次世代タクシー配車アプリ「MOV」の中の機械学習の応用をメイン業務としてアサインされながら、「残った業務時間をKaggleに費やしています」(加納)と、社内Kaggle制度の実例を紹介した。

DeNAのKagglerである加納(左)と小野寺(右)

また原田は「MOVやオートモーティブなどの大きな案件に関わることもあれば、Kagglerが中心となって案件を達成することもある」とし、先日発表されたDeNAと関西電力による石炭火力発電所のスケジューリングを効率化するというプロジェクトでも、中心となったKagglerが3名いることを明かした。

実際、Kaggle上でこれら案件のような問題が出ることはないそうだが、Kaggleの中で日々勉強をしているため、その応用として変わった仕事であっても対応は可能だという。

このようにKagglerにより回っていくプロジェクトもあれば、「DeNAはAIを使って色々な事業を立ち上げていこうという会社」と原田。全社的にAI技術を使ってサービスを良くしていくことが根幹にあるとし、その中でKagglerに期待される役割について説明した。

Kagglerは、システム本部AIシステム部内の、AI研究開発エンジニア、MLエンジニア、データサイエンティストという3タイプのメンバーの中の、データサイエンティストに分類される。データサイエンティストは、Kaggleで様々な事をやっているので引き出しが豊富で、色々な経験も持っておりスピードが速い。

これはサービスや事業、使う技術に強いこだわりがあるわけではなく、データがあって課題があれば何でもやろうというスタンスとのこと。

データサイエンティスト協会の”データサイエンティストに求められるスキルセット”の図を例に、Kagglerはデータサイエンス領域の中のさらに特殊なところに属すると原田

Kagglerはどのように仕事をしているのか?

ここから本題のパネルディスカッションがスタート。DeNAには様々な職種のメンバーが仕事をしているが、実際どのようにKagglerと仕事をしているのか?

「基本的にはアナリストと事業部とKagglerは三者三様の形で働いています」とは山川。アナリストの立場としては、Kagglerはデータサイエンスに特化しており、一方で事業部は常にビジネス課題で頭を悩ませている。

どうすればビジネス課題を、データサイエンスの問題に落とし込めるかというところでアナリストが間に入ってデスカッションして、問題設定をしているという。

事業部とアナリストで”こういう課題を解いていきたい”という戦略を固めつつ、「どうやって解いていくかをアナリストがKagglerでディスカッションし、モデルを作って製品として出すこともあれば運用に必要な基盤みたいなものを作ってもらうことがある」(山川)そうだ。

その意見を聞いて、「すごく難しいことがある」と原田。事業が抱える課題をどんなデータサイエンスの問題に落とし込むかは簡単ではないという。データサイエンスの問題の形、それこそKaggleで出題されるような問題の形で事業部が用意することはあまり期待できないという。

その問題に対して山川は「そもそも何がしたいのか、常に自分が事業責任者だという気持ちで実際の事業責任者やプロデューサーとディスカッションをして問題を作る」などの工夫をしているそうで「最初にこういう問題を解きたい、これくらいの精度の向上、利益率の向上を目指しているといった指標を事前にすり合わせて進めるようにしている」とした。

逆にKagglerから見て、実際に事業部の抱える問題がKaggleの問題と同じようにおもしろいかという問いに「Kaggleの問題の方がおもしろい」と小野寺。

補足する形で原田も「もちろん例えばKaggleって3ヵ月間でがんばって結果を出すということがあるんですが、Kaggleの上位層が競っているのは0.000いくつの世界の話で、そこまで事業部の方が興味があるのかというとそうではなく、大抵の場合当たり前のこと」と説明。

「もちろん我々としては大きな予算が動いている中で、ちょっとでも効率化して売上に貢献できるような仕事もやりたいですが、小さい分析となるとどうしても事業にあったものをKagglerがパッと作る形で力を発揮することがあります」(原田)と続けた。

また、最近ではKaggleのクローンを作成し、Kaggleの問題を解いているかのように仕事ができる地盤を整えているという。

山川も「アナリストもKagglerと同じレベル、とまではいかないまでも、自分でもある程度実装してこれくらいのベースラインのモデルになるだろうとか、どれくらいの精度だったら見込めるだろうという肌感を知っておきたい」とし、事業部で設定した問題を触れる環境として、自身でベンチマークモデルを作って検証するなどしているそうだ。

一方、鈴木はエンジニアとしてどのようにKagglerと仕事しているのか。現状は、「Kaggler数名と一緒にオートモーティブ系のプロジェクトに入り、彼らの実験や学習をする環境作りや必要なデータの収集、Kagglerが作ったモデルを本番にどう組み込んで配信するか」(鈴木)など、モデル作り以外の様々なところのエンジニアリングを幅広くやっているという。

また、Kagglerと仕事する上で苦労することはないのかとの原田に問いに鈴木は、「エンジニアスキルが人によってまちまちなところがあり、エンジニアなら普段から使っているであろうものでも教えてあげたりサポートする必要がある」と語った。

逆に、Kaggler陣は、アナリストやエンジニアとどう接しているのか?

「普段はアナリストやMLエンジニアと仕事する」と加納。半年前にDeNAに転職してきたという自身の経歴に触れ、「それまではずっと研究していましたが、会社に入って周りの方々が色々教えてくれます。それがなければやっていけなかったと思います。MLエンジニアリングやアナリティクスなど、その強い専門性を持った方々が周りにいるので、自分たちも吸収できるし、Kagglerとして今までない環境、良い職場だなと感じています」と話した。

また、「結構1人で完結する仕事が多い」という小野寺のような働き方もあるようで、「1人でということであればそういうパターンもあります。加納さんが色々な方と仕事できると言っていましたが、これはDeNAの仕事の仕方の1つの魅力」と原田。

1人で何でもできることもすばらしいが、これなら世界の誰にも負けないという気概を持ったメンバーが集まっているのがデータサイエンスグループであり、「DeNAが全社的にサービス実現に向け全員で一丸となって取り組むという考え方の元、色々なメンバーが色々な苦労をしながら成り立っている」(原田)とした。

Kagglerの存在によってDeNAはどう変わったのか?

DeNAでKaggler枠が正式に組織されたのは2018年2月。そこからこの1年で多くのKagglerがやってきたが、これによってDeNAとしてどのような変化が生まれたのか?

「今まではデータはあってもどうやって使えばいいかとか、こういうことできたらもっと意思決定に役立つのに、というビジネス側で議論することがありました。それがKagglerの技術的なサポートを受けることで、より高度な問題解決ができるようになり、より効率的に運営に負担をかけない運用方法や、ここは気を付けようという発見がノウハウとして貯まってきた」と、山川はできることが広がったという印象のようだ。

それを聞いた原田から、「Kagglerはモデルの精度を高めるのが本職。簡単なモデルを作るだけなら山川さんでもできると思います。その状況の中で、最低限の分析をする上で間に合っていた中で、Kagglerがやってきたことでの価値」という質問が。

山川は「プレイヤーにどれくらい継続的にプレイしてもらえるのかを予測するのは、ゲームを運用する上でとても大事なこと。小野寺さんに作っていただいた予測モデルで、この精度がかなりあがりました。それが会社としても、意思決定する上で定量的にわかるようになったのは大きな意味があります」とし、そういう部分でKagglerのバリューがとくに大きかったとコメントした。

一方の鈴木は、一度辞めて1年前に再びDeNAに戻ってきたという経歴を持つ。その立場から「昔はデータサイエンスに尖った人材って、社内では少なかったイメージでした。でも戻ってきたらたくさんいた」との印象を述べた。

また、「山川さんと意見が近いですが」と前置きし、「できる仕事の範囲、幅が広がりました。関西電力との案件も、以前はDeNAがやれるとは個人的に思っていなかったので、そういったところでデータサイエンスがアプローチして、色々できるようになったところがおもしろい」(鈴木)と語った。

それに対し、原田は「僕らからすると、おもしろそうな案件があるからやってやろうと思っているだけなので、楽しく過ごしている」とKaggler側の意見を述べた。

では、Kagglerは転職してきたDeNAに対してどういう印象を持っているのか?

昨年6月に転職した加納は、「原田さんは数学、小野寺さんは経済学、僕は天文学と、みんなバックグラウンドが違ってすごく個性的でユニークだと思う」とのこと。また「Kaggleって画像系や言語処理だったり色々やるけど、1人1人得意な手法が全然違って、幅広い能力を持ったメンバーたちが集まっている。みんなが持っている強みを少しずつ幅広く吸収できる」ところがデータサイエンスグループ、そしてDeNAのおもしろさであり魅力と語った。

「私はチームのマネジメントをしていますが、多様なメンバーがいるから大変そうに見えてある意味楽なんです」とは原田。つまり「みんなKagle好きという価値観の元、考え方が全く違うということがない。もちろんどんなスキルがあって、どんな事業が好きという細かい部分の違いはあるけど、我々がチームとしてどうありたいかということに関しては、みんなの意見がブレることはあまりなく、一体感がある」とのこと。

そして小野寺はDeNAについて、「色々な会社を転職してきたが、DeNAは働き方が良い意味で自由」という印象を持っているという。

これについて原田は「裁量労働制がほとんどの社員に適用されていて、10時半には出社しようというルールはあります」と補足。ただし、メンバーの働き方に関しては小野寺に言うようにかなりの自由度を与えているとし、「管理しても仕方がないし、管理コストの問題もあります。各メンバーの専門性だったりプロ意識への信頼」(原田)がDeNAの自由な職場環境に表れていると説明した。

また、Kagglerを束ねる原田は、自身が昨年2月にDeNAに転職した動機について大きく2点あると切り出した。1つは「Kaggler枠という制度におもしろさを感じ、DeNAのKaggleに対する本気度を感じた」(原田)こと。

もう1つは、それまでゲーム会社だと思っていたDeNAが「いざ話を詳しく聞いてみると、色々な事業をやっている。色々な事業をやるという部分が、色々な会社の色々な問題を解決していくKaggleに近いものがあった」(原田)と、同社の多様さに魅力を感じたことが転職の決め手だったと話した。

今後Kagglerはどうなっていくべきか?

DeNAにKaggler達が集い始めてから、ちょうど1年が経ったが、今後Kaggler達はどうなっていくべきか? これが本パネルディスカッションの最後のテーマとなった。

まずKaggler側の意見として、「自分たちは仕事の時間を割いてKaggleをやっていますが、遊びではないという前提の元で、今後もKaggleにチャレンジし続けるということをまず1つ突き詰めていきたい」と加納。Kaggleの勉強をしながらその上で得られるスキルなどを蓄え、自分自身の幅を広げて間接的に会社に貢献することで実績を出していきたいとした。

過去3度、Kaggleのコンペで世界2位に輝いた小野寺は、「Kaggleのコンペで一回くらいは優勝したい。今まで準優勝しかないので世界一になりたい」とその目標を語った。

対して、エンジニアやアナリストがKagglerに今後期待するのはどのようなところなのか?

まず鈴木。「社内でエンジニアとして機械学習に興味を持っているメンバーがたくさんいるので、そういった人たちに教えてもらったり、何らかの機会で社内全体のデータサイエンス力の基礎力を上げる取り組みをしてくれるといいなと思います」と今後のKagglerに期待を寄せた。

また「エンジニア側として取り組んでいきたいこともあります」と鈴木。

「チームで成果を出すというところを意識しているので、Kagglerがもっと高速に分析、実験を行える環境を用意したい。もっと色々なところでモデルがデプロイされて動いていくと思うので、デプロイの仕組みをより効率化して、MLOpsもしっかりやっていきたいと思っています。あと最近の分析環境は大体AWSなどに構築することが多いので、その辺にしっかりキャッチアップして、Kagglerに提示してあげたい」(鈴木)と、自身の今後についても触れた。

山川は「今は全社的にAIが使われていますが、Kagglerがメインで関わっているのはオートモーティブ事業。一方でゲームエンターテインメント事業も解ける問題、解きたい問題がたくさんありますし、ヘルスケアなどその以外の事業もある」と、今後Kagglerにそれらの領域にもどんどん出て行ってほしいとコメント。

そして自身の今後については、「サービスからの課題に対する要求水準がどんどん上がっていく中で、アナリストとして事業部とデータサイエンスグループの間に入り、自分でも事業者視点で問題設定ができて、なおかつどうしたら問題として最適にデータサイエンティストと一緒にやれるかというところを考えられるよう、アナリストとしてもう少し力をつけていきたい」と語った。

最後に原田は、「Kagglerは結局のところ専門性を持った集団。それがどうやったら上手く活きて、どうすれば全社の役に立つのか? 色々な方にお世話になりながら今後も進んでいくのかなと思っています」と本セッションをまとめた。

セッション中、描かれ続けたパネルディスカッションの流れをまとめたパネルも完成した

セッション時の投影資料はこちら

※本記事は2019年2月時点の情報です。
※本記事は、SocialGameinfoに掲載された内容を一部構成を変更して掲載しています。

GeNOM(ゲノム)とは

DeNAのゲームクリエイターを様々な切り口で紹介するメディア(運営:株式会社ディー・エヌ・エー)です。ゲーム開発の現場で生まれる様々なエピソードや、クリエイター紹介、イベント紹介などを通して、DeNAで働くメンバーの”ありのまま”をお伝えしていきます。

GeNOMの最新情報は、公式Twitter アカウントにて確認いただけます。ぜひフォローをお願いします!