KADOKAWAグループでのデータエンジニアリングを担うIntegrated Data Service部の仕事とは?


Loading...

f:id:kadconnected:20210825141858p:plain

こんにちは。KADOKAWA Connected 社長室チームです!

KADOKAWA Connectedの仕事の全体像をご紹介することを目的としたインタビュー企画の第5弾。今回は、KADOKAWAグループでのデータエンジニアリングを担うIntegrated Data Service部の部長の塚本さんにお話を伺いました!

ー塚本さんの普段のお仕事内容を教えてください。

KADOKAWAグループに存在するデータを、適切に利活用するためのデータマネジメントの実現をリードしています。ここでいうデータマネジメントとは、データを情報、知識、そして知恵に精錬するために最も効果的なデータライフサイクル(*)を構築・運用することを意味します。

(*)データマネジメントおける戦略策定、アーキテクチャデザイン/システム実装、データの生成/収集、データの保存/維持/廃棄、データの利活用、データマネジメントの改善/強化といった一連のサイクル

ー部長を務めている、Integrated Data Service部のことを教えてください。

ビジョン・ミッションとして以下を掲げています。


■ビジョン

AIにはできない人間のコンテンツの世界を明らかにすること

■ミッション

・データ活用に必要な人材・アナリティクス・データをグループに最適な形で調達すること
・データ活用を成功させグループ全体に展開していくためのソリューションを提供すること
・データ活用に効率的、効果的、健全に行うためのマネジメント体制の構築を支援すること

 

これらに即して、Integrated Data Service部では、大きく3つのサービスを提供しています。

1つ目は、データプラットフォームサービスで、データ分析することを目的とした基盤システムの設計/構築/運用を行なっています。データを収集するためのシステム、データレイク・データウェアハウス、機械学習基盤、マスタデータ/コンテンツ管理システム、の大きく4つの設計/構築/運用を行なっています。テキスト・画像・表といったデータの形式や、全体で数PiBに及ぶこともあるデータサイズ、そしてリアルタイム処理かバッチ処理かといったデータの運用サイクルに合わせた最適な仕組みを設計/構築/運用することに加え、少人数でも多様なシステムを安定的に運用できるような設計にすることを大切にしています。

2つ目は、データソリューションサービスです。BIツール等によるデータの可視化の支援、機械学習を用いて予測モデルをつくるデータサイエンスのほか、データの仕様・定義をまとめるデータカタログ管理、そして、管理会計領域などの定量的な経営指標そのものに対するアドバイザリーや適切にモニタリングするためのデータ収集・管理のノウハウ提供をしています。

最後に、データコンサルティングサービスも提供しています。顧客が抱えるビジネス課題をヒアリングし、データの利活用により解決できる課題にまで落とし込むコンサルティングを行うほか、グループ内の市民データアナリストを増やすためのトレーニング提供や、市民データアナリストが集い事例やノウハウを共有し合うサロンの運営も行なっています。

 

なお、部署名称に「Integrated」を入れている理由は、KADOKAWAグループの各所に点在する多種多様なデータを連携/統合することによる、さらなるシナジー創出を目標の1つにしているからです。単一の事業やサービスにおけるデータ分析は、それぞれのマーケティング担当やWebディレクター等が分析しているケースが多いので、私たちはデータの利活用をニーズに合わせて支援する、というスタイルをとっています。そういった支援をしつつ、事業やサービスをまたぐ、統合された(Integrated)データについては「私たちにお任せください!」というスタイルをとっています。

ー特に開発フェーズにおいて利用している技術等を教えていただけますか。

代表的なものは以下となります。

言語:Scala, Python, SQL(SnowSQL, Hive, Impala)
フレームワーク:Spark, Play Framework, Flask
データベース:MySQL, InfluxDB, Amazon RDS
ミドルウェア:Snowflake, Amazon Redshift, Cloudera Hadoop, Google BigQuery, Fluentd, Embulk, Amazon Kinesis Data Streams, Kafka, Airflow ,Google AutoML
インフラ:Kubernetes, Terraform, Ansible
バージョン管理:git / GitHub Enterprise
CI: Jenkins, GitHub Actions
コミュニケーション: Slack, JIRA, Confluence, Google Workspace, Miro
BI:Tableau

技術選定はアーキテクトが主体となって実施しています。開発要件に沿った評価基準に加え、その技術がデータエンジニアリング市場において、現在注目されているか、将来的に注目されうるか、を考慮した上で選定しています。この視点を入れている理由は、開発体制を強化したいという際に、導入技術がボトルネックとなって、体制強化の難易度が著しく高くなってしまうことを避けるためです。

ーIntegrated Data Service部の仕事の面白さを教えてください。

KADOKAWAは、出版、映像、ゲーム、Webサービス、教育、MD(マーチャンダイジング)、コトビジネス、インバウンド関連などの幅広い事業を展開する総合エンターテインメント企業です。エンタメを軸にデータ領域の仕事をしたい方には、ここまでお題が揃っている会社はそうそうないでしょう。色々な事業やメディアを展開しているからこそ、事業を横断したデータ領域の課題解決を実現できれば、これまでにない大きな価値を創出することができると思います。また、KADOKAWA ConnectedはKADOKAWAグループの色々な事業の担当者と直接のコミュニケーションを取れ、それぞれの事業に深く踏み込めることも面白いポイントです。

Integrated Data Service部は、データプラットフォーム、データソリューション、データコンサルティングすべてを自社メンバーが主体となって推進しています。1つの会社で全部やっていることは珍しいと思いますし、データで何かをしたいというニーズに対して、幅広く対応でき、そこから新たな仕事を生み出せることも魅力だと思います。

ーIntegrated Data Service部にはどんなメンバーが集まっていますか。

まず新卒入社者の比率が高いです。2021年8月時点で60%ほどのメンバーが、新卒社員としてKADOKAWAグループに入社しています。データを使って会社や事業を良くしたい人が新卒で入って、シニアにもなっています。また中途入社は、前職でデータ領域の仕事をしていた方が多いですね。

ーIntegrated Data Service部にはどういった方が向いていると思いますか。

人の悩みや課題を解決することに対して強い意志を持つことができる人です。データは事業部門の所有物なので、こちらが好き勝手することはできませんし、「データ単体で何かが実現すること」は、もちろんありません。なので私たちの仕事では、顧客に向き合い、顧客が抱える課題解決をいかにデータで支援するかが重要なポイントとなります。

また、AI技術で作成されたモデルが正しいと思い込まずに、モデルから外れた事象が発生したら、その事象について自分なりに追究するといった、科学技術の限界に対する正しい認識と進展への挑戦のバランスも大切です。加えて、顧客のデータの利活用を促進するためにも、「このデータを出したら、相手がどう思うか?」「このデータについて説明したら、相手がどのように行動するか?」ということを念頭におきながら仕事を進めることも重要です。

「データを用いて顧客の課題解決する、とはどういうことか?」を考え続けることができる方であれば、弊社の環境を存分に楽しんでいただけるのではないかと思います。

ーIntegrated Data Service部で今後チャレンジしたいと考えていることを教えてください。

大きく3つあります。

1つ目は、自分たちのコアバリューとすることを決めることです。データプラットフォーム、データソリューション、データコンサルティングすべて推進している中で、それぞれにおいて、どの領域を自社でやるか、どの領域を自社でやらずに外部リソースを活用するか、といった選択と集中を検討したいと考えています。

2つ目は、組織力の向上です。Integrated Data Service部内での技術のスキルマップを精査し、誰がどの領域を得意か、組織としてどの領域のリソースが不足しているか、を可視化したいと考えています。また、成果の可視化をしづらいという課題も解決しようとしています。データサービスが顧客の役に立った、コストを下げることができた、というところまでは可視化できていますが、データサービスにより売上が上がったと直接的な説明はまだしづらい状態で、メンバーからもコスト削減以外の成果創出のイメージを持つことが難しいという声も上がっています。これらに対して、まずはそれぞれの成果を定量的に測定し、それらをリストアップの上、経営層に計画と実績をより密に報告しようと考えています。

最後に、データ利活用によるタレントマネジメントの促進です。現在、Integrated Data Service部では、『ニコニコチャンネル』のオーナー様に向けたデータドリブンマーケティングツールを提供していますが、それを、KADOKAWAグループと接点のあるクリエイターの方々にまで拡大できればと思っています。また、将来的にはKADOKAWAグループ内に留まらず、KADOKAWAグループのパートナーに向けたデータを軸とした価値提供にもチャレンジしたいと考えています。

ー最後に、今回のインタビューを通じて、就業に興味を持ってくださった方へのメッセージをお願いします!

エンターテイメントは、作品(アート)的な面と商品(商業)的な面の2つの側面があると思っています。そのような特性のあるエンターテイメントに対し、どこまでデータ利活用によって貢献できるのかを追求するのが、Integrated Data Service部です。エンタメ×データ利活用の両方に興味を持っている方の応募をお待ちしております!

 --------------

以上、第5回インタビューでした。
Integrated Data Service部では2021年8月時点で以下ポジションを募集しております。
ご興味がありましたらぜひご応募ください。

データプラットフォームストラテジスト
データベースアーキテクト/マスタデータマネジメントシステム

 

最後までお読みいただきありがとうございました!