「近畿日本鉄道における鉄道データを用いたコスト最適の為のデータ統合、可視化の取組み」のセッションについてまとめましたので、そちらのレポートをしたいと思います。

セッション概要

タイトル  近畿日本鉄道における鉄道データを用いたコスト最適の為のデータ統合、可視化の取組み
日時 8/1(木) 14:00 – 14:30
概要 近畿日本鉄道が所有する様々な駅務機器から出力されるデータについて BigQuery に一元管理を行い、Looker Studio を用いてクイックに可視化~駅務機器台数適正化に向けたシミュレーションを行うことで、現場での意思決定をスピーディーに支援を行った事例をご紹介します。
データの棚卸から分析によって生み出されるビジネス価値を、実際の利用データ・分析実施のスケジュールや目的などと共に、近畿日本鉄道の担当者とデータフォーシーズの責任者が分かりやすくご説明いたします。

 

アジェンダ

下記がアジェンダとなります。

会社紹介
券売機プロジェクト
改札機プロジェクト
今後の取り組み

会社紹介

まず初めに各社の紹介が行われました。

近畿日本鉄道(近鉄) 大阪、奈良、京都、三重、愛知の5都道府県をまたぎ、JRグループを除く日本の鉄道事業者(民営鉄道)の中では最長の501.1kmの路線網を持つ。
データフォーシーズ(D4cグループ) データ解析業務のコンサルティングやAIソリューションの提供を行っている。

2つのプロジェクト概要


近鉄様では下記の課題/目標がありました。

課題 「勘」や「経験」による判断をする属人化した企業文化や体制となっていた。
目標 データを活用した施設立案、効果検証が当たり前の企業文化を目指す。
→既存の保有データを整理し、データ分析文化を醸成し、業務効率化やマーケティングでの活用を図る。

 

上記の目標をかなえるために、下記2つのプロジェクトが遂行されました。

①券売機適正台数算出のための分析 各駅に設置の台数が適正かを判断し、過剰な設備投資を抑えたい。
→適正台数シミュレーションツールを作成。
②改札機適正台数算出のための分析 ①券売機適正台数算出の考え方をベースに同じく改札機の台数シミュレーションを実施。

券売機プロジェクト

まず初めにプロジェクトにおける留意点・課題についての説明がありました。

留意点 ・コーナーに一台は必須。
・券売機はタイプにより機能が異なるが、台数削減しても提供できる機能は無くさない。
・平均的に足りているか?よりもピーク時に破綻しないかを重視する。
課題 ・取得可能なデータを推定情報として活用するにあたり、特定の内容や日単位でしかデータを取得できない箇所があった。

プロジェクトの進め方

受領データの状況・課題を踏まえて整理した結果、4STEPでの分析を実施しました。
そのため、対象駅・コーナーにおける券売機の混雑状況をシミュレーション/評価可能なモデル構築が可能になりました。

STEP1 STEP2 STEP3 STEP4
削減対象となる駅/コーナー絞り込み 券売機を使うであろう人数規模を推定 定期券販売シーズンの混雑状況を推定 切符/ICチャージ/定期購入の総合的な混雑推定
各コーナーで必要機能をなくさないような削減前提条件を整理する。 乗車人数と券売機を利用する人数は正の相関性があるという前提仮説をもとに分析。 定期券の販売に関しては、特定時期に集中するため、年間でのピークタイミングをとらえる。 各駅/コーナー券売機に対して
切符発券人数×平均処理時間
ICチャージ人数×平均処理時間
定期申込人数×平均処理時間
を混雑時間推定のベースとする。

 

プロジェクトの成果物

エクセル機能を活用したシミュレーションシートを使うことで、迅速に必要な情報連携を実施することが可能になりました。

プロジェクトを進めるうえでの課題

本プロジェクトではローカル環境でcsvデータを活用し、Excelでのアウトプットという形式であったため、いくつかの課題が発生しました。

データ収集~加工に膨大な時間が発生 Python/Rを用いたデータ読み込み~加工処理を行ったが、データの更新/差し替え等がある毎に加工プログラムの実行が必要で手間と時間がかかる。
シミュレーションツールの表示も時間がかかる Excelを用いて混雑状況をシミュレーションするツールを作成したが、条件変更のたびに再計算を再実行する必要があり、膨大な時間がかかる。
データ管理/メンテナンスが煩雑に 駅別・日別に細かく分かれた膨大なファイルからデータを整理する必要があり、データの欠損や重複チェックなども工数がかかる。

改札機プロジェクト概要

プロジェクトにおける留意点についての説明がありました。

留意点 ・入出場設定を踏まえた分析が必要。
・混雑状況+行列発生リスクを把握する。
・IC専用/IC・磁気カード両用機器の考慮が必要。

 

券売機と改札機のデータの違い

券売機と改札機のデータではデータ量が異なるため、処理方法について考え直す必要があります。

券売機 1時間単位のサマリーデータであるため
50万件程度
→Excelでもがんばれば処理できる。
改札機 1分単位のデータであるため、
3億件以上
→データ基盤の準備が必須。

 

Google Cloudの活用

Google Cloudを用いた構成図が共有されました。Looker Studioを使うことにより、瞬時に混雑状況が確認できるようになりました。

上記の図でも挙げられているように、Looker Studioを使用することで、条件を変えても動的・リアルタイムに連動した集計結果の可視化が実施可能となります。


またBigQueryを用いることにより大量のデータがスピーディーに集計され、グラフ化も容易であり、以前と比べてデータに基づいた検討が容易になったことが挙げられました。

今後の取り組み

最後に各社における今後の取り組みが紹介されました。

D4c 全国駅データを活用し、駅周辺の開発計画や駅ごとの利用者維持向上の施策検討につなぎたい。
近鉄 今までは手動でデータ抽出したり、データを人に依頼して収集していたが、データの統合基盤を集約し、業務効率化及び営業施策立案等を実施したい。

また他の駅機器の横展開を実施したい。

所感

データの分析が属人化しているなど、大規模な企業であるほどデータが多すぎてうまくクラウド化しきれていない部分が発生し、そういった課題をIT企業がどのように落とし込んでいくか考えていく必要があると気づかされるセッションでありました。
普段他社のプロジェクトを生で聞く機会があまりないですが、今回のセッションを参加することで、企業における課題やその落としどころを聞けて、とても興味深い内容でした。セッションを通して、お客様の状況に寄り添った提案を自分もできるようになりたいなと思いました。