ソフトウェア品質シンポジウム招待講演『JR東海の鉄道事業運営を支える情報システムの取り組み』 参加レポート #SQiP

自己紹介

東海道新幹線の特徴

  • 1日あたりの列車本数…350本
  • 輸送人員…43.1万人
  • 東京〜新大阪間の所要時間は2h22m
  • 遅延時間は0.6分

安全綱領

  • 安全第一
  • 昭和26年の事故を契機に制定

主な情報システム

  • 運行管理系システム
  • 営業系システム
  • 設備管理系システム
  • 事務処理系システム
  • インフラ基盤系システム

  • 全部で156のシステムが稼働中

東海道・山陽新幹線運転管理システム

  • 管理、安全かつ正確な運行を支える
  • 現在9世代目

エクスプレス予約システム

安全安定輸送を支える情報システムの「高品質」にどう取り組んでいるか(エクスプレス予約システムの取り組み事例)

絶対にサービスを停止させない仕組み

  • レスポンスタイムとスループットを上げる努力している
  • 役割別に配置したサーバがリアルタイムに連動して処理
  • 一部サーバで障害が発生しても、お客様向けには安全稼働
  • 29種76台のサーバが稼働中
  • 10酒が主稼働、残り19種がセキュリティなどのため
  • 3台による冗長構成(アクティブスタンバイ方式ではなく、アクティブもしくはスタンバイ方式)
  • 閉塞方式
    • 障害発生時には閉塞させる
    • 保守予定の場合は予閉塞にさせる→現在の処理が全て終わったら閉塞

一筆書きの処理シーケンス

  • 予約変更条件を入力している途中では、入場不可能になる

本番環境で過負荷試験

  • 高負荷試験
    • ピーク時を想定した試験
    • 仕様通りのパフォーマンスが与えられているか試験する
  • 過負荷試験

    • 設計したピーク以上のカフカを想定
    • システムがダウンしたりしないか試験する
  • 営業時間外に本番環境にて過負荷試験を実施

    • 17全駅の自動改札機を一斉立ち上げ
    • 中央側システムと一斉に通信
  • 改札機側に障害があった場合、改札機をOFFにして、ONにした後に中央側システムと通信して、最初から取得する

本番データを利用したリアルテスタ

品質課題
  • お客様の行動(操作)パターンは多種多様
  • 総合テストだけで62万の試験項目
  • 如何に試験項目にないテストケースを炙り出すか
リアルテスタとは
  • 運用系システムの本番データをキャプチャして蓄積
  • 保守系システム(新プログラム)に入力して処理させ、運用系/保守系の処理結合を突合
  • 高負荷試験、過負荷試験にも活用

列車運行の安全の確保

エクスプレス予約システムの切り替え作業例
  • 台規模切り替えの場合、100名超の人員投入
  • システムの切り替えなどの作業でも、指差し確認を行っている

    • ミスが1/6になったという実験結果もある
  • 23:30開始、2:45で切り替え要否判断、5:30で運用開始

    • 作業時間が3h15m
    • 切り戻し時間が2h45m
  • リハーサルは同一の曜日、同一の時間帯に実施

    • スケジュールのバッチがあるので
    • 問題発生が0になるまで実施

情報システムに関わる組織体制

情報システム化審査の目的

  • 重複システムの開発防止
  • システム構成の妥当性確認
  • セキュリティの確保
  • 保守・運用の確認
  • 初期投資〜保守運用経費などの経済性の確認
    • トータルコストで評価・比較

障害復旧訓練

  • 事務処理系システム障害復旧訓練を1回/年実施

情報システム技術者の育成

  • 安全・安定輸送の確保が最優先
  • 安定して確実に使える技術の「目利き」

育成ステップ

  • 10年間で育成していく

感想

  • 他にも「絶対にサービスを停止させない仕組み」とか、WEB系企業考え方が色々と違うように思えた
    • もちろん「絶対に」を目指すが、発表内容を聞いていて、ここまで停止しない仕組みを組む企業は少ないのではと感じた
    • 「品質を保つためには工数がかかっても良いからサービス無停止を遂行させる」という考え方もあるのだなとすごい感じた