自己紹介
東海道新幹線の特徴
- 1日あたりの列車本数…350本
- 輸送人員…43.1万人
- 東京〜新大阪間の所要時間は2h22m
- 遅延時間は0.6分
安全綱領
- 安全第一
- 昭和26年の事故を契機に制定
主な情報システム
- 運行管理系システム
- 営業系システム
- 設備管理系システム
- 事務処理系システム
インフラ基盤系システム
全部で156のシステムが稼働中
東海道・山陽新幹線運転管理システム
- 管理、安全かつ正確な運行を支える
- 現在9世代目
エクスプレス予約システム
安全安定輸送を支える情報システムの「高品質」にどう取り組んでいるか(エクスプレス予約システムの取り組み事例)
絶対にサービスを停止させない仕組み
- レスポンスタイムとスループットを上げる努力している
- 役割別に配置したサーバがリアルタイムに連動して処理
- 一部サーバで障害が発生しても、お客様向けには安全稼働
- 29種76台のサーバが稼働中
- 10酒が主稼働、残り19種がセキュリティなどのため
- 3台による冗長構成(アクティブスタンバイ方式ではなく、アクティブもしくはスタンバイ方式)
- 閉塞方式
- 障害発生時には閉塞させる
- 保守予定の場合は予閉塞にさせる→現在の処理が全て終わったら閉塞
一筆書きの処理シーケンス
- 予約変更条件を入力している途中では、入場不可能になる
本番環境で過負荷試験
- 高負荷試験
- ピーク時を想定した試験
- 仕様通りのパフォーマンスが与えられているか試験する
過負荷試験
- 設計したピーク以上のカフカを想定
- システムがダウンしたりしないか試験する
営業時間外に本番環境にて過負荷試験を実施
- 17全駅の自動改札機を一斉立ち上げ
- 中央側システムと一斉に通信
改札機側に障害があった場合、改札機をOFFにして、ONにした後に中央側システムと通信して、最初から取得する
本番データを利用したリアルテスタ
品質課題
- お客様の行動(操作)パターンは多種多様
- 総合テストだけで62万の試験項目
- 如何に試験項目にないテストケースを炙り出すか
リアルテスタとは
列車運行の安全の確保
エクスプレス予約システムの切り替え作業例
- 台規模切り替えの場合、100名超の人員投入
システムの切り替えなどの作業でも、指差し確認を行っている
- ミスが1/6になったという実験結果もある
23:30開始、2:45で切り替え要否判断、5:30で運用開始
- 作業時間が3h15m
- 切り戻し時間が2h45m
リハーサルは同一の曜日、同一の時間帯に実施
- スケジュールのバッチがあるので
- 問題発生が0になるまで実施
情報システムに関わる組織体制
情報システム化審査の目的
- 重複システムの開発防止
- システム構成の妥当性確認
- セキュリティの確保
- 保守・運用の確認
- 初期投資〜保守運用経費などの経済性の確認
- トータルコストで評価・比較
障害復旧訓練
- 事務処理系システム障害復旧訓練を1回/年実施
情報システム技術者の育成
- 安全・安定輸送の確保が最優先
- 安定して確実に使える技術の「目利き」
育成ステップ
- 10年間で育成していく
感想
10年間の育成ステップとか、終身雇用前提な感じがすごい
— ブロッコリー (@nihonbuson) 2015, 9月 18
- 他にも「絶対にサービスを停止させない仕組み」とか、WEB系企業考え方が色々と違うように思えた
- もちろん「絶対に」を目指すが、発表内容を聞いていて、ここまで停止しない仕組みを組む企業は少ないのではと感じた
- 「品質を保つためには工数がかかっても良いからサービス無停止を遂行させる」という考え方もあるのだなとすごい感じた