障害対応についてパネルディスカッション形式で話し合ってみた
- 2017.01.25
- 勉強会資料
お久しぶりです。Nintendo Switchの予約ができなかったtjinjinです。
さて、先日会社内で障害対応パネルディスカッションというものをやりましたのでご紹介します。
実施の動機
先日あるプロダクトで障害が起きました。そのプロダクトのメンバーには新卒メンバーもいましたが、どう対応していいのかわからず他エンジニアが結局対応したということがありました。その時にベテランエンジニア達が新卒エンジニア達に障害対応ノウハウを伝授していました。私は近くでその話を聞いており、チーム内で閉じる必要ないよね? と思っていました。そんなおりあるエンジニアが「障害対応の経験を伝える場とかあったらいいよね」と言っていたので、だったら場を作ってしまえと私の独断と偏見で企画したというところです。
なぜパネルディスカッションなのか
弊社のインフラチームでは毎週各自がネタを持ち寄って話す場があります。最近の設計の悩みだったり、chefの書き方を話したり、たまにvue.jsの触ってみたといったような話も出たりします。
その場が非常にいいコミュニティだと思っていて、意見も言いやすい場なのでそれの延長線上でできないかなと考えました。考えた結果(1分くらい)パネルディスカッションという形にして、あたかもそのコミュニティに入っていて近くで話を聞いているような演出ができないかなという狙いでした。
パネルディスカッションにあたっての準備
まずQiita:Teamでこんなことやらない? という投げかけをしニーズを確認できたので、日程をslackで決定しました(たぶん1日、2日くらいで開催まで決めた)。あとは簡単なアンケートをgoogleフォームで作り、どんな質問がよいかを収集しました。
パネラーは基本的に他薦してもらい、出てあげてもいいよという人にお声がけしました。
パネラーがその場で回答するのは大変かなと思ったので、事前に質問リストを送っていました。
事前準備としてはこんな感じです。
実際の内容
実際に起きた障害の話とかかなーり社内事情なので深くは書けませんでしたw LANケーブルを束ねる際に使うケーブルのようなものを締めすぎて、ネットワークの速度が遅くなったという話とかもありました。いろいろ話した中では、
- ちゃんとログ見よう
- 障害を全体像からとらえて少しずつ可能性を排除していくような感じで切り分けよう
- 障害対応発生したら、わからなくてもいいから先輩がやってることを学ぼう(参加する意思
- ユーザ視点に立とう
- 当たり前を疑え
とかいろいろな意見が出ました。
最後に「あなたにとって障害とは?」という質問したときの答えだけ載せておきますね^^
- 『障害はより良いシステムを構築するための道標なんですよ』
- 『障害ははぐれメタルだ』
- 『精神は削られるけどスキルアップのいい機会』
- 『障害は祭』
反省点
個人的反省としては、
- パネラーのトーク力任せになってしまった
- 当日は非エンジニアもいたので、パネラーが専門用語言いまくったときのフォローができなかった
- パネラーのトークの深掘りがちょっと甘かった
- 会場から質問を受け付ける方法をもっと見直した方がよかった
と反省ばかりでした。
ただ、こういった緩いコミュニティ活動は社内の活性化につながると思っているので、個人的にはよかったかなと思っています。
あととあるメンバーが動画を取っていたようで(社内限定公開)、せっかくコストかけてやっているのでそれを再利用できるのは非常にいいなと思いました。
補足として当日した質問の一部を載せておきますので、よろしければご活用下さい。
当日した質問(一部)
- 障害が発生しました。まず何をしますか?
- これまでに経験した障害で、特に思い出に残っているものはどんなものですか?
- 障害対応に必要なスキルって何だと思いますか?
- 何らかの事情で障害に気付いたが対応できないケースはどうしますか? もしくはどうして欲しいですか?