view Paper/tex/new-menber.tex @ 4:0149a5c6d254

add 実験演習の説明を追加
author kiyama <e185758@ie.u-ryukyu.ac.jp>
date Wed, 22 Nov 2023 01:09:33 +0900
parents 6e6dcd18b4f6
children
line wrap: on
line source

%新規メンバーの教育
システム管理チームでは新規メンバーの教育方法として週一回に行われるミーティングに参加したり先輩、職員と共にペアプロ形式でタスクを実行してきた.
また,学科システムには監視システムが実装されている.このシステムを使用することで比較的簡単な操作でサービスの状態が確認できる.
これなら一度のログインで各サービスの情報やログが確認できる為,新規メンバーのスキル向上に使用できる.
図\ref{fig:monitoring-system}に監視システムの構成図を示す.

\begin{figure}[ht]
    \begin{center}
    \includegraphics[width=80mm]{fig/monitoring-system.png}
    \caption[monitoring]{監視システム構成図.}
    \label{fig:monitoring-system}
    \end{center}
\end{figure}

サービスの死活監視はリソース監視システムのprometheus,ログ収集はオープンソースのログ収集ツールのloki,それらのデータ可視化はモニタリングツールのgrafana,アラート送信はアラート管理ツールのalertmanagerを用いて構築している.
しかし,このシステムはブラウザからのログインが必要であり作成されたダッシュボードは複雑でシステムへの理解が必要となる.図\ref{fig:grafana-dashboard}にダッシュボードの例を示す.下記のダッシュボードはサーバーのCPU,メモリ,ディスクスペースなどの情報がまとめられている.
また,収集したログの検索でもlogQLと呼ばれる独自のクエリを書かなければいけない.
従来のシステムの状態確認と比べ操作がしやすくなったが操作に慣れていないメンバーにとっては敷居が高い.

\begin{figure}[ht]
    \begin{center}
    \includegraphics[width=80mm]{fig/grafana-dash.png}
    \caption[monitoring]{grafanaに登録されているダッシュボード.}
    \label{fig:grafana-dashboard}
    \end{center}
\end{figure}

提案手法ではダッシュボードの中でも重要な項目のみを提供する.
また,ログ収集の機能においてもlogQLを使用せずにerrorやwarningの単語を含んだ確認する必要のあるログを取得する.

下記に想定するコマンド示す.
表示するダッシュボードの情報についてはコマンドで指定せず決まったパネルを返すようにする.

\begin{quote}
    \begin{itemize}
     \item /grafana ls サービス名\\
     サービス名を指定することで確認すべき情報のみのダッシュボードの画像が表示される.
     \item /grafana ls \\
     監視しているサービスの一覧を取得する
     \item /grafana logs サービス名 \\
     ログの中でもサービスの障害に関わる重要なログに絞り表示する
    \end{itemize}
\end{quote}