5
|
1 \chapter{教育計算機システムの構築}
|
|
2
|
17
|
3 本コースでは5年ごとにシステム更新をしており, 2020年9月にシステム更新が行われた。
|
|
4
|
5
|
5 \section{旧システム}
|
17
|
6 旧システムでは, KVMを利用したVMベースのシステムを構築していた。
|
|
7 VMは本コースのWebやDNS等の基幹システムや, 学生が学習等で利用できる貸出VMで利用されていた。
|
|
8 そのため, 利用者が必要とする十分なスペックを提供するため, 表\ref{tb:oldserver}のスペックの汎用サーバを4台導入した。
|
|
9 \begin{table}[H]
|
|
10 \begin{center}
|
|
11 \caption{旧システムの物理サーバ}
|
|
12 \begin{tabular}{|c|c|} \hline
|
|
13 CPU & Intel Xeon E5-2699 v3 (2.30GHz/18Core) \\ \hline
|
18
|
14 CPUユニット数 & 2 \\ \hline
|
17
|
15 メモリ & 768GB\\ \hline
|
18
|
16 HDD & 600GB \\ \hline
|
17
|
17 \end{tabular}
|
|
18 \label{tb:oldserver}
|
|
19 \end{center}
|
|
20 \end{table}
|
|
21
|
18
|
22 次にVMのイメージを保存するために表\ref{tb:oldsandisk}のストレージを導入した。
|
|
23 ハードディスクドライブの故障が想定されるため, RAID6を採用し信頼性及び可用性の向上を行った。
|
|
24 ストレージと汎用サーバとの接続プロトコルはiSCSIを採用した。
|
|
25 VMベースのシステムであることから, ライブマイグレーションに対応するためにクラスタファイルシステムとして利用可能なファイルシステムである, GFS2を採用した。
|
17
|
26
|
|
27 \begin{table}[H]
|
|
28 \begin{center}
|
|
29 \caption{旧システムのSAN用ストレージ}
|
|
30 \begin{tabular}{|c|c|} \hline
|
|
31 HDD & SAS 1.2TB x 24 \\ \hline
|
18
|
32 回転数 & 15000rpm \\ \hline
|
17
|
33 RAID & 6 \\ \hline
|
18
|
34 実行容量 & 19.7TB \\ \hline
|
17
|
35 \end{tabular}
|
|
36 \label{tb:oldsandisk}
|
|
37 \end{center}
|
|
38 \end{table}
|
|
39
|
18
|
40 最後にシステムのバックアップを行うために表\ref{tb:olddisk}の大容量ストレージを導入した。
|
|
41 大容量ストレージには本コースのWebやデータベース, ユーザのホームディレクトリなどを月に一度バックアップを行う。
|
|
42
|
17
|
43 % こいつ...もしかしたら Netgea ????
|
|
44 \begin{table}[H]
|
|
45 \begin{center}
|
|
46 \caption{旧システムの汎用ストレージ}
|
|
47 \begin{tabular}{|c|c|} \hline
|
|
48 HDD & SAS 4.0TB x 24 \\ \hline
|
18
|
49 回転数 & 7200rpm \\ \hline
|
17
|
50 RAID & 6 \\ \hline
|
18
|
51 実行容量 & 68.5TB \\ \hline
|
17
|
52 \end{tabular}
|
|
53 \label{tb:olddisk}
|
|
54 \end{center}
|
|
55 \end{table}
|
|
56
|
18
|
57 \subsection{旧システムの問題点}
|
|
58
|
|
59 旧システムでは, 学生が演習などで利用できる環境として貸出VMのみであった。そのため以下のような問題が生じた。
|
|
60
|
|
61 \begin{itemize}
|
|
62 \item 仮想環境の貸出サービスにおいて, 新しく仮想環境を立ち上げるにはシステム管理チームへ申請が必要であった。
|
|
63 そのため, 一部学生は申請の方法が分からなかったり, 貸出サービスがあることが周知されていなかったため, 旧システムのリソースが余っていた。
|
|
64 \item 機械学習の演習ではGPUが求められる。だが, 旧システムにはGPUが搭載されていないため, 要求されるリソースを提供できない。
|
|
65 そのため, 貸出サービスではなく研究室ごとの機器が多く利用された。
|
|
66 \end{itemize}
|
|
67
|
17
|
68 % 簡単に 1ページ未満にしよう
|
18
|
69 % 無理でした ^_^;)
|
5
|
70
|
|
71 \section{新システム}
|
|
72
|
17
|
73 \begin{table}[H]
|
|
74 \begin{center}
|
|
75 \caption{新システムの物理サーバ}
|
|
76 \begin{tabular}{|c|c|} \hline
|
|
77 CPU & Intel Xeon Gold 6238 (2.10GHz/22Core) \\ \hline
|
18
|
78 CPUユニット数 & 2 \\ \hline
|
|
79 GPU & Nvidia Tesla V100S \\ \hline
|
17
|
80 メモリ & 512GB\\ \hline
|
18
|
81 SAS SSD & 5TB \\ \hline
|
|
82 NVMe SSD & 1.5TB \\ \hline
|
17
|
83 \end{tabular}
|
|
84 \label{tb:newserver}
|
|
85 \end{center}
|
|
86 \end{table}
|
|
87
|
|
88 \begin{table}[H]
|
|
89 \begin{center}
|
|
90 \caption{新システムのストレージサーバ}
|
|
91 \begin{tabular}{|c|c|} \hline
|
|
92 CPU & Intel Xeon Silver 4208\\ \hline
|
18
|
93 メモリ & 32GB \\ \hline
|
17
|
94 SAS HDD & 300GB/15000rpm x 2 \\ \hline
|
18
|
95 NLSAS HDD & 4TB/7200rpm x 12 \\ \hline
|
17
|
96 \end{tabular}
|
|
97 \label{tb:newdiskserver}
|
|
98 \end{center}
|
|
99 \end{table}
|
|
100
|
5
|
101 % 構成の図貼る
|
|
102 % 機器のスペックもありるれろ
|
|
103
|
|
104 \subsection{Ceph}
|
|
105
|
|
106 \subsection{Podman}
|
6
|
107 \subsection{ie-podman}
|
5
|
108
|
|
109 \subsection{Singularity}
|
|
110
|
|
111 \subsection{Slurm} |