ADCからのお知らせ/Information from ADC No.707(2018/3/30)
Analysis servers rebooted, /lfs03,04 disconnected on Mar 29,30
Dear user,
A part of analysis servers were rebooted, and NFS disk area were
disconnected (file server was rebooted).
[Time of reboot occurrence and recovery time]
2018.03.29 18:43 - 19:14(kaih12)
2018.03.29 19:25 - 19:45(kaifs02) * /lfs03,04 are disconnected
2018.03.29 22:07 - 22:35(kaih01)
2018.03.29 22:52 - 22:58(kaih12)
2018.03.29 23:38 - 23:42(kaih12)
2018.03.30 02:07 - 02:10(kaih12)
These are available at present.
We apologized for the inconvenience.
The reboot of analysis servers (kaih01,12) was occurred
for memory exhaustion.
The utilization of memory is shown the following webpage.
[Working (Operational) Status of Data Analysis System]
https://www.adc.nao.ac.jp/E/server-status/index_e2.html
We are currently considering the problem solution.
Thank for your cooperation.
Astronomy Data Center
ユーザの皆様
複数の解析サーバ(kaih01,12)、および NFSディスク領域(/lfs03,04)
において、リブート・接続断が発生しました。
[リブート発生時間、復旧時間]
2018.03.29 18:43 - 19:14(kaih12)
2018.03.29 19:25 - 19:45(kaifs02) * /lfs03,04 領域 接続断
2018.03.29 22:07 - 22:35(kaih01)
2018.03.29 22:52 - 22:58(kaih12)
2018.03.29 23:38 - 23:42(kaih12)
2018.03.30 02:07 - 02:10(kaih12)
現在は復旧しておりますが、ご迷惑をおかけしてしまい、
申し訳ありませんでした。
なお、解析サーバ (kaih01,12) については、メモリ枯渇よる
リブート発生になります。
メモリ等の使用状況につきましては、以下のウェブページから
確認できます。
[データ解析システム 稼動状況]
https://www.adc.nao.ac.jp/J/cc/server-status/index2.html
また現在、問題対処について検討中です。
よろしくお願いいたします。
天文データセンター