量子化された無意味な人生

意味深だけど意味が無いブログだよ(:-Q)

スパコン考

Life is beautiful: スパコン「京」に関する素朴な疑問 を読んで.
こういうのに意見書くのは専門家の人たちに嬲り殺されそうなのでびくびくする.

とある研究機関でお手伝いしていて,スパコンを使わせていただいてます.と言ってもまだ1年も使ってないですけど.
京は使ってないんですが,スパコンの話もちょこちょこ周りで聞きかじって知っていることも少しくらいあるし,ひよっこですがツッコミどころ満載のツッコミ使用者の感覚でも書いてみようかと思った次第です.
私は情報屋さんではないので,そこまでスパコンの仕組みやクラウドに詳しいわけではないです.なので頭悪い発言もご勘弁を!できれば指摘を何らかの形でくれるとありがたいです.まだ青臭くて生意気なクソ学生だからやさしくしてくださいね(はあと)
NHKクローズアップ現代は見てないので番組についてはよくわかりません.(見たかったなあ…)
なので,なぜ京なのか?は言及しません.

と,全く読む価値のない前置きはこの辺にして.

まずはこれ

京を使えば6時間で出来ると言っても、その時間を確保するのに6ヶ月かかるんだったらアマゾンからGPGPU付きのサーバーを1000台借りて数日間走らせた方が手っ取り早くないか?
違うと思います
こういう研究はコンスタントに続けるものと言うよりは, アイデアひらめく→データとる→考える→まとめる という瞬発力めいたところがある.
そんでそれは結構はやくやらないと,他の誰かが手をつけて自分より早くデータ出して発表しちゃうかもしれない.
そうしたら論文出せないので研究でおまんま食う人たちは無能扱いされて下手したら職を失う可能性だってある(将来の自分への戒めも込めて).
企業開発にしても他社と競争してるから同じことだし,国としても利用者が成果を出せないのでは他の国には舐められ国内からは「技術大国日本(笑) 何も成果出てないじゃんww」なんて思われてしまう始末.半端なものを作るのはせっかくコストを計算機に裂いた意味が無い.

あと,計算機の演算精度やハード的な並列化効率なんかも重要になってくるからサーバー用途のマシンではきついかも.
そもそも京で1024コアとか使って6時間で済む計算*1がアマゾンで有意な時間内に終わるのかな?とすら思ったりしますが.アマゾンのクラウドってそんなに高速なの?無知で申し訳ないけど,使ったことないので感覚がよくわからないです….

次はこれ,

京向けに書いたシミュレーション・プログラムは他のスパコンでも走らせることができるのか?世界中の研究者がシミュレーションプログラムをオープンソースの形で進化させて行くという今の次回にマッチしたアーキテクチャなのか?
私の界隈だと基本となるプログラムの中核はオープンソースっていうのも最近はよく見かける.けど,スパコンは独自のコンパイラを使うこともあったりしてチューニングが必要.
たいていのスパコンだとintelgnuコンパイラは入っている印象だけど,やはり細かいチューニングをしないと期待した速さが得られないらしい.
スパコンのノード間の通信は速さを求めるために普通のコンピュータとは違うので,並列化ばりばりさせるのが目的のスパコンでは結局チューニングしないと動いても遅い.
せっかくのスパコンなんで,できれば最速に近い状態で計算させたいものです….特にこういう計算は大抵恐ろしい数の計算を繰り返し繰り返しなんども行うので.
ここで予想する反応は「別にそこまで特別な技術を使って速くしなくて良いじゃん」というものだけど,結局何年か後にはその技術が一般用のPCなどに取り込まれたりするので,F1みたいなものだと思っている.技術自体はまだ「今は」過剰で特殊かもしれないけど数年後には当たり前にするために必要,みたいな.
数年前は並列処理なんてスパコンの専用技みたいなもんでしたけど,今や普通のPCで使うプログラムが並列処理しちゃう時代ですもんね.CPU自体も今やシングルコアのCPUの方が珍しい位なのでは.
とか偉そうに書いてみたけど,上の人がやってくれるので実は私はコンパイル作業したことない.

その次はこれ,

無料で京を使わせてもらえる研究機関や企業は喜ぶのは分かるが、本当のコストはどのくらいかかっているのか?アマゾンより安いのか?
京は知らないけど,大抵のスパコンって使うのに利用者もお金払います
たとえば東大のfx10だとこんな感じ→ http://www.cc.u-tokyo.ac.jp/support/application/kitei/hyou5.pdf
一番安いパーソナルコース1では【大学・公共機関等120,000円】.これが安いか高いかは個人の感覚次第….

ちなみに電気代が結構かかるらしい.
最近はスパコンも省エネの観点からも評価されるそうな.

そのほかスパコン使ってみて知らなかったこと

引用元ブログとは関係ないんですけどスパコン使ってみて驚いたことを書けば,どういうわけかこの記事に流れ着いたスパコンについて全くわからない人に「やだ…この人スパコン博士なの…?素敵!!」って感心してもらえるかも!というわけでスパコン触ったことある人には当たり前のことを箇条書きします.

  • スパコンは利用者の投げ込む計算をノード数,計算時間,利用頻度などから優先度や待ち時間などを設けて管理している(ジョブスケジューラ).
  • スパコンに投入したジョブは一定時間で強制的に終了させられる.24hとか72hとかもあれば,30minなんてのもある.こういう計算時間とかリソースの量の異なるキューが用意されていて,そのキューにジョブを投入する.デバッグ用のキューもある.
  • 使用時間やノード数などでポイントを消費し,ポイントがなくなると計算ができなくなる仕組みになっている.お金を払ってポイント(トークン)を買う.
  • 一般ユーザーはスパコンに直に触ったりはしない.大抵sshで遠隔操作する.だからインターネットの通じるところなら大抵どこでも操作できる.


書き終わったら的外れ感がビンビンする感じになっちゃった.
まあ引用元のブログに対する(信憑性の怪しい)補足だと思ってくださいな.
あと全体的に文章読みづらいな….

*1:番組見てないからわからないけど,どうせ一例としてだすならこういう計算でしょう