May 10, 2010
webデザイナーのセンスは凄い
実際にホームページなどを自分で作ってみると、デザインを考えて難しいです。そのwebデザイナーとセンスのある仕事だなと感じます。私は無料で作ることができ、その時は素材などに簡単にできるようになっていますが、それが1で、すべて作ってはいけないと思って、私はかなり難しい作業になるでしょう。そこでwebデザイナーの技術がすごいと思っています。Web制作の仕事は、インターネット社会という現代社会では非常に注目度が高く、人気の職業ですが、インターネットは今となっては日常生活にも欠かせない存在となっており、IT業界の躍進も目覚しいものがありますが、そんな中でIT業界に関連するWeb制作の仕事は非常に需要の高い魅力的なものと思われます。
●最終候補5件すべてが受賞というハイレベルな今年のGordon Bell賞
SCでは色々な賞が授与されるが、スーパーコンピュータ(スパコン)での実アプリケーション処理の最先端を切り開いた論文に与えられるのがGordon Bell賞である。その意味で、Gordon Bell賞の論文を見ると、計算アルゴリズムを工夫し、最適化のテクニックを駆使して、その年の最大クラスのスパコンを使いこなして計算を行うと、このような問題まで解けるようになったのかという進歩の感触が分かる。
Gordon Bell賞を狙う論文は一般論文とは別に募集され、今年は、25件以上の応募があったという。その中で、今年は5件が最終候補として残った。関係者の話では、このところスパコン界での地位の向上の著しい中国からも2件の応募があったが、これらは最終候補には残らなかったという。
最終候補となった論文は、
1. First-Principles Calculation of Electron States of a Silicon Nanowire with 100,000 Atoms on the K computer
2. Atomistic Nanoelectronic Device Engineering with Sustained Performances up to 1.44 PFlop/S
3. Petascale Phase-Field Simulation on the TSUBAME 2.0 Supercomputer
4. Petaflop Biofluidics Simulations On A Two Million-Core System
5. A New Computational Paradigm in Multiscale Simulations: Application to Brain Blood Flow の5件である。
結果を先に言うと、実アプリケーションで3.08PFlopsというぶっちぎりの性能を達成した(1)の理化学研究所(理研)などの論文がGordon BellのPeak Performance Awardを獲得した。そして、性能ではPeak Performanceの論文には及ばないが、重要な科学技術的な問題に対してスケーラビリティや答えを出すまでの時間などで大きな貢献があった論文に与えられるSpecial Achievement in Scalability and Time-to-Solution Awardは(3)の東京工業大学(東工大)の論文に与えられ、今年のGordon Bell賞は、2つともに日本が独占するという結果になった。
しかし、残る3つの論文も優れているということで、Honorable Mention(奨励賞)となり、すべての候補論文が受賞するという異例の結果となった。なお、一昨年、長崎大学の浜田准教授らが受賞したコストパフォーマンスを競う論文は候補論文に含まれておらす、Low Price/Performance分野での今年のGordon Bell賞は授与されなかった。
最初の(1)の論文は理研と筑波大学、東京大学(東大)、富士通の共著で、原子と電子の性質だけから10万原子のシリコンナノワイヤの電子状態をシミュレーションで求めたという論文である。将来のMOSトランジスタとして、シリコンのナノワイヤの周囲をゲートで囲んで流れる電流を制御する構造は有望であり、今回の解析は、そのような素子の特性の解析に繋がる一歩である。
従来は、計算機の能力の制約から10,000原子に届かない程度の規模のシミュレーションしか出来ず、トランジスタに使える規模のナノワイヤのシミュレーションはできなかった。今回、「京」コンピュータを使い、高い実効Flopsを実現しにくいフーリエ変換を使わないReal space DFTという計算アルゴリズムを採用し、計算ノード間の負荷のバランスや計算ノード間の通信が制約にならないようにTofuネットワーク上の計算ノードの配置を工夫するなどのテクニックを駆使して10万(正確には107,292)原子のシミュレーションを可能にしている。このような工夫と「京」コンピュータの能力により、直径20nm、長さ6nmという実用的なサイズのナノワイヤのシミュレーションが出来るようになったという。
このシミュレーションにはピーク演算性能が7.07PFlopsの442,368コアの「京」コンピュータを使い、アプリケーションの実行性能として3.08PFlopsを達成した。これはピーク性能の43.63%の効率である。なお、この測定は、まだ、全計算ノードが揃っていない7月頃に実施したものであるという。最終的にフルシステムで再測定したいところであるが、関係者に聞いたところ、LINPACKの測定などがあり「京」コンピュータの時間が取れなかったとのことである。
●東工大の関連論文は5件中2件
2番目の論文はパデュー大学、アラバマ大学、チューリッヒ工科大の共著の論文で、理研の論文と似た分野で、ナノレベルの電子素子のシミュレーションを行っている。オークリッジ国立研究所のJaguarシステムを使い、倍精度浮動小数点計算では1.28PFlops(ピーク性能比55.4%)、それほど精度を必要としない部分を単精度浮動小数点計算に置き換えることにより、1.44PFlopsを実現している。インタビュー太陽光発電?価格を明快に解説 ナノワイヤだけでなく各種のナノ素子を解析できるようになっており、アプリケーションとしての完成度は高い感じであった。
3番目の論文は東工大と京都工芸繊維大の共著の論文で、東工大のスパコン「TSUBAME 2.0」を使い、金属の凝固の様子をシミュレーションしたという論文である。
溶融状態から金属が凝固するときにデンデライトというシダの葉のような形状が成長して重なっていくが、凝固の速度や不純物の存在などで成長の様子が変わり、固まった金属の性質に大きく影響する。この凝固の様子が解析されメカニズムが分かって来て、制御できるようになると、例えば、強度の強い鉄板などが作れるようになり、車の重量を減らして燃費を改善するなどというメリットが出てくる。
計算性能の制約から、従来は2次元の解析であったり、3次元の場合は簡単な形状の小規模なものしか解析できなかった。これを今回の論文の方法では、複雑な形状でも3次元で解析できるようになった。
そして、上の図に示すように、実測とシミュレーション結果は良く一致している。
Phase-Field法というこのシミュレーションには大量の計算を必要とし、この計算を効率良くGPUにやらせることが鍵で、ハイブリッドY法と呼ぶ、GPUとCPUの役割分担を考案した。この方法を使うことにより、GPUの計算中にCPUが通信処理を並列に実行してしまうことが可能となり、全体としての処理時間が短縮できたという。
応募論文の提出時には単精度浮動小数点計算で1.017PFlopsという結果であるが、その後の改善で、発表時には2.0PFlopsを実現している。この2.0PFlopsという結果は、4000個のGPUと16,000コアを使用するシステムの単精度浮動小数点演算のピーク性能の44%に相当する。LINPACKのようなベンチマークではなく、Phase-Field法という実アプリケーションの実行においてGPUを使った計算で44%という高いピーク性能比を出していることは注目に値する。その結果として、1468MFlops/Wというグリーンコンピューティングとなっている。
4番目の論文はイタリアのConsiglio Nazionale delle Ricercheと東工大、ハーバード大学の共著である。血流をシミュレートすることにより、どのようにして梗塞に繋がる血栓ができるかを理解することが目的という。
血は単なる赤い液体のように見えるが、実は赤血球は中央がへこんだ円盤、あるいは穴が十分に開いていないドーナツのような形状で、それが押し合いへし合いして流れている。そして押し合いにより赤血球の形状が変化する。つまり、流れとともに個々の赤血球の変形を計算する必要があるので、大量の計算が必要になる。また、血管は非常に複雑な形状をしており、領域の分割の仕方が難しいという。
このグループは昨年のSC10ではBlueGene/P(BG/P)を使った結果を報告したが、今年は東工大のTSUBAME 2.0を使っている。そして、10億メッシュに分割した血管を4.5億個の赤血球が流れるケースを1万ステップ計算する場合で0.6PFlopsを実現している。
最後の5番目の論文は、ブラウン大学、アルゴンヌ国立研究所、ドイツのFZ Julichの共著の血流のシミュレーションの論文である。こちらは脳の血管にできた血瘤にかかる力をシミュレーションで求め、血瘤が破損して脳出血を起こす過程をシミュレートする。
マルチパッチドメインという血管をオーバラップする形で分割する方法で計算を行い、JulichのJUGENE、アルゴンヌ国立研究所のBG/Pシステム、そしてオークリッジ国立研究所のJaguarを使ってシミュレーションを行った。一般に、スパコンのプロセサ数に比例して問題のサイズを大きくするウイーク(Weak)スケーリングはできるが、同じサイズの問題を短い時間で解くストロング(Strong)スケーリングは難しい。しかし、この論文の計算法は、使われた3種のスパコンで、同じサイズの問題を、ほぼ、ピーク性能に逆比例した時間で計算できるストロングスケーリングが成り立っていることを示した。2010年WEBデザインは福岡in 大成功に落とし穴あり?
(Hisa Ando)
[マイナビニュース]
【関連記事】
SC11 - 東工大がTSUBAME2.0を用いた計算でGordon Bell賞・特別賞を受賞
SC11 - 「京」が実アプリで実効性能3PFlopsを達成しGordon Bell賞を受賞
SC11 - HPC Challengeで「京」コンピュータが4種目すべてを制覇
SC11 - スパコン関係最大の学会が開幕
スパコンTop500の2011年11月版 - 日本の「京」が2期連続世界1位を達成
WriteBacks
writeback message: Ready to post a comment.