NvidiaはPascalの仕様を示しています

目次:
NvidiaはPascalの仕様を示しています。 新しいアーキテクチャごとに行っているように、NvidiaはついにPascalから公式ドキュメントをリリースしました。このドキュメントでは、差し迫った有望なグラフィックアーキテクチャの多数の特性が明らかになっています。
Pascal仕様、Maxwellに対する重要な進歩
最も強力なPascalベースのGPUは、Pascalの基本構造を形成する合計60のSMユニットで構成されるGP100であり、他の低レンジチップが製造されるときにカットされます。 このGPUはTesla K80プロフェッショナルカードでデビューします。
各SMドライブには、合計64の FP32単精度CUDAコアが含まれています。これは、それぞれ128コアと192コアを含むMaxwellおよびKeplerとは明らかに異なります。フルGp100 GPUの場合、3, 840の単精度コアがあります。 さらに、これらの各SMは、それぞれ32個のニュークリアスで構成される2つのブロックに分割されており、命令バッファー、タスクスケジューラ、およびMaxwellと共有される2つの実行ユニットによって結合されています。
Pacalの倍精度計算機能に注目すると、各SMユニットに32個のFP64倍精度コアがあることがわかります。 完全なGP100 GPUには合計1, 920の倍精度CUDA FP64コアがあるため、 FP32とFP64の 比率は2:1です。
ここで、 PascalのL2キャッシュに目を向けると、 GP100コアには合計で4, 096 Kbのこの非常に高速なメモリがあり、GK110の1, 536 KbまたはGM200の3, 072 Kbと比べて大幅に進歩しています。 L2キャッシュのこの増加により、VRAMメモリへのアクセス数を減らすことができます。これは、帯域幅の必要性が減り、消費が減り、 さらに重要なことに、 パフォーマンスが向上します。
Pascalの仕様の詳細を確認したい場合は、 こちらの公式ドキュメントにアクセスできます。
ソース:videocardz