processorプロセッサipcとは

目次:
今日のコンピューターでは、サイクルごとの命令、またはIPCとも呼ばれるものが、プロセッサーのパフォーマンスの非常に重要な側面です。 この概念は、各プロセッサクロックサイクルで実行される平均命令数を表すため、値が高いほど、プロセッサはより強力になります。 この記事では、CPIに関連するすべてを説明します。
コンテンツインデックス
プロセッサーのCPIとは何ですか?それはどのように計算され、どのくらい重要ですか?
IPC計算は、一連のコードを実行し、それを完了するために必要なマシンレベルの命令の数を計算し、 次に高性能タイマーを使用して実際のハードウェアでそれを完了するために必要なクロックサイクル数を計算することによって行われます。 。 最終結果は、命令数をCPUクロックサイクル数で除算したものです。
プロセッサの1秒あたりの命令数と1秒あたりの浮動小数点演算 数は、サイクルあたりの命令数に 、問題のプロセッサのクロック速度 (ヘルツで指定された1秒あたりのサイクル数)を掛けることで求められます。 1秒あたりの命令数は、プロセッサのパフォーマンスの大まかな指標です。
市場で最高のプロセッサーに関する記事を読むことをお勧めします
クロックごとに実行される命令の数は、実行中の特定のソフトウェアがプロセッサと、実際にはマシン全体、特にメモリ階層とどのように相互作用するかに依存するため、特定のプロセッサでは一定ではありません 。 ただし、特定のプロセッサ特性は、複数の算術論理演算ユニットや短いパイプの存在など、平均を超えるIPC値を持つ設計につながる傾向があります。 異なる命令セットを比較する場合、同じチップテクノロジーを使用するより複雑な命令セットを実装するよりも、単純な命令セットの方がIPC値が高くなる可能性がありますが、 命令セットが多いほどcomplexは、より少ない命令でより有用な作業を実現できます。
CPIを規定する要因
1秒あたりの指定レベルの命令は、高いIPCと低いクロック速度 (AMD Athlonや初期のIntel Coreシリーズなど)、 または低いIPCと高いクロック速度 (Intel Pentiumなど)で実現できます。 4)。 どちらも有効なプロセッサ設計であり、多くの場合、どちらを選択するかは、履歴、エンジニアリングの制約、またはマーケティングのプレッシャーに依存します。 ただし、高周波数の高IPCが最高のパフォーマンスを提供します。
複数のプロセッサのサイクル命令。
これらの数値は、これらのCPUのIPC値ではありませんが、理論的に可能な浮動小数点パフォーマンスを表しています。 以下の数値は、プロセッサのSIMDドライブの論理幅のみを表していることに注意してください 。 これらは、ほとんどのアーキテクチャに存在する複数のSIMDパイプを考慮していません。また、整数、浮動小数点、および制御の両方でサイクルごとに削除される平均スカラー命令の数を測定するIPCの主要なアーキテクチャ定義を表していません。
CPU | 倍精度DP IPC | シンプルな精密SP IPC |
Intel CoreおよびIntel Nehalem | 4 | 8 |
Intel Sandy BridgeおよびIntel Ivy Bridge | 8 | 16 |
Intel HaswellおよびIntel Coffee Lake | 16 | 32 |
Intel Ice Lake | ? | ? |
Intel Xeon Skylake(AVX-512) | 32 | 64 |
AMD K10 | 6 | 12 |
AMD Bulldozer、AMD Piledriver、およびAMD Steamroller | 12 | 24 |
AMD Ryzen | 16 | 32 |
Intel Atom(Bonnell、Saltwell、Silvermont、Goldmont) | 2 | 4 |
AMDボブキャット | 2 | 4 |
AMDジャガーとプーマ | 4 | 8 |
ARM Cortex-A7 | 1 | 8 |
ARM Cortex-A9 | 1 | 8 |
ARM Cortex-A15 | 1 | 8 |
ARM Cortex-A32 | 2 | 8 |
ARM Cortex-A35 | 2 | 8 |
ARM Cortex-A53 | 2 | 8 |
ARM Cortex-A57 | 2 | 8 |
ARM Cortex-A72 | 2 | 8 |
クアルコムクライト | 1 | 8 |
クアルコムクライオ | 2 | 8 |
IBM PowerPC A2 | 8 | SP要素が拡張する
EdからDPおよび処理 同じ単位で |
IBM PowerPC A2 | 4 |
特定のCPUの理論上のGFLOPSレーティング(数十億FLOPS)を取得するには、この表の数値にコアの数を掛け、次に特定のCPUモデルのバリュークロック(GHz)を掛けます。 たとえば、 Coffee Lake i7-8700Kは 理論的にはサイクルあたり32の単精度フロップを処理し、6つのコアと3.7 GHzのベースクロックを持っているため、32 x 6 x 3.7 = 710.4 GFLOPSになります。
マルチスレッドは、2つのスレッドが同じコアで同時に動作してパイプラインリソースを共有できることを意味するものではないことに注意することが重要です。 代わりに、CPUは1つのスレッドがカーネルを使用することを許可し、別のスレッドは、キャッシュが不足している場合のように、データがメモリから送信されるのを待ちます。 オペレーティングシステムの開発者は、元のスレッドをキューに戻し、データが回復するとCPUに戻ることができます。
したがって、この機能はCPUの理論上の浮動小数点パフォーマンスに影響を与えませんが、実際には、CPUが複数のスレッドでそのパフォーマンスに近づくのに役立つ場合があります。 一般的に、大きなプロセッサログは、大きなプロセッサ数が1度に数えることができることを示します 。 レコードの数も重要です。これは、いくつかの指示で一瞬接続できるためです。
PCで重要なのはIPCだけではありません
どのPCでも実行できる有用な作業は、プロセッサの速度以外にも多くの要因に依存します 。 これらの要因には、 命令セットアーキテクチャ、プロセッサマイクロアーキテクチャ、およびディスクストレージシステムの設計や他の接続デバイスの機能とパフォーマンス、オペレーティングシステムの効率など、コンピュータシステムの構成が含まれます。重要なのは、ソフトウェア。
コンピュータシステムのユーザーと購入者にとって、時計の指示は 、システムのパフォーマンスを示すのに特に役立つものではありません 。 それらに関連するパフォーマンスを正確に測定するには、 アプリケーションのベンチマークがはるかに役立ちます。 それらの存在の知識は、クロック速度が機器のパフォーマンスに関連する唯一の要因ではない理由の理解しやすい例を提供するので役立ちます。
次のガイドを読むことをお勧めします。
これまでのところ、プロセッサIPCとは何かについての記事は、非常に役立つことを願っています。
ウィキペディアのソース