エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ここにツイート内容が記載されます https://b.hatena.ne.jp/URLはspanで囲んでください
Twitterで共有ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
初めに ここではIntel CPUのレイテンシとスループットの基本を解説し、FMAの処理時間を調べます。 レイ... 初めに ここではIntel CPUのレイテンシとスループットの基本を解説し、FMAの処理時間を調べます。 レイテンシとスループット レイテンシ CPUにおけるレイテンシ(latency)とは命令が発行されてからその実行が完了するまでの時間(クロックサイクル)です。 たとえばレイテンシが4なら実行されてから4クロックサイクル(以降clkと記す)後にその結果を利用できます。 スループット Intelのマニュアルによるとスループットとは同じ命令を続けて発行するときに待つclkです。たとえばスループットが1なら1clkごとに1命令、0.5なら1clkごとに2命令同時に発行できます。 ただし、通常スループットというと単位時間あたりに処理できる量を表し、大きいほど高性能です(Gbpsなど)。それに従うなら1clkあたりに同じ命令を何個発行できるかという定義になるべきであり、Intelのスループットは逆