關于“調整后的峰值性能(APP)”的技術注釋
調整后的峰值性能(APP)是指數字計算機在進行64位或更多位的浮點加法和乘法運算的調整后的峰值速度。
本技術說明涉及的縮寫:
n “數字計算機”中的處理器數量
I 處理器編號(1,……,n)
ti 處理器時鐘周期(ti=1/Fi)
Fi 處理器頻率
Ri 峰值浮點運算速度
Wi 體系結構調整因子
APP用加權萬億次浮點運算(Weighted TeraFLOPS (WT))表示,單位是1012調整后的每秒浮點運算。
APP的計算方法如下:
1.確定數字計算機中的每個處理器i在每個時鐘周期內執行的64位或更多位的峰值浮點操作次數(FPOi)。
注: 在確定FPO時,僅包括64位或更多位浮點加法、浮點乘法運算。所有浮點運算必須表示為每個處理器時鐘周期所執行的運算次數;需要多個時鐘周期完成的運算 可以表示為每個時鐘周期完成運算的分數值。對于不能進行64位或更多位浮點操作數的處理器,其有效浮點運算速度R為0。
2.計算每個處理器的浮點運算速度R,Ri= FPOi/ ti
3.計算APP,APP=W1×R1+ W2×R2+…+ Wn×Rn
4.對于“向量處理器”,Wi=0.9;對于非“向量處理器”,Wi=0.3
注1:對于在一個時鐘周期內能夠完成復合運算的處理器,比如:同時進行加法和乘法運算,所有運算次數都計算在內。
注2:就流水線處理器而言,有效浮點運算速度R取流水線滿時的流水線速度,或非流水線速度中的較高值。
注3:在計算APP之前,應先對每個參與運算的處理器,按照其最大可能的理論值來計算其運算速度R。如果計算機生產商在手冊或資料中聲稱,該計算機能夠進行并發、并行、同時操作或運行,則在計算R時,應考慮同時操作的因素。
注4:計算APP時,不應考慮那些僅負責輸出/輸入和外部設備功能(如:磁盤驅動器、通信及視頻顯示等)的處理器。
注5:計算APP的值,不考慮通過“局域網”、廣域網、I/O共享連接或共享設備、I/O控制器以及任何由“軟件”實現通訊互連的處理器組合。
注6: 計算APP的值,必須包括通過聚合、同時運算和共享內存方式專門設計用于增強系統性能的處理器組合。
技術說明:
1)聚合在同一芯片上的所有同時運行的處理器和加速器;
2)處理器組合共享內存方式,是任一處理器通過高速緩存塊或存儲字的硬件傳輸、不用任何的軟件機制可以訪問系統中的任一內存地址。該方式可以通過2.2中規定的“電子組件”獲得。
注7:“向量處理器”定義為內置向量指令的處理器,這些指令能夠同時進行多重浮點向量(64位或更多位的一維數組)運算,且處理器中至少含有2個向量功能部件和至少8個向量寄存器,每個向量寄存器至少包含64個數據單元。