Документ утратил силу или отменен. Подробнее см. Справку

Основной метод вычисления СТП

СТП - это мера вычислительной производительности в миллионах теоретических операций в секунду. При вычислении совокупной теоретической производительности конфигурации вычислительных элементов (ВЭ) необходимо выполнить три следующих этапа:

1. Определить эффективную скорость вычислений для каждого вычислительного элемента (ВЭ).

2. Произвести корректировку на длину слова (L) для этой скорости (R), что даст в результате теоретическую производительность (ТП) для каждого вычислительного элемента (ВЭ).

3. Объединить ТП и получить суммарную СТП для данной конфигурации, если имеется больше одного вычислительного элемента.

Подробное описание этих процедур приведено ниже.

Примечания. 1. Для объединенных в подсистемы вычислительных элементов, имеющих и общую память, и память каждой подсистемы, вычисление СТП производится в два этапа: сначала ВЭ с общей памятью объединяются в группы, затем с использованием предложенного метода вычисляется СТП групп для всех ВЭ, не имеющих общей памяти.

2. Вычислительные элементы, скорость действия которых ограничена скоростью работы устройства ввода-вывода данных и периферийных функциональных блоков (например, дисковода, контроллеров системы передачи и дисплея), не объединяются при вычислении СТП.

В приведенной ниже таблице демонстрируется метод расчета эффективной скорости вычислений R для каждого вычислительного элемента:

Этап 1: Эффективная скорость вычислений (R)

────────────────────────────────┬─────────────────────────────────

Для вычислительных │ Эффективная скорость

элементов, реализующих: │ вычислений

────────────────────────────────┼─────────────────────────────────

только ФЗ │1/[3 x (время сложения ФЗ)]

│если операции сложения нет,

│то через умножение:

│1/(время умножения ФЗ)

(Rфз) │если нет ни операции сложения,

│ни операции умножения, то Rфз

│рассчитывается через самую

│быструю из имеющихся

│арифметических операций:

│1/[3 x (время операции ФЗ)]

│см. примечания X и Z

только ПЗ │МАХ {1/(время сложения ПЗ),

(Rпз) │ 1/(время умножения ПЗ)}

│см. примечания X и Y

и ФЗ, и ПЗ │вычисляется как Rфз, так и Rпз

(R) │

Для простых логических │1/[3 x (время логической

процессоров, не выполняющих │операции)]

указанные арифметические │

операции │здесь время логической операции -

│это время выполнения операции

│"исключающее ИЛИ", а если ее нет,

│то берется самая быстрая простая

│логическая операция

│см. примечания X и Z

Для специализированных │R = R' x ДС/64,

логических процессоров, не │где R' - число результатов

выполняющих указанные │ в секунду

арифметические и логические │ ДС - число битов, над которым

операции │ выполняется логическая

│ операция

│ 64 - коэффициент,

│ нормализующий под

│ 64-разрядную операцию

────────────────────────────────┴─────────────────────────────────

Примечание. Каждый ВЭ должен оцениваться независимо.

Примечание W. После полного выполнения конвейерной обработки данных в каждом машинном цикле может быть определена скорость обработки вычислительных элементов, способных выполнять одну арифметическую или логическую операцию. Эффективная скорость вычислений (R) для таких ВЭ при конвейерной обработке данных выше, чем без ее использования.

Примечание X. Для вычислительных элементов, которые выполняют многократные арифметические операции за один цикл (например, два сложения за цикл), время решения t вычисляется как:

время цикла

t = _____________________________________

число арифметических операций в цикле

Вычислительный элемент, который выполняет разные типы арифметических или логических операций в одном машинном цикле, должен рассматриваться как множество раздельных ВЭ, работающих одновременно (например, ВЭ, выполняющий в одном цикле операции сложения и умножения, должен рассматриваться как два ВЭ, один из которых выполняет сложение за один цикл, а другой - умножение за один цикл). Если в одном ВЭ реализуются как скалярные, так и векторные функции, то используют значение самого короткого времени исполнения.

Примечание Y. Если в ВЭ не реализуется ни сложение ПЗ, ни умножение ПЗ, а выполняется деление ПЗ, то

Rпз = 1/(время деления ПЗ)

Если в ВЭ реализуется обратная величина П3, но не сложение П3, умножение П3 или деление П3, тогда

Rпз = 1/(время обратной величины ПЗ)

Если нет и деления, то используется эквивалентная операция. Если ни одна из указанных команд не используется, то Rпз = 0.

Примечание Z. Простая логическая операция - это операция, в которой в одной команде выполняется одно логическое действие не более чем над двумя операндами заданной длины. Сложная логическая операция - это операция, в которой в одной команде выполняются многократные логические действия над двумя или более операндами и выдается один или несколько результатов. Скорости вычислений рассчитываются для всех аппаратно поддерживаемых длин операндов, рассматривая обе последовательные операции (если поддерживаются) и непоследовательные операции, использующие самые короткие операции для каждой длины операнда, с учетом следующего:

1. Последовательные, или операции регистр-регистр. Исключаются чрезвычайно короткие операции, генерируемые для операций на заранее определенном операнде или операндах (например, умножение на 0 или 1). Если операций типа регистр-регистр нет, следует руководствоваться пунктом 2.

2. Самая быстрая операция регистр-память или память-регистр. Если и таких нет, следует руководствоваться пунктом 3.

3. Память-память.

В любом случае из вышеперечисленных используйте самые короткие операции, указанные в паспортных данных изготовителем.

Этап 2: ТП для каждой поддерживаемой длины операнда ДС

Пересчитайте эффективную скорость вычислений R (или R') с учетом корректировки длины слова L:

ТП = R x L,

где L = (1/3 + ДС/96)

Примечание. Длина слова ДС, используемая в этих расчетах, это длина операнда в битах. (Если в операции задействованы операнды разной длины, пользуйтесь максимальной ДС.)

Комбинация мантиссы АЛУ и экспоненты АЛУ в процессоре с плавающей запятой или функциональном устройстве считается одним вычислительным элементом с длиной слова (ДС), эквивалентной количеству битов в представлении данных (32 или 64 разряда) при вычислении СТП.

Данный пересчет не применяется к специализированным логическим процессорам, в которых операция "исключающее ИЛИ" не используется. В этом случае ТП = R.

Выбор максимального результирующего значения ТП для:

Каждого ВЭ, использующего только ФЗ (Rфз);

Каждого ВЭ, использующего только ПЗ (Rпз);

Каждого ВЭ, использующего комбинацию ПЗ и ФЗ ВЭ (R);

Каждого простого логического процессора, не использующего ни одной из указанных арифметических операций; и

Каждого специализированного логического процессора, не использующего ни одной из указанных арифметических или логических операций.

Этап 3: Расчет СТП для конфигураций ВЭ, включая ЦП

Для ЦП с одним ВЭ

СТП = ТП

(Для ВЭ, выполняющих операции как с ФЗ, так и с ПЗ,

ТП = max (ТПфз, ТПпз)

Для конфигураций всех ВЭ, работающих одновременно, СТП вычисляется следующим образом:

Примечания. 1. Для конфигураций, в которых все ВЭ одновременно не работают, из возможных конфигураций ВЭ выбирается конфигурация с наибольшей СТП. Значение ТП для каждого ВЭ возможной конфигурации, используемое при подсчете СТП, выбирается как максимально возможное теоретическое значение.

Особое примечание. Возможные конфигурации, в которых ВЭ работают одновременно, определяются по результатам работы всех ВЭ, начиная с самого медленного ВЭ (он нуждается в большем количестве циклов для завершения операций) и заканчивая самым быстрым ВЭ. Конфигурация вычислительных элементов, которая устанавливается в течение машинного цикла, и является возможной конфигурацией.

При определении результата должны приниматься в расчет все технические средства и (или) схема ограничения целостности перекрывающихся операций.

2. Один кристалл интегральной схемы или одна печатная плата может содержать множество ВЭ.

3. Считается, что одновременная работа ВЭ имеет место, если изготовитель вычислительной системы в инструкции или брошюре по эксплуатации этой системы заявил о наличии совмещенных, параллельных или одновременных операций или действий.

4. Значения СТП не суммируются для конфигураций ВЭ, взаимосвязанных в локальные вычислительные сети, вычислительные сети, объединенные устройствами ввода-вывода, контроллерами ввода-вывода и любыми другими взаимосвязанными системами передачи, реализованными программными средствами.

5. Значение СТП должно суммироваться для множества ВЭ, специально разработанных для повышения их характеристик за счет объединения ВЭ, их одновременной работы с общей или коллективной памятью, в случае объединения ВЭ в единую конфигурацию путем использования специально разработанных технических средств. Это не относится к электронным сборкам, указанным в пункте 4.1.3.4

СТП = ТП1 + C2 x ТП2 +... + Cn x ТПn,

где ТП упорядочиваются согласно их значению, начиная с ТП1, имеющей наибольшую величину, затем ТП2 и, наконец, ТПn, имеющая наименьшую величину. Ci - коэффициент, определяемый силой взаимосвязей между ВЭ следующим образом:

Для случая множества ВЭ, работающих одновременно и имеющих общую память:

C2 = C3 = C4 =... = Cn = 0,75.

Примечания. 1. Когда СТП вычислена вышеуказанным методом и величина ее не превышает 194 Мтопс, Ci может быть определена дробью, числитель которой равен 0,75, а знаменатель - корню квадратному из m, где m - количество ВЭ или групп ВЭ общего доступа при условии:

а) ТПi каждого ВЭ или группы ВЭ не превышает 30 Мтопс;

б) общий доступ ВЭ или группы ВЭ к основной памяти (исключая кэш - память) осуществляется по общему каналу; и

в) только один ВЭ или группа ВЭ может использовать канал в любое данное время.

Особое примечание. Сказанное выше не относится к пунктам, контролируемым по категории 3.

2. Считается, что ВЭ имеют общую память, если они адресуются к общему блоку твердотельной памяти. Эта память может включать в себя кэш - память, оперативную память или иную внутреннюю память. Внешняя память типа дисководов, лентопротяжек или дисков с произвольным доступом сюда не входит.

Для случая множества ВЭ или групп ВЭ, не имеющих общей памяти, взаимосвязанных одним или более каналами передачи данных:

Ci = 0,75 x ki (i = 2,..., 32) (см. примечание ниже)

= 0,60 x ki (i = 33,..., 64)

= 0,45 x ki (i = 65,..., 256)

= 0,30 x ki (i > 256)

Величина Ci основывается на номере ВЭ, но не на номере узла,

где ki = min (Si/Kr , 1); и

Kr - нормализующий фактор, равный 20 Мбайт/с;

Si - сумма максимальных скоростей передачи данных (в Мбайт/сек) для всех информационных каналов, связывающих i-ый ВЭ или группу ВЭ, имеющих общую память.

Когда вычисляется Ci для группы ВЭ, номер первого ВЭ в группе определяет собственный предел для Ci. Например, в конфигурации групп, состоящих из трех ВЭ каждая, 22 группа будет содержать ВЭ64, ВЭ65 и ВЭ66. Собственный предел для Ci для этих групп - 0,60.

Конфигурация ВЭ или групп ВЭ может быть определена от самого быстрого к самому медленному, то есть:

ТП1 >= ТП2 >= ........ >= ТПn, и

в случае, когда ТПi = ТПi + 1, от самого большого к самому маленькому, т.е.

Ci >= Ci + 1

Примечание. ki-фактор не относится к ВЭ от 2 до 12, если ТП1 ВЭ или группы ВЭ больше 50 Мтопс, т.е. Ci для ВЭ от 2 до 12 равен 0,75.