Производительность подсистемы памяти, тестирование с помощью BenchMem.

   BenchMem формирует графики двух типов:
- скорость cache 1 & 2 level
- производительность чтения и записи.
В программе нет ничего экстраординарного, странно что никто не додумался до простой идеи померить скорость доступа от смещения по адресам.
Думаю, первый график не нуждается в специальных комментариях, а второй - на графике выводится скорость чтения или записи для разного 'прыжка' по адресам. Например, позиция 1Kb означает, что следующий доступ смещен от текущего на 1Kb в сторону большего адреса и его скорость равна соответствующим позициям графиков. Значения с отрицательными числами соответствуют смещению нового адреса в сторону уменьшения адресов. Цифра 0 обозначает прямое последовательное потоковое чтение (и запись). Отдельные всплески, кроме зоны около 0, означают случайную синхронизацию в связке CPU-...-RAM, что и вызывает всплеск производительности.

Первая проверка - производительность от процессора и chipset'а.

Процессор AMD Athlon XP2200+, chipset AMD AM750. Для совместимости результатов с предыдущим процессором Athlon 990, его частота FSB оставлена на 110MHz с соответствующим множителем = 16.5, для получения нормальной частоты процессора Athlon XP2200+.

cache speed memory speed



Процессор AMD Athlon 990, тот же chipset AMD AM750. Графики сняты для одного и того же BIOS с абсолютно одинаковыми настройками. Более того, BIOS про Athlon XP думает, что установлен обычный Athlon и не делает никакой 'оптимизации'.

cache speed memory speed



Процессор Pentium 166 на частоте 83MHz при результирующей 208.
Mainboard VT82C585 Apollo VPX, status 82A0h (supports Back-To-Back trans., medium timing), revision 23h, bus latency 40h.

cache speed memory speed



Процессор Celeron 433.
Mainboard i810, status 2080h (received master abort, fast timing), revision 03h, bus latency 00h.
Данные снимались для Windows NT.

cache speed memory speed



Процессор Celeron 500.
Mainboard Abit-BE6II (82443BX).

cache speed memory speed



Процессор Pentium2 400 cache 512Kb, slot 1.
Mainboard 82443BX, status 2210h (received master abort, medium timing), revision 03h, bus latency 40h.

cache speed memory speed



Процессор Pentium3 1G на частоте 147MHz при результирующей частоте 1.1G.
Mainboard SiS630, status 2210h (received master abort, medium timing), revision 30h, bus latency 20h.

cache speed memory speed



Процессор Pentium3 1.12G на оригинальной частоте 133MHz.
Mainboard SiS630, status 2210h (received master abort, medium timing), revision 30h, bus latency 20h.
Данные приведены для сравнения на маштабирование chipset'а и повторяемость результатов.

cache speed memory speed



Процессор Pentium4 2G, cache 2 level 512Kb, SDRAM.
Mainboard i845.

cache speed memory speed



Процессор Pentium4 1.6G, cache 2 level 512Kb, RIMM.
Mainboard i850.

cache speed memory speed



Процессор Pentium4 1.7G, cache 2 level 256Kb, на частоте 2.08G. Память - DDR SDRAM на частоте 325MHz.
Mainboard i845pe. Думаю, для этого случая будет полезно указать конкретную модель mainboard: Gigabyte GA8PE667.

cache speed memory speed



Процессор Celeron4 2G, cache 2 level 128Kb, на частоте 2.66G. Память - DDR SDRAM на частоте 266MHz.
Режим доступа к памяти: 128 бит. Mainboard SIS655.

cache speed memory speed



Наверно, просмотрев предыдущие примеры, у Вас сложилось ощущение ошибочности программы?
Тогда взгляните на график BX:
Mainboard 82443BX, status 2210h (received master abort, medium timing), revision 03h, bus latency 20h.

cache speed memory speed



Все тоже, но другая OS. Данные приведены для контроля смены операционной системы. Графики выше принадлежат Windows 2000, Эти - Windows 98.

cache speed memory speed



Интересный случай. Это второй, точно такой же как и предыдущий компьютер, но в нем обновлен BIOS. Графики для других OS(Windows 2000, Windows 98) не приводятся, они аналогичны. Чуть возрасла линейная скорость и разрушилась равномерность.

cache speed memory speed


Вторая проверка - производительность от частоты и синхронности памяти.

Процессор Pentium3 600EB 256Kb L2(Cu-mine) как 133*4.5=600MHz.
Mainboard i815EP, status 2090h (supports back-to-back trans., received master abort, fast timing), revision 02h, bus latency 0
SDRAM на 100MHz и асинхронно частоте процессора.

cache speed memory speed



Процессор и mainboard те же, SDRAM на 133MHz и синхронно частоте процессора.

cache speed memory speed



Все то же, но тайминги установлены в FAST (2-2-2).

cache speed memory speed



Процессор и mainboard те же, частота FSB процессора увеличена до 150MHz.
SDRAM на 150MHz и синхронно частоте процессора.

cache speed memory speed



Процессор тот же, заменена mainboard.
Mainboard VT82C694 Apollo Pro 133A, status 2210h (received master abort, medium timing), revision C4h, bus latency 0.

cache speed memory speed

Процессор

chipset

RAM clock
(MHz)

cache 1 level
(GB/s)

cache 2 level
(GB/s)

линейное чтение
(MB/s)

линейная запись
(MB/s)

запись от чтения

среднее чтение
(MB/s)

средняя от линейной

средняя запись
(MB/s)

remarks

Athlon XP 2200+
(T-bred)

AM750

110

24.4

5.4

683

360

53%

390
[745]

57%
[110%]

193
[348]

 

Athlon 990
(T-bird)

AM750

110

12.7

3.0

769

342

44%

205

27%

134

 

AMD Athlon 850MHz

VIA KT133

100

11

2.6

775

254

33%

[296]

[38%]

[199]

 

AMD Athlon XP1800+

VIA KT266

266

20

4.5

1430

-

-

[1053]

[73%]

-

 

Pentium 208

VIA 585

83

1.4

0.3

184

155

84%

70

38%

69

 

Celeron 433

i810

66

3.3

1.5

319

120

38%

245

77%

114

 

Celeron 500

BX

66

3.8

1.7

499

95

19%

296

59%

116

 

Pentium2 400

BX

100

3

1.2

454

164

36%

406

89%

164
(равна макс.)

 

Pentium3 1105

SIS 630

147

8.4

4.5

600

180

30%

448

75%

186

 

Pentium3 1130

SIS 630

133

8.6

4.3

504

130

26%

371

74%

159

 

Pentium4 2G

i845

133

34

17

926

389

42%

230
[430]

25%
[47%]

169
[341]

 

Pentium4 1.6G

i850

400

26.5

13

2063

1014

49%

460
[896]

22%
[43%]

472
[963]

RIMM

Pentium4 2.08G

i845pe

325

34.7

17.4

2354

760

32%

483
[902]

20.5%
[38%]

289
[563]

DDR

Celeron4 2.66G

SIS 655

266

42.2

22.4

2786

1123

40%

532
[992]

19.1%
[36%]

334
[620]

DDR
128bits

Pentium4 2.4G

SIS 655

333
асин.

37.5

19.9

2716

1227

45%

635
[1194]

23%
[44%]

387
[615]

DDR
128bits

Pentium3 784

BX

112

5.9

3.2

525

183

35%

524
(равна макс.)

100%

183
(равна макс.)

 

-.-

-.-

-.-

5.9

3.2

525

183

35%

524
(равна макс.)

100%

183
(равна макс.)

тот же компьютер
другая OS

Pentium3 784

BX

112

5.9

2.8

533

177

33%

462

87%

177
(равна макс.)

аналогичный компьютер, новый BIOS

Pentium3 600

i815

100

4.5

2.4

658

165

25%

424

64%

190

clock RAM ниже FSB

-.-

-.-

133

4.5

2.4

842

230

27%

577

69%

254

 

-.-

-.-

133

4.5

2.4

892

250

28%

659

74%

286

тайминги = fast

-.-
FSB=150

-.-

150

5.1

2.7

927

260

28%

649

70%

286

частота процессора
(и RAM) повышена
до 150MHz

-.-

VIA 694

133

4.5

2.4

834

155

18%

465

56%

179

 

Данные в [...] приведены для размера тестового блока 64 байта.



Как комментарий к вышесказанному, если в Athlon XP выключить 'advanced speculative caching', то:

cache speed memory speed

Вам это ничего не напоминает? (обратите внимание, что скорость RAM стала такая же, как и в 990'ом, а была на 10% ниже)

И ... не хотел связываться с "самой любимой фирмой", но предвижу множество вопросов. Добавлю графики для размера блока обмена в 64-байта на AM750, VIA KT133 и KT266:

AM751 (110MHz)

VIA KT133 (133MHz) VIA KT266 (266MHz)



Вернуться на первую страницу.