Производительность подсистемы памяти.
Меня всегда интересовал вопрос производительности всей системы памяти, но были несколько другие задачи и этот вопрос так и висел в воздухе. Все бы и заглохло, да не так давно пришлось ускорить компьютер заменой процессора Athlon с T-bird 990MHz на T-bred 1800Mhz (XP2200+) и ... как-то 'не особенно'. Обычные тесты показывали существенное ускорение, а реальные игры ... Сразу скажу, моя mainboard процессоры T-bred принципиально не поддерживает и пришлось править BIOS, так что были возможны любые казусы. Хороший способ разобраться - разложить все по полочкам и попробовать найти узкое место.
Нет, проблема не в том, что тест выполняется почти 5 минут и не в той наплевательской форме представления
результата.... нет, проблема была в самих числах! Для моего процессора результаты почти совпали с образцовым
Athlon XP2200+, но какие это были результаты? Получалось, что производительность cache 1 level линейно нарастает
на 10%, что объяснимо маленьким размером тестового блока и в общем-то нормально, а потом спадает более чем в 1.5
раза. Простите, это как??
Про cache 2 level вообще весело - ее скорость уменьшалась от емкости как минимум на 20%. Измерения, сделанные
позже показали, что цифры Sandra для cache 1 level занижены как минимум в 1.5 раза, а для cache 2 level
завышены в 1.2 раза. Все это навевает мысль о 'коэффициентах' и 'поправках'. Низкую скорость по cache 1 level
можно объяснить строкой 'Float iSSE' ... но тогда надо писать, что сделали тест SSE специально для Pentium4
процессоров, а не "cache & memory benchmark". Нет ... никаких слов нет, чтоб охарактеризовать 'разработчика'
этого теста.
Анализ графиков, вид графиков.
Вид кривых определяются политикой управления банками и станицами SDRAM. Например, у VIA четко прослеживается кратность 4Kb, а это как раз размер страницы для модуля DIMM. У AM750 падение скорости в области 8Kb обусловлено схожей причиной, но его вызывает не контоллер, а система кеширования, наследство страничного выравнивания Alpha 21264.Анализ графиков, частота и тайминги памяти.
Одна из составных частей этого тестирования - проверка влияния синхронности и таймингов памяти на быстродействие подсистемы памяти. Рассматривается один и тот же процессор Pentium 600EB на mainboard i815PE. Приняты обычные, стандартные установки для этого варианта процессор-mainboard, т.е. процессор и SDRAM на частоте 133MHz, тайминги памяти в BIOS default (3-3-3).Немного теории.
Какие факторы влияют на производительность подсистемы памяти? Основной элемент - контроллер внешней памяти, остальные составляющие:Немного выводов, процессоры.
Ну что сказать .... все плохо. Intel и AMD увлеклись многопроцессорными системами и это сказалось. Впрочем, о AMD позже. Вспоминается Pentium3 с BX и становится скучно. Про микропроцессорный интерфейс я уже много сказал, думаю, добавить больше нечего. Единственно на что хочется обратить внимание - Intel при упрощении процессоров из Pentium в Celeron не только укорачивает cache 2 level, но и убирает улучшенное управление кешированием. Это хорошо заметно по приведенным графикам, Pentium2-400 (slot1, 512KB cache) имеет нормальную кривую производительности, а Celeron-500 значительно хуже. И там и там был один и тот же chipset BX.Intel, chipset's
AMD честно созналась, что chipset'ы не умеет делать и ее трогать не стоит, возьмем Intel. Все почему-то считают, что лучшие chipset'ы, особенно в связке с своими процессорами, делает Intel. Так ли это?AMD.
Первый процессор, сделанный фирмой AMD независимо от Intel, был К6. Интересный процессор с очень неплохими характеристиками, если не учитывать его математический сопроцессор. Впрочем, если вспомнить, что этот процессор был куплен у NexGen, то становится понятна его несбалансированность - у 6x86 NexGen вовсе FPU отсутствовал. AMD приделала недостающий FPU и сделала это весьма плохо. К6 очень сильно проигрывал Pentium в реальных расчетных приложениях, а в играх особенно. Основное отличие Pentium и K6 в том, что блок FPU Intel был интегрирован в состав процессора и мог работать независимо и совместно с основным процессором. У К6 с этим дело обстояло значительно хуже - его модуль FPU был механически вложен в состав процессора так же, как это сделано в 486 процессорах. Это приводило к тому, что в одно и то же время мог работать либо процессор, либо сопроцессор. Падение производительности в играх было настолько катастрофическим, что AMD пришлось срочно выдумывать специальные расширения системы команд, чтобы хоть как-то улучшить бедственное положение. Так и появилась расширение 3Dnow!.Advanced Micro Devices |
Digital Equipment Corporation |
Процессор: Athlon, Duron, Athlon XP |
Процессор: Alpha 21264 |
Процессор Athlon: |
Процессор Alpha 21264: |
|
|
mainboard |
processor |
Key Features |
UP1100 |
Alpha 21264 (EV67) |
AMD Irongate chipset, max. 768MB main memory, 2x AGP, UDMA 66 |
UP1200 |
Alpha 21264 (EV67) |
AMD Irongate2 chipset, max. 4GB main memory, 4x AGP |
UP1500 |
Alpha 21264 (EV67) |
AMD Irongate4 chipset, max. 4GB main memory, 4x AGP |
UP2000 |
Alpha 21264 (EV67) |
Tsunami chipset, max. 2GB main memory |
Cache 1 level.
Для повышения его производительности проходится жертвовать размером. У Intel Dcache L1 latency 1 такт при размере 8Kb, у AMD его размер увеличен в 8 раз при увеличении времени доступа до 2х тактов. Что лучше - чуть бОльшая производительность или размер? Впрочем, в уже Athlon Thunderbird cache 1 level latency уменьшили до минимума = 1.Что интересного в K8-Hammer?
- интегрированный контроллер внешней памяти. Если посмотреть спецификацию на EV7, то ... Compaq EV7 собран из того-же EV68 ядра 21264 процессора с инегрированным двуканальным RDRAM memory контроллером, 64KB cache 1 level & 1.5MB cache 2 level и поддержкой до 128 процессоров.
В качестве заключения.
Производительность подсистемы памяти зависит не только от таких очевидных параметров, как частота и тайминги памяти, но, увы, и от revision процессора, chipset'а и, даже версии BIOS. Причем, более новый BIOS вовсе не означает самую быструю конфигурацию системы.