|
||||
|
Программа для визуального представления производительности системной памяти.
Зачем нужна эта программа Что нового Внешний вид Небольшое описание Что, где, ...?? |
||||||||||||||||||||||||||||||||||||||||||
Зачем нужна эта программа.
В начальной версии строятся два графика: Что нового.
По сравнению с предыдущей редакцией, программа претерпела некоторые изменения.
Небольшое описание.
Описание можно почитать в предыдущей редакции,
но это не особо интересно. В этой редакции автоматические настройки спрятаны внутрь, а
опция "High priority" убрана - в ней нет необходимости.
Что, где, ...???
А что говорить - берите, пользуйтесь.
WARNING! email на hotmail практически не работает!
- производительность системы кеширования
- зависимость скорости чтения и записи системной памяти от режима доступа по адресам
Описание предыдущей редакции BenchMem назодится здесь
Теперь программа измеряет измеряет производительность подсистемы памяти, т.е. вредоностное
влияние различных операций процессора чтения и записи максимально устранено. Цель программы - показать
потенциальную производительность памяти, а не как быстро можно читать и записывать различными
командами процессора.
Реализовано:
- график скорости I-cache
- график скорости D-cache
- вычисление блока передачи данных
- производительность памяти при 32,64,128 и 256-байтном доступе
- график memory latency не реализован и вряд-ли будет. Прикидочные
измерения показали слабую связь между временем доступа (latency) и производительностью памяти.
- уменьшен размер окна программы.
Программа имеет 4 окна:
- производительность cache 1, 2 level и внешней памяти.
Внизу окна выводится:
- размер кешей и памяти. Если часть системной памяти используется
для других аппаратных целей, например встроенная VGA, то будет показываться чуть меньше, чем установлено
физической памяти. Размер I-cache для Pentium4 процессоров идет с пометкой * (неточно) и с
надписью ':4'. Причина этого в том, что Pentium4 исполняет код в uOps, а его размер не совпадает с размером
программы, которую выполняет процессор. Алгоритм тестирования I-cache выбирается из условия высокого
быстродействия и для него следует делать поправку по определенному размеру между Kbyts и KuOps в 4 раза.
- скорость чтения D-cache, cache 2 level, памяти и скорость выполнения в I-cache
- скорость чтения из cache 2 level
- блок доступа для cache 2 level (м.б. неточен) и для памяти
Причина появления блока доступа вызвана тем, что информация между контроллером памяти и
процессором передается блоками.
Строка mode является технологической.
Также на этом окне есть кнопка обновить, позволяющая перезапустить тест в этом окне.
На втором окне выводится скорость чтения блоков памяти разного размера в 32, 64, 128 и 256 байт
для разного 'прыжка' по адресам. Например, позиция 1Kb означает, что следующее чтение будет
смещено от текущего на 1Kb в сторону большего адреса и его скорость равна соответствующим
позициям графиков. Значения с отрицательными числами соответствуют смещению нового адреса
в сторону уменьшения адресов. Цифра 0 обозначает прямое последовательное (потоковое) чтение.
Отдельные всплески, кроме зоны около 0, означают случайную синхронизацию в связке CPU-...-RAM,
что и вызывает всплеск производительности.
Как итоговая характеристика считается средняя скорость случайного чтения как среднее по
разным размерам блока с учетом весовых коэффициентов. Весовой коэф-т метода чтения 32 байта
самый большой, для каждого последующего в 1.5 раза меньше. Это приближает результат
к работе реальных программ.
Также на этом окне есть кнопка обновить, позволяющая перезапустить тест в этом окне и
кнопка фильтр для сглаживания графиков. Более гладкие графики легче воспринимаются.