Двухранговая память для ryzen: Двухранговая память выгоднее для AMD Ryzen с точки зрения быстродействия – влияние на производительность и правильный выбор / Процессоры и память

Содержание

Одноранговая или двухранговая память для Ryzen

Как одноранговая, двухранговая и четырёранговая память отражается на работе Ryzen Threadripper? Как только AMD представила новую и восхитительную линейку процессоров Ryzen, началось много разговоров о совместимости памяти с этими процессорами.

Процессоры Intel работают почти с любой ОЗУ, а вот Ryzen и Threadripper, XMP, частота памяти, задержки, Infinty Fabric, одноранговая, двухранговая и четырёранговая память и другие слова запутывают некоторых пользователей, особенно при сборке нового ПК для 3D рендера, монтажа и для других дизайнерских нужд.

В этой статье мы проанализируем работу процессоров Thredripper, чтобы понять, как их максимально оптимизировать; Начнём с того, как память разных рангов влияет на Ryzen Threadripper.

Вот что Википедия говорит о многоранговом режиме оперативной памяти:

В области цифровой электроники и компьютерного оборудования, многоканальная архитектура памяти — это технология, которая увеличивает скорость передачи данных между ОЗУ и контроллером памяти, добавляя больше каналов связи между ними. Теоретически это умножает скорость передачи данных на число имеющихся рангов.

Четырёхканальный режим памяти, который доступен при наличии четырёх планок ОЗУ, в системе с Threadripper должен увеличить скорость передачи данных между оперативной памятью и контроллером в четыре раза! Звучит довольно хорошо!

Давайте посмотрим что лучше одноранговая или двухранговая память для Ryzen и как тип памяти влияет на результаты некоторых наших самых популярных бенчмарков.

Содержание статьи:

Одноранговая или двухранговая память для Ryzen

Конфигурация компьютера:

  • Процессор: AMD Threadripper 1900X в стоке;
  • ОЗУ: Corsair Vengeance LPX DIMM Kit 64GB, DDR4-2666, CL16-18-18-35;
  • Материнская плата: MSI Gaming Pro Carbon AC X399;
  • Видеокарты: 4x 1080Ti Asus Turbo;
  • SSD: 860EVO 500GB;
  • ОС: Win10.

1. Cinebench R15

В Cinebench R15 наблюдается небольшое увеличение производительности при переходе между одноранговой, двухранговой и четырехранговой памятью. Прирост около 1%, но его можно заметить каждый раз во время теста.

Эти тесты были выполнены 5 раз, средний результат показан на картинке.

2. Cinebench R20

Не похоже, чтобы в Cinebench R20 была какая-нибудь разница между четырёх- и одноранговой памятью. В этом тесте получались очень разные результаты, поэтому сложно было вывести что-то среднее. Результаты в пределах одного теста могли отличаться на +/- 100 баллов.

3. VRAY CPU Benchmark

Поскольку тест производительности процессора VRAY выдаёт разницу всего в 1 секунду, трудно понять, есть ли какая-либо разница между одно-, двух- и четырехранговой памятью. Всё же результаты были постоянными на протяжении многих тестов, никогда особо не отклоняясь от 1:17/ 1:18 минут.

4. Redshift и Octane

Redshift и Octane — это тесты для видеокарт, но они все же эффективно используют ресурсы процессора и многоканальный режим ОЗУ может повлиять на результат.

Тем не менее, после нескольких тестов, результат таков: различия во времени тестов находятся в пределах погрешности.

Заключение

Наше тестирование одноранговая или двухранговая память ddr4 для ryzen завершено. Единственный тест, в котором был постоянный прирост в производительности от многоранговой памяти — это Cinebench R15. Четырёхранговая память даёт 1.2% прироста над одноранговой. Кажется, что все бенчмарки не очень требовательны к памяти из-за того, что сцены в них очень просты и нет смысла обращаться к большим объемам памяти во время рендеринга.

Вполне может случиться так, что вы заметите несколько большее повышение производительности с четырёхранговой памятью на платформе Threadripper, в зависимости от задач и свойств ваших проектов.

одно-, двухранговая память и разгон – а нужно ли и до скольких?

Оглавление

Вступление

Мы разгоняем в статьях оперативную память (неважно, будь то обзоры материнских плат или самой памяти), а надо ли это на самом деле? Да и на форумах часто спорят, что лучше: двухранговые модули на невысокой частоте или одноранговые – на высокой? Насколько принципиален отрыв между количеством рангов?

Где именно находится та примерная планка, свыше которой – «ну да, разогнали, но толку от такого высокого результата на практике немного, это скорее для души»? 450x300  125 KB

После некоторых размышлений (и не буду скрывать – сомнений и споров с редакцией) было решено попробовать разобраться в данном вопросе тщательнее. Разумеется, идеальный ответ найти сложно, но некоторая картина по итогам наших публикаций, первую из которых вы сейчас открыли, должна образоваться. И, благодаря нашему постоянному партнеру – компании Регард, начнем с самих процессоров AMD Ryzen и тестов в синтетике и 2D-приложениях.

Немного теории

Процессоры AMD Ryzen

В своей новой архитектуре, официально выпущенной «в широкие массы» в марте этого года, AMD ушла от той, как показало время, не совсем удачной идеи модульности, когда вычислительные ядра объединялись в модули по два и получали общие блоки вроде FPU, что заметно ограничивало их быстродействие. Тем не менее, полного отказа от модульности не произошло и в архитектуре Ryzen просматривается новый уровень ее развития: технически AMD оперирует теперь CCX-блоками (CCX – CPU CompleX), каждый из которых содержит по четыре полноценных ядра.

Первый нюанс: каждый из таких блоков оснащен своим независимым L3, а это значит, что при обращении к данным, лежащим в L3, работа будет сильно зависеть от того, где они находятся – в «собственном» L3 или соседнего CCX.

450x166  13 KB. Big one: 1093x402  355 KB

Физически на данный момент все Ryzen состоят из таких модулей, независимо от количества активных ядер. И связь между этими модулями обеспечивает двунаправленная 256-битная шина Infinity Fabric.

Второй нюанс заключается в том, что CCX-блоки и с остальными блоками процессора сообщаются по этой шине – контроллер памяти, контроллер PCI-Express, SATA-контроллер (если кто до сих пор не в курсе, в платформе Socket AM4 два контроллера SATA – к набору системной логики прибавился интегрированный в процессор контроллер на два порта SATA 6 Гбит/с), USB 3.1. И частота Infinity Fabric прямо связана с частотой памяти – она составляет 1/2 значения последней (например, при частоте памяти 2666 МГц частота Infinity Fabric будет составлять 1333 МГц).

Обобщая: разгоняя память, мы повышаем быстродействие AMD Ryzen не только благодаря тому, что разгоняем собственно память, но и за счет параллельного повышения частоты работы его внутренней шины, соединяющей различные блоки кристалла процессора. Кроме того, уменьшаются внутренние задержки на тех операциях, где обращения к памяти не происходит вовсе.

Оперативная память

Существует понятие «ширина модуля» – это параметр, прямо связанный с шиной данных контроллера памяти, которая для современных процессоров составляет 64 бит на канал. Но объем памяти лимитируется максимальным числом микросхем DRAM, которые могут быть одновременно подключены к шине и емкостью доступных в производстве микросхем DRAM.

Например, восемью микросхемами емкостью 4 Гбит один 64-bit объем 16 Гбайт не собрать. Чтобы обойти это ограничение на количество микросхем в стандарте, была реализована управляющая линия «Chip Select», позволяющая переключаться между микросхемами. Таким образом на одном модуле можно распаивать несколько наборов микросхем, разрядность каждого из которых составляет 64-bit. Ранг как раз и обозначает количество таких наборов.

В розничной оперативной памяти встречаются обычно один и два ранга (визуально такие модули, как правило, определяются по расположению микросхем – с одной или двух сторон модуля), хотя технически количество рангов по стандарту может достигать восьми. Восьмиранговая память выпускается, но встречается она в серверах, где зачастую реализован дополнительный контроль целостности данных ECC и ширина шины составляет 72 бит.

450x434  14 KB. Big one: 1500x1448  100 KB В центре кадра – двухранговая DDR4 (микросхемы с обеих сторон), справа – одноранговая (микросхемы только с одной стороны модуля).

Именно ради возможности наращивания объемов при ограниченной емкости микросхем DRAM были придуманы ранги. Однако, как это водится, у любого решения есть свои эксплуатационные плюсы и минусы.

В числе плюсов оказалось слегка подросшее быстродействие. Иначе говоря, помимо типичного чередования каналов, контроллер памяти может также чередовать и ранги. По ряду оценок, при использовании двукратного чередования рангов прирост быстродействия (по оценкам Intel) достигает около 10-12%. Дальнейшее наращивание чередования также дает некоторый выигрыш, но он идет уже по резкой ниспадающей (счет идет на единицы процентов).

450x336  10 KB. Big one: 1242x927  54 KB
С модулями, оснащенными радиаторами, сложнее, но и тут количество микросхем можно увидеть.

В минусах – повышенная нагрузка на контроллер памяти, из-за которой могут проявляться их [контроллеров памяти] архитектурные слабости. Например, стабильная работа на сниженной, относительно предельно возможной для этих модулей, частоте. Наглядный пример уже мелькал в одном из предыдущих обзоров, когда процессор Intel смог стабильно удерживать четыре двухранговых модуля Samsung на частоте 3333 МГц, а AMD Ryzen эти же четыре модуля удержал лишь на частоте 2667 МГц, а два – на 3066 МГц.

И про этот факт нужно помнить – в сочетании с еще одним фактором он может оказаться определяющим: на ряде материнских плат бюджетного класса, основанных на наборе системной логики AMD X370, множитель 3066 попросту отсутствует (навскидку можно вспомнить Gigabyte Aorus GA-AX370-Gaming 3 и Biostar X370GT5). В таком случае пользователю и вовсе придется ограничиться частотой 2933 МГц, если не удастся добиться стабильной работы при 3200 МГц. Исходя из этого, были подобраны соответствующие настройки.

Настройки системы

Используемый процессор разогнан до 3800 МГц. Для сравнения замеры проводились на настройках для модулей памяти по умолчанию – 2133 МГц и с таймингами, прописанными в SPD.

В BIOS материнской платы отключен HPET. 450x338  19 KB. Big one: 1024x768  254 KB

В операционной системе с целью минимизации «фризов» и их влияния на показатели в тестах отключен файл подкачки, профиль производительности установлен как «Высокий».

450x253  26 KB. Big one: 1920x1080  387 KB Онлайн-валидация CPU-Z: AMD Ryzen 7 1700 @ 3790.95 МГц Dump [962k3l] – Submitted by I.N..

Тайминги оперативной памяти устанавливались по схемам: tRAS=tCL+tRP, tRC=tRAS + tRP. Используемые модули памяти устанавливались во второй и четвертый по счету слоты от процессорного разъема.

450x296  21 KB. Big one: 1500x986  157 KB С задержками сразу обнаружился сюрприз: для двухранговых модулей автоматически устанавливался Command Rate 2T, поэтому для всех режимов, кроме «по умолчанию», вручную активировался GearDown Mode в BIOS материнской платы, после чего Command Rate устанавливался равным 1T.

Другой проблемой стало то, что не удалось более сносно стабилизировать систему с двумя двухранговыми модулями на частотах 3333 и 3466 МГц. Многие тесты завершались с ошибками, часть результатов была ниже, чем на более низкой частоте; часто один из двух модулей при очередной перезагрузке просто «отваливался» (виделся, но операционная система в свойствах выдавала, что его объем недоступен) – ровно та ситуация, которая была описана несколькими абзацами выше.

All of my memories: исследуем зависимость AMD Ryzen 7 от частоты и таймингов памяти. | Периферия | Обзоры

Данная статья является дополнением — или, если угодно, вольным продолжением обзора Ryzen 7 1800X. Если вы хотите узнать, каким это образом процессоры AMD начали соперничать с топовыми моделями Intel и увидеть больше игровых тестов — ознакомьтесь сперва с этим материалом.

Выход процессоров AMD Ryzen и самой новой платформы AM4 произошёл в момент смены поколений оперативной памяти. На смену «долгоиграющей» DDR3, которая к тому моменту уже исчерпала все возможности дальнейшего развития, уже пришла DDR4. И не просто пришла, а, стараниями основного конкурента AMD, стала фактически стандартом: теперь она применяется не только в «топовой» платформе LGA 2011-3, но и в «общедоступной» LGA 1151.

Разумеется, в таких условиях, да к тому же выводя на рынок платформу, которая становится отправной точкой для всех последующих продуктов компании, попросту нельзя было полагаться на память устаревшего стандарта. Более того — socket AM4 — это универсальная платформа, объединяющая и мощные ЦПУ, и новые поколения APU, а здесь надо понимать, что о негативном влиянии памяти DDR3 на скорость работы APU начали говорить ещё задолго до поколений Kaveri/Godavari.

Соответственно, новым процессорам понадобился новый же контроллер памяти, рассчитанный на работу с модулями стандарта DRR4. Он в них и появился — так, десктопные процессоры Ryzen актуального поколения рассчитаны на работу с памятью DDR4 в двухканальном режиме и поддерживают установку до четырёх модулей.

Официальные рекомендации AMD касательно оперативной памяти выглядят следующим образом:

Как видно, при использовании двух модулей рекомендуется частота в 2667 Мгц, если же заполнены все четыре слота — 2133 Мгц. Однако это справедливо только для одноранговой памяти. При использовании двухранговой памяти частоты снижаются до 2400 и 1866 Мгц соответственно.

Впрочем, это только рекомендации — никто не запрещает использовать разгон или более скоростные модули. Однако именно с разгоном памяти у процессоров Ryzen вышла довольно интересная история.

Ryzen и память: вместе веселее

Во-первых, хотя двухранговые модули при равной частоте показывают лучшую производительность, нежели одноранговые, добиться от них хорошего разгона не представляется возможным: в большинстве случаев рост частоты останавливается на отметке в 2666 Мгц, и далее остаётся лишь подбирать минимально возможные тайминги.

Так, работая над данной статьёй, автор изначально предполагал использовать модули Crucial Ballistix Tactical, весьма неплохо показавшие себя в предыдущей статье. Но максимум, чего удалось добиться с ними — как раз-таки 2666 Мгц, причём практически на штатных таймингах:

Показатели, прямо скажем, не рекордные — известны и официально задокументированы случаи работы этого комплекта с таймингами 14-14-14-34, но в данном случае любое понижение таймингов, вне зависимости от напряжения, приводила либо к циклической перезагрузке при прохождении post, либо к рандомным вылетам после загрузки ОС, не позволявшим даже снять скриншот CPU-Z.

Казалось бы — что с того? проведи тесты на 2666 Мгц и радуйся результатам. Ан нет: ключевой особенностью процессоров Ryzen является крайне высокая зависимость от частоты памяти. К примеру, как показал прошлый обзор R7-1800X, в отдельных случаях замена двухранговых модулей с частотой в 2400 Мгц на одноранговые с частотой в 3200 Мгц способна дать такой же прирост производительности, как и разгон центрального процессора!

Почему так происходит? Давайте разбираться.

Ещё в марте, спустя буквально пару недель после выхода первых обзоров Ryzen 7, в сети начали появляться сведения об их высокой зависимости от частоты оперативной памяти. В конце концов, на страницах портала Reddit, известного тем, что на нём часто появляется информация, не доходящая до профильных СМИ, появился комментарий от представителя AMD.

И что же он сказал?

Не секрет, что основным конструктивным элементом процессоров Ryzen является вычислительный блок CCX (CPU Complex), состоящий из четырёх (на этот раз уже полноценных) ядер со всей сопутствующей инфраструктурой.

Например, в R7-1800X и других представителях линейки Ryzen 7 таких блоков два, что в сумме и даёт нам 8 ядер и 16 потоков. Однако, суть не в этом.

Оба блока связаны со всей встроенной в кристалл процессора периферией — а именно, контроллерами памяти, контроллерами PCI-express, USB, SATA и всеми прочими сопричастными — посредством высокоскоростной шины Infinity Fabric. Эта 256-разрядная двунаправленная шина с паспортной пропускной способностью до 512 Гб/сек пришла на смену шине Hyper Transport в предыдущих процессорах AMD.

Подробности функционирования интерфейса сама AMD пока держит под большим секретом, однако из комментария представителя компании на портале Reddit стало ясно, что частота её работы напрямую связана с частотой контроллера памяти. А вот частота контроллера памяти, в свою очередь, намертво привязана к частоте самих модулей памяти. Причём соотношение здесь не 1:1, а 1:2 — то есть, при использовании памяти с частотой в 2400 Мгц частота контроллера и шины Infinity Fabric составит 1200 Мгц, при 2666 — 1333 Мгц и так далее.

Причём если у процессоров FX частоты северного моста и контроллера памяти имели свои собственные множители, которые можно было редактировать без оглядки на другие параметры работы процессора, то в случае с Ryzen единственный способ их увеличить — это поднятие частоты модулей. Таким образом, разгон памяти для Ryzen — это не просто эксперимент ради эксперимента — он имеет буквально ключевое значение!

Естественно, это обстоятельство не могли обойти вниманием самые известные «знатоки процессорных архитектур» и «влиятельные критики». В результате количество кулстори в интернетах растёт как снежный ком, несмотря на все данные обзоров и опыт пользователей, успевших приобрести процессоры Ryzen.

Лейтмотивом и лозунгом всея бугурта, естественно, становится фраза «ОЛОЛО РАЙЗЕН В ИГРАХ РАВЕН FX!!!111», хотя в реальности результаты четырёхмодульных FX в играх можно смело умножать на два.

Но раз есть вопрос — давайте разбираться. Что даёт Ryzen 7 разгон памяти? Что важнее — частота или тайминги? И наконец, к каким параметрам следует стремиться?

Какая память нужна?

Из опыта владельцев процессоров, а также коллег-обзорщиков, было заранее известно, что на текущий момент (на день написания статьи версия AGESA — 1004, 1006 ещё не вышла) лучший разгон способны обеспечить одноранговые модули, основанные на чипах Samsung. Неполный перечень проверенных сообществом (а конкретно — пользователем всё того же Reddit, известным под ником Wiidesire) брендовых модулей приведен в таблице ниже:

СемействоНомер моделиЧипы
G.Skill Trident Z 3000 MHz CL14F4-3000C14D-16GTZ8Gb Samsung B-Die
G.Skill Flare X 3200 MHz CL14F4-3200C14D-16GFX8Gb Samsung B-Die
G.Skill Trident Z 3200 MHz CL14F4-3200C14D-16GTZ8Gb Samsung B-Die
G.Skill Ripjaws V 3200 MHz CL14F4-3200C14D-16GVK8Gb Samsung B-Die
G.Skill Trident Z 3200 MHz CL15F4-3200C15D-16GTZ8Gb Samsung B-Die
G.Skill Ripjaws V 3200 MHz CL15F4-3200C15D-16GVK8Gb Samsung B-Die
G.Skill Trident Z 3466 MHz CL16F4-3466C16D-16GTZ8Gb Samsung B-Die
Crucial Elite 3466 MHz CL16BLE2K8G4D34AEEAK8Gb Samsung B-Die
G.Skill Trident Z 3600 MHz CL15F4-3600C15D-16GTZ8Gb Samsung B-Die
G.Skill Trident Z 3600 MHz CL16F4-3600C16D-16GTZ8Gb Samsung B-Die
G.Skill Ripjaws V 3600 MHz CL16F4-3600C16D-16GVK8Gb Samsung B-Die
Corsair Vengeance 3600 MHz CL16CMK32GX4M4B3600C168Gb Samsung B-Die
G.Skill Trident Z 3600 MHz CL17F4-3600C17D-16GTZ8Gb Samsung B-Die
KFA2 HOF 3600 MHz CL17HOF4CXLBS3600K17LD162K8Gb Samsung B-Die
Corsair Vengeance 3600 MHz CL18CMK32GX4M4B3600C188Gb Samsung B-Die
G.Skill Trident Z 3733 MHz CL17F4-3733C17D-16GTZA8Gb Samsung B-Die
G.Skill Trident Z 3866 MHz CL18F4-3866C18D-16GTZ8Gb Samsung B-Die
G.Skill Trident Z 4000 MHz CL18F4-4000C18D-16GTZ8Gb Samsung B-Die
G.Skill Trident Z 4000 MHz CL19F4-4000C19D-16GTZ8Gb Samsung B-Die
G.Skill Trident Z 4133 MHz CL19F4-4133C19D-16GTZA8Gb Samsung B-Die
G.Skill Trident Z 4266 MHz CL19F4-4266C19D-16GTZ8Gb Samsung B-Die

Автор снова отметит: это неполный список, и включены в него только брендовые модули. Но главные характеристики здесь — не «брендовость» и не наличие памяти в списке, а именно одноранговость и наличие чипов Samsung последнего поколения. А таковые можно найти и среди OEM-модулей Samsung, стоят которые гораздо дешевле. Получить стабильные 3200 Мгц можно и с ними, тайминги при этом составят нечто среднее между 16 и 18.

Более того: согласно информации, раскрытой представителем Gigabyte (удивительно, но на этот раз не на Reddit, а на форуме британских оверклокеров), грядущее обновление AGESA 1006 принесёт такой же убедительный разгон и для памяти на чипах Hynix, которые в бюджетном сегменте встречаются не в пример чаще.

Автор же для целей тестирования использовал набор Geil EVO X, полный номер модели — GEX416GB3200C16DC, состоящий из двух модулей объёмом в 8 гб.

Что характерно, в списке Wiidesire память Geil вообще отсутствует, однако это обстоятельство вовсе не помешало ей сходу и без всяких лишних манипуляций завестись со штатным профилем XMP, подразумевающим частоту в 3200 Мгц и тайминги 16-16-16-36. Не самый агрессивный режим на фоне некоторых модулей G.Skill, но впоследствии при помощи разгона память взяла и 14-14-14-34.

Тестовый стенд и методика тестирования

Конфигурация тестового стенда не претерпела существенных изменений со времени обзора R7-1800X:

Центральный процессор: AMD Ryzen 7-1800X;

Материнская плата: Gigabyte AB350-Gaming 3;

Оперативная память: GEIL EvoX GEX416GB3200C16DC, 2x8gb;

Система охлаждения процессора: Deepcool Gammaxx S40;

Термоинтерфейс: Prolimatech PK-1;

Видеокарта: EVGA GeForce GTX 1070 FTW;

Дисковая подсистема: SSD Kingston Sh203S3/120G + HDD Western Digital WD10EZRX-00A8LB0;

Корпус: Zalman R1;

Блок питания: Corsair CX 750M.

Тестовая ОС — по-прежнему Windows 10 64-bit с последними обновлениями на 16 апреля 2017 года. Драйвера чипсета AMD датируются 20 апреля 2017 года, версия драйверов для видеокарты Nvidia — 381.65.

Дабы исключить влияние динамического разгона, процессор был разогнан до 4025 Мгц при помощи множителя. Как показал предыдущий обзор, Ryzen в разгоне держат заданную частоту при любых условиях, кроме срабатывания механизмов термозащиты. Видеокарта работала на штатных частотах для модели EVGA FTW.

Для исследования разгона памяти была выбрана следующая методика: взяты все доступные множители от 21,33 до 32,0, и выбраны тайминги, соответствующие среднестатистическому варианту для данной частоты, и максимальным возможностям используемых модулей.

В результате получились следующие значения:

2133 Мгц

2400 Мгц

2666 Мгц

2933 Мгц

3200 Мгц

Методика тестирования включала в себя как синтетические бенчмарки, выполненные при стандартных настройках, так и тесты в играх. Для последних были выбрано разрешение 1920х1080 точек с максимальными настройками. Более подробно параметры указаны непосредственно на графиках.

Синтетические тесты

В соответствии с методикой, открывает сегодняшнее тестирование wPrime 2.10 — бенчмарк, определяющий производительность центрального процессора посредством вычисления квадратных корней большого количества чисел.

Несмотря на то, что wPrime — тест исключительно процессорный, влияние разгона памяти заметно и здесь. Причём прирост производительности наблюдается и при повышении частоты, и при снижении таймингов. Динамика, конечно, не поражает воображение, но если сопоставить результаты процессора с памятью на частоте в 2133 Мгц, и с памятью на 3200 Мгц при стандартных таймингах 16-16-16-36 — получится, что разгон позволил улучшить результат без малого на 13%.

Fritz Chess benchmark — тест, определяющий производительность центрального процессора за счет обработки алгоритмов шахматных партий.

Прирост в FritzChess несколько меньше — 9.9%. Любопытно также, что в этом тесте тайминги оказывают столь же заметное влияние, как и прирост частоты: в отдельных режимах при более низкой частоте, но с агрессивными таймингами результат оказывается выше, чем с более высокочастотной памятью, работающей со стандартными таймингами.

PCmark 8 — утилита для комплексного тестирования системы от авторов 3Dmark. Используя несколько сценариев, этот бенчмарк имитирует как выполнения ряда типовых задач: веб-серфинг, набор текста, IP-телефония, — так и более сложных. В пакет включены обработка фотографий, кодирование видео и даже игровые тесты, перекочевавшие сюда напрямую из предыдущих версий 3Dmark.

В тесте Home, имитирующем рядовые домашние задачи, прирост производительности от разгона памяти ещё меньше, и составляет около 8%. Отметим также, что влияние таймингов хорошо заметно только при низких частотах. Когда же память переваливает за 2666 Мгц, решающую роль начинает играть частота.

Хотя тест Creative включает в себя ряд более сложных задач, в которых Ryzen показывает себя заметно лучше, прирост производительности от разгона памяти здесь остается на том же уровне, что и в Home. Тем не менее, по сравнению с предыдущим тестом, здесь решающую роль играет именно частота: память с более высокими частотами и стандартными таймингами показывает те же или лучшие результаты, что и память с низкой частотой и агрессивными таймингами.

Поскольку методика тестирования процессоров предполагает и игровые тесты, нельзя было исключить из внимания традиционный бенчмарк 3Dmark Fire Strike.

Прирост производительности от разгона памяти — около 9%. При этом значение имеет и частота, и тайминги: игровой тест готов использовать любое преимущество.

Тесты в рабочих приложениях

Cinebench — бенчмарк, основанный на движке популярного программного пакета для трехмерной графики и анимации, Cinema 4D, — определяет производительность процессора путем замеров скорости рендеринга сложной трехмерной сцены.

Разгон памяти позволяет Ryzen 7 добиться как минимум 11%-ого преимущества над самим собой. Учитывая уровень его производительности в этом тесте, показатель не самый наглядный, и тем не менее, он выше, чем в предыдущих тестах. Также отметим, что в этом тесте тайминги зачастую дают больший прирост, нежели частота, хотя и на её увеличение Cinebench откликается весьма охотно.

Luxmark — еще один тестовый пакет, использующий замеры скорости рендеринга для оценки производительности системы. В отличие от Cinebench, предлагает три сцены разного уровня сложности, и может использовать рендеринг силами ЦПУ и графического процессора одновременно. В данном случае использовался только центральный процессор.

Первый синтетический тест, в котором разгон памяти позволяет Ryzen 7 отыграть у самого себя без малого… 23%. Собственно, комментарии здесь излишни.

Не менее сложная задача чем трехмерный рендеринг — кодирование видео. Для оценки производительности процессоров в подобных задачах автор использовал тестовый пакет x264HD benchmark 5.0.1, работающий в 64-битном режиме. Замеры производительности здесь основаны на измерении скорости перекодирования исходного видео в формат x264 — к слову, соответствующий кодер используют большинство популярных программ такого рода.

x264 benchmark от разгона памяти зависит в наименьшей степени: тайминги здесь вообще не играют роли, разницу в производительности при их изменении можно смело списать на погрешность измерений. Но и увеличение частоты не приносит каких-либо серьёзных дивидендов: разница между первым и предпоследним режимом — всего 3%.

Бенчмарк SVPmark не является тестом на производительность при кодировании видео в чистом виде — он определяет скорость работы системы с программой Smooth Video Project (SVP), целью которой является увеличение плавности воспроизведения видео за счет включения в него промежуточных кадров.

В этом бенчмарке прирост от разгона памяти составляет уже 13%, причём хорошо заметно влияние как частоты, так и таймингов.

Встроенный бенчмарк утилиты True Crypt позволяет оценить производительность процессоров при криптографической нагрузке. Использование тройного алгоритма AES-Twofish-Serpent позволяет загрузить работой процессор с любым количеством ядер.

Ещё один бенчмарк наряду с x264HD, практически не зависящий от скорости работы памяти. Из общего ряда выбивается разве только частота в 2133 Мгц, где действительно наблюдается некоторое отставание. В остальных же случаях разница укладывается в пределы погрешности измерений.

Архивация данных в 7-zip — еще один способ загрузить процессор работой, причем полученные результаты можно считать оценкой быстродействия системы в офисных задачах. Впрочем, в этом случае важны не только производительность и количество ядер, но и пропускная способность памяти.

Невероятно, но факт: самый зависимый от скорости памяти тест не показывает огромной разницы. Разгон с 2133 Мгц и 15-15-15-36 до 3200 Мгц при 16-16-16-36 демонстрирует лишь 7% прирост производительности. Также из разряда странного: тайминги имеют едва ли не большее значение, нежели частота работы модулей.

Тесты в играх

Batman: Arkham Knight — завершающая часть трилогии от студии Rocksteady, которая по замыслу должна была стать самой драматичной и трагической. ИЧСХ, стала. Но только не в том смысле. Несмотря на все достоинства сюжета и графики, игра вышла настолько сырой и кривой, что даже обзорщикам пришлось ждать кучи патчей, прежде чем полученные результаты можно было представить публике.

А вот это уже серьёзно: 18% прироста производительности от разгона памяти и возможность для Ryzen 7 равняться со стоковым Core i7-7700K в исключительно оптимизированной под Intel игре — комментарии излишни. Впрочем, отметим любопытный факт: прирост производительности практически линеен, и тайминги здесь не менее важны, чем частота.

Третья часть ролевой серии от Bioware, сумевшая во многом реабилитировать студию после сокрушительного фейла с концовкой трилогии Mass Effect – а это уже показатель. Как и Battlefield 4, игра создавалась на новом движке Frostbite, сменившем Unreal Engine. А значит, графика здесь настолько же хороша, насколько масштабна и эпична сама Dragon Age: Inquisition.

Движок Frostbite отличился любопытным поведением: тайминги здесь почти не играют роли, заметные изменения от их понижения начинаются только на высоких частотах. А вот увеличение частоты оперативной памяти даёт очень неплохие дивиденды: 16% прироста производительности и возможность сравняться уже не с номинальным, а с разогнанным Core i7-7700K, работающим на гораздо более высокой частоте: 4,7 Ггц против 4,02 у Ryzen 7.

FarCry: Primal — пожалуй, самый смелый эксперимент Ubisoft за последнее время. Серия, известная своей шутерной механикой не меньше, чем открытым миром, была отправлена во времена, когда от ближайшего огнестрельного оружия главного персонажа отделяет всего лишь какая-то парочка тысячелетий. Тем не менее, выживание в древнем мире среди гигантских хищников и не менее опасных двуногих действительно вдохнуло в серию новую жизнь и резко взбодрило надоевший игровой процесс. Подросли и системные требования, причём как к графической, так и к процессорной части ПК.

FarCry: Primal, как и Batman: Arkham Knight, хорошо откликается и на снижение таймингов, и на прирост частоты. Плюс 15% к производительности Ryzen 7 и возможность соревноваться со стоковым Core i7-7700K.

Mass Effect: Andromeda — «якобы-продолжение» одной из самых знаковых ролевых игр последних лет, заставившей миллионы людей по всему миру вновь мечтать о покорении космоса и изучении далёких миров. В целях экономии разработка игры была поручена издателем подразделению Bioware, никогда ранее не занимавшемуся проектами ААА-класса, что неминуемо сказалось на итоговом результате. Тем не менее, графически игра довольно хороша (если не смотреть на лица персонажей) и к тому же, работает на самой актуальной версии движка Frostbite.

Mass Effect, хоть и основанная на последней генерации движка Frostbite, также отличается безразличием к таймингам: прирост от их снижения минимален и может быть списан на погрешность измерений. Впрочем, и увеличение частоты оперативной памяти даёт Ryzen 7 лишь 9% преимущество.

Watch Dogs 2 — продолжение относительно новой франшизы Ubisoft, исправляющее недостатки первой части, и подкупающее целевую аудиторию темой борьбы «не таких как все» против «всех, которые такие». В графическом плане, как и по геймплею, игра заметно превосходит предшественницу, а системные требования и вовсе не сопоставимы.

Watch Dogs 2 оказывается не в пример более благодарным, нежели Mass Effect: тайминги здесь дают заметный прирост производительности, а разница между 2133 Мгц 15-15-15-36 и 3200 Мгц 16-16-16-36 составляет уже 14%.

Выводы

В отличие от платформ Intel, для AMD socket AM4 разгон памяти имеет не меньшее, а местами даже и большее значение, нежели разгон самого процессора. В синтетических бенчмарках и рабочих задачах прирост производительности может колебаться в пределах от 7 до 13%, с редкими перегибами вроде Luxmark и x264HD benchmark. Однако, если честно, для этих задач разгон памяти не обязателен: Ryzen 7 и без того показывает превосходную производительность.

А вот в играх ситуация иная: тут и прирост производительности колеблется от 9 до 18%, что несколько больше, нежели в рабочих задачах, и «лишняя» производительность на поверку оказывается вовсе не лишней: Ryzen 7 с памятью на частоте в 3200 Мгц и низкими таймингами получает возможность на равных посоревноваться с Core i7-7700K — который, напомним, работает на гораздо более высоких частотах: 4700 Мгц против 4025 у Ryzen 7.

Таким образом, пренебрегать разгоном памяти на платформе AM4 определённо не стоит: полученные дивиденды могут оказаться едва ли не выше, чем прирост от разгона самого процессора. Тем более что актуальные на сегодняшний день экземпляры восьимиядерных Ryzen гонятся в среднем до 4-4,1 Ггц при потолке в 4,2 Ггц при использовании СВО.

Что же важнее — частота или тайминги? Частота. Если снижение таймингов даёт заметный прирост производительности лишь в ряде бенчмарков, то прирост от увеличения частоты заметен абсолютно везде. И память на частоте в 3200 Мгц с самыми среднестатистическими таймингами 18-18-18-38 всегда оказывается быстрее низкочастотных модулей с самыми злыми таймингами. Впрочем, это понятно и из теоретической части: ведь именно частота оперативной памяти влияет на скорость работы шины Infinity Fabric и контроллера памяти Ryzen.

Таким образом, хотя разгон памяти на этой платформе и актуален, покупать дорогие брендовые модули вовсе не обязательно: достаточно, чтобы они держали разгон до 3200 Мгц, снижение таймингов же будет лишь приятной опцией. К примеру, у экономных владельцев Ryzen некоторым авторитетом начали пользоваться OEM-модули производства Samsung модели M378A1K43BB1-CPBD0 — как раз по указанным выше причинам. И вполне «подъёмной» стоимости.

Кроме того, не следует забывать и о грядущем обновлении AGESA, которое обещает хороший разгон не только для памяти Samsung, но и для модулей на чипах Hynix, среди которых традиционно наблюдается много весьма бюджетных моделей с неплохими характеристиками. К слову, вполне вероятно, что после выхода AGESA 1006 и соответствующего биоса для тестовой платы автор проверит возможности таких модулей.

DDR4 и Ryzen. Нюансы настройки и разгона памяти на платформе AMD AM4

Авторский материал

За последние несколько лет AMD выпустила два поколения высокопроизводительных процессоров Ryzen, основанных на совершенно новой архитектуре с огромным потенциалом. Недавно компания представила уже третье поколение. Но, тем не менее, Интернет полон страхов и недопониманий потенциала платформы «не от Intel». Некоторые пользователи до сих пор боятся приобретать систему AMD AM4 из-за ряда причин, проявившихся во время старта продаж первого поколения.

Мое имя Юрий Бублий (@1usmus), я являюсь разработчиком DRAM Calculator for Ryzen, автором многочисленных BIOS-модификаций и куратором десятка тем, посвященных этим процессорам и всему, что их окружает. После двух лет исследований и разработок я готов поделиться своими секретами по оптимизации памяти в системах Ryzen. Под оптимизацией я имею в виду разгон и настройку системной оперативной памяти. Да-да, то самое коварное слово «разгон».

«О Боже, там так много параметров и это может еще повлиять на гарантию!» — подумали вы. Нет, все гораздо проще. Сегодня я расскажу, на что стоит обратить внимание при покупке, как быстро и правильно настроить систему, минуя страхи и типичные ошибки, которые можно получить в процессе разгона.

Некоторые из вас могут спросить, какие реальные преимущества можно получить от разгона памяти и что в целом оно даст? Начну с того, что существует возможность увеличить средний fps в играх до 50% только благодаря оптимизации подсистемы памяти. Этот показатель не является просто числом, это сумма факторов, которые влияют на качество вашего геймплея. Сюда входят значения 1% low и 0,1% low, минимальный fps, средний и максимальный. То есть, если у вас есть желание получить максимум отдачи от системы, вам все-таки придется осилить эту статью.

Звучит заманчиво, не так ли?

Infinity Fabric

Для связи между отдельными блоками в процессорах AMD Ryzen используется внутреннее соединение Infinity Fabric, пришедшее на смену шине HyperTransport.

Под блоками подразумевается вычислительные комплексы ЦП (группы до 4 ядер ЦП именуемые CCX). Infinity Fabric имеет свой собственный тактовый домен, который синхронизируется с физической частотой памяти. Поколения Zen 1 и Zen+ работают в режиме UCLK=MEMCLK. Поколение Zen 2 получит дополнительный режим UCLK=1/2 MEMCLK, который существенно увеличит частотный потенциал DRAM во время разгона.

Конструктивно Infinity Fabric представляет собой 256-битную двунаправленную шину. С ее помощью в шестиядерных и восьмиядерных моделях процессоров Ryzen (архитектуры Zen 1 и Zen+) два четырехъядерных модуля (CCX) обмениваются данными с другими блоками, включая контроллер PCI Express и южный мост. В Zen 2 обмен данными происходит не только между CCX, а и между чиплетами CCD и мастер-чиплетом I/O посредством новой двунаправленной шины.

Infinity Fabric Zen/Zen+ функционирует на частоте, равной физической частоте системной ОЗУ. Например, если контроллер памяти работает c DDR4-2133 в режиме UCLK=MEMCLK, матрица коммутатора синхронизируется с частотой 1066 МГц (напомню, эффективная частота указана в обозначении памяти). Это означает, что более быстрая память позволяет увеличить пропускную способность внутреннего соединения Infinity Fabric.

Эта технология открывает большие перспективы при создании многоядерных процессоров, таких как Ryzen 3000, о которых мы вскоре с вами поговорим.

Типы памяти

За последние 10 лет компания Intel посеяла в головах пользователей главный тезис — оперативная память это декоративная заглушка, иногда она имеет подсветку и прикольно выглядит в корпусе, люди перестали задумываться о реальной значимости ОЗУ.

На данный момент на рынке оперативной памяти представлено огромное кол-во вариантов, которые могут нас заинтересовать, но могут оказаться совершенно бесполезными. Какую же выбрать?

Лидером в разгоне является оперативная память на чипах Samsung B-die (20 нм). Эти чипы демонстрируют рекордные показатели частоты/латентности «из коробки». Хочу отметить важный момент, что вам не обязательно покупать набор, на котором будет нарисовано красивые числа вроде 4200+ МГц, в большинстве случаев разгон такого комплекта будет сопоставим с набором DDR4-3000 с CL14. Безусловно, кремниевая лотерея присутствует и может оказаться, что «3000CL14» больше 3600 МГц не захотят брать стабильно. В качестве примера я покажу вам, что могут модули, которые попали в этот материал.

Первыми в списке идут G.Skill Sniper X 3400C16 (F4-3400C16-16GSXW). Это одноранговая (или single rank) память, базовые характеристики нельзя назвать феноменальными, в отличие от результата, который получен после разгона.

Так же на этих модулях удалось получить заветные 3733 МГц при CL14, но с довольно большим напряжением — 1,51 вольт. Я считаю, что данное напряжение не подходит для использования в режиме 24/7, так как есть шанс получить  преждевременную «смерть» плашек.

«Спасибо за помощь, камрад!» Ускоряем игровой ПК на базе процессора AMD Ryzen

Привет, Гиктаймс! Мы продолжаем изучать взаимодействие Ryzen с оперативной памятью. Сегодня займемся практическими исследованиями и ответим на все главные вопросы.

Давно известно, что AMD Ryzen с медленной и быстрой «оперативкой» — это две совершенно разные в плане производительности системы. Давайте определим, какая DDR4-память лучше всего подходит игровым ПК на базе «красных» процессоров.



Именно сейчас можно смело сказать: процессоры Ryzen удались. AMD выпустила хорошие решения, которые действительно конкурируют с чипами Intel. Интересно, что возродившаяся конкуренция повлияла и на действия, предпринимаемые главным соперником «красных», — компанией Intel. Поэтому в 2018 году, скорее всего, среднестатистический современный игровой компьютер будет собран на базе 6- или 8-ядерного CPU (Ryzen или Coffee Lake) c DDR4-памятью.

Особенности игровой платформы AMD AM4


На сегодняшний день для платформы AMD AM4, которая поддерживает процессоры Ryzen 3, Ryzen 5 и Ryzen 7, предусмотрено несколько чипсетов: A320, B350 и X370. Главной ее особенностью, несомненно, является тот факт, что высокочастотная оперативная память поддерживается всеми материнскими платами без исключения — от самых дешевых до самых дорогих устройств. И этим надо пользоваться.

Двухканальный контроллер памяти DDR4, встроенный непосредственно в центральный процессор, поддерживает ОЗУ стандартов DDR4-2133, DDR4-2400 и DDR4-2666. Но есть один нюанс: работа на частоте 2666 МГц и выше возможна только для одноранговых модулей при условии их установки по одной планке в каждом канале.

В то же время, начиная с версии микрокода AGESA 1.0.0.6, материнские платы для чипов Ryzen поддерживают оперативную память с эффективной частотой вплоть до 4000 МГц. Когда-нибудь мы будем вспоминать этот стандарт с улыбкой на лице и думать, какими же медленными были компьютеры в тем времена, но сейчас, на закате 2017 года, наиболее оптимальными (в том числе и в плане цены) вариантами смотрятся киты ОЗУ, работающие в диапазоне частот 2666-3200 МГц. Именно с такими наборами памяти процессоры Ryzen проявляют свои лучшие качества. Об этом говорит сама AMD. Об этом говорят производители материнских плат.

Надо понимать, что рекомендации — это всего лишь рекомендации. Никто не запрещает использовать и более быстрые комплекты ОЗУ вместе с платформой AM4. Например, наш комплект памяти Kingston HyperX Predator HX433C16PB3K2/16 великолепно работает вместе с Ryzen. Используя материнскую плату ASUS ROG Crosshair VI Extreme, нам даже удалось «завести» этот набор ОЗУ на эффективной частоте 3466 МГц, не изменяя напряжения и таймингов.

Хочется того или нет, но высокочастотная оперативная память потихоньку становится неотъемлемой частью любого производительного ПК. Особенно, если этот компьютер собран на базе компонентов AMD Ryzen. Некоторые важные характеристики архитектуры Zen, применяемой в процессорах Ryzen, описаны в этой статье.

Во-первых, у чипов Ryzen очень медленно работает TLB-буфер. Во-вторых, частота работы встроенного северного моста Data Fabric жестко привязана к частоте работы оперативной памяти. Для лучшей синхронизации в Ryzen он всегда работает на частоте вдвое ниже эффективной частоты памяти. Получается, если в компьютере используется комплект оперативной памяти DDR4-2133, то Data Fabric работает на частоте 1066 МГц. Северный мост является одним из самых главных компонентов процессора Ryzen, так как именно он отвечает за взаимодействие CCX (CPU Complex) — кластеров, в которых размещены ядра и кеш. Чем меньше частота Data Fabric — тем хуже межъядерное взаимодействие в кристалле.

На сегодняшний день абсолютное большинство приложений используют несколько потоков, поэтому ускорение работы северного моста в процессорах Ryzen положительно сказывается в задачах любого рода — в том числе и в играх. Надо понимать, что AMD сама позиционирует платформу AM4 как игровую. Современные игры спокойно задействуют больше четырех потоков, а потому использование быстрой ОЗУ положительно сказывается на количестве FPS. К тому же все Ryzen-чипы — будь то четырехъядерные Ryzen 3, шестиядерные Ryzen 5 или восьмиядерные Ryzen 7 — оснащены двумя кластерами CCX, а потому использование высокочастотной оперативной памяти положительно скажется на быстродействии всех моделей без исключения. Пруфы предоставлены далее в статье.

Тестирование


Для проведения нашего небольшого эксперимента использовался стенд с процессором AMD Ryzen 7 1700, разогнанным до 3,9 ГГц, набором памяти Kingston HyperX Predator HX433C16PB3K2/16 и видеокартой NVIDIA GeForce GTX 1080. Кит ОЗУ запускался со следующими настройками:

• DDR4-2133 — тайминги 12-12-12-32, 14-14-14-34, 16-16-16-36 и 18-18-18-38;
• DDR4-2400 — тайминги 12-12-12-32, 14-14-14-34, 16-16-16-36 и 18-18-18-38;
• DDR4-2666 — тайминги 14-14-14-34, 16-16-16-36 и 18-18-18-38;
• DDR4-2933 — тайминги 16-16-16-36 и 18-18-18-38;
• DDR4-3200 — тайминги 16-16-16-36 и 18-18-18-38;
• DDR4-3333 — тайминги 16-18-18-36 (XMP-профиль комплекта).

В стенде использовалась операционная система Windows 10 x64 Pro. Все игры запускались в разрешении Full HD с использованием пресета качества графики «Высокое» и отключенным сглаживанием. На графиках указан минимальный и средний FPS, замеренный при помощи программы FRAPS.

Основная тема заметки — игры, но давайте для большей наглядности добавим результаты тестирования в бенчмарках x265 и CINEBENCH R15. Как видите, увеличение частоты ОЗУ несколько ускоряет выполнение этих задач. Например, при переходе с DDR4-2133 до DDR4-3200 система при рендеринге в анимационном пакете CINEMA 4D стала быстрее на 3% при задержках CL16. В бенчмарке x265 наблюдается точно такая же ситуация. Вообще большой прирост производительности виден в таких задачах, которым необходимы большие объемы данных. К ним относятся архиваторы и графические редакторы. В этих приложениях разница между системами с разной «оперативной» может достигать 6-10 процентов.

Все, расходимся? Как бы не так! В играх наблюдается более интересная ситуация, особенно если в системе установлена производительная игровая видеокарта. Например, в GTA V, если сравнить систему с памятью DDR4-2133 CL16 с системой с DDR4-3200 CL16, наблюдается разница в 14% и 22% в среднем и минимальном FPS соответственно. Приличная разница, согласитесь.

Обратите внимание, какие просадки минимального фреймрейта появились в Battlefield 1 при использовании низкочастотной памяти с высокими таймингами (CL16, CL18). Вывод напрашивается сам: хотите комфортно играть в многопользовательские шутеры и избегать лагов в самые ответственные моменты — используйте хотя бы комплект ОЗУ DDR4-2666.

Задержки памяти тоже заметно влияют на производительность в играх, поэтому нельзя не учитывать этот момент. Однако на графиках видно, что в ряде случаев прибавка частоты ОЗУ работает эффективнее снижения таймингов.

Идеальный вариант для систем на базе чипов AMD Ryzen — это использование высокочастотной памяти с задержками не выше CL17/CL18.

Если в систему установить менее производительные четырехъядерный процессор Ryzen 5 1400, так же разогнанный до 3,9 ГГц, то вместе с видеокартой GeForce GTX 1080 эффект процессорозависимости будет наблюдаться заметно сильнее. Смотрите сами: система с DDR4-2133 уступает компьютеру с DDR4-3200 при одинаковых таймингах целых 15% в GTA V. В «Ведьмак 3» эта разница достигает 21%, а в «Assassin’s Creed: Истоки» — 23%. Получается, что игровым ПК с более бюджетными процессорами Ryzen использование высокочастотной ОЗУ даже важнее, так как нагрузка на ядра и кеш увеличивается.

*Во всех режимах использовалась память с таймингами 16-18-18-36.

Выводы


Надеемся, наш мини-эксперимент наглядно показал, что при сборке игрового ПК на базе платформы AMD AM4 и процессоров Ryzen в частности нельзя пренебрегать таким компонентов, как оперативная память. Даже в бюджетные системы необходимо устанавливать комплекты, работающие хотя бы на частоте 2666 МГц. Если же вы хотите получить максимум от своего игрового компьютера, то вам потребуется набор DDR4-3000+. Как видите, все очень просто.

Дальше будет ещё круче! Подписывайтесь и оставайтесь с нами!

Для получения дополнительной информации о продукции Kingston и HyperX обращайтесь на официальный сайт компании.

Про ранги и виртуализацию в RAM / Сервер Молл corporate blog / Habr

В продолжение рубрики «конспект админа» хотелось бы разобраться в нюансах технологий ОЗУ современного железа: в регистровой памяти, рангах, банках памяти и прочем. Подробнее коснемся надежности хранения данных в памяти и тех технологий, которые несчетное число раз на дню избавляют администраторов от печалей BSOD.


Сегодня на рынке представлены, в основном, модули с памятью DDR SDRAM: DDR2, DDR3, DDR4. Разные поколения отличаются между собой рядом характеристик – в целом, каждое следующее поколение «быстрее, выше, сильнее», а для любознательных вот табличка:

Для подбора правильной памяти больший интерес представляют сами модули:


  • RDIMM — регистровая (буферизованная) память. Удобна для установки большого объема оперативной памяти по сравнению с небуферизованными модулями. Из минусов – более низкая производительность;


  • UDIMM (unregistered DRAM) — нерегистровая или небуферизованная память — это оперативная память, которая не содержит никаких буферов или регистров;


  • LRDIMM — эти модули обеспечивают более высокие скорости при большей емкости по сравнению с двухранговыми или четырехранговыми модулями RDIMM, за счёт использования дополнительных микросхем буфера памяти;


  • HDIMM (HyperCloud DIMM, HCDIMM) — модули с виртуальными рангами, которые имеют большую плотность и обеспечивают более высокую скорость работы. Например, 4 физических ранга в таких модулях могут быть представлены для контроллера как 2 виртуальных;


  • FBDIMM — полностью буферизованная DIMM с высокой надежностью, скоростью и плотностью размещения.

Попытка одновременно использовать эти типы может вызвать самые разные печальные последствия, вплоть до порчи материнской платы или самой памяти. Но возможно использование одного типа модулей с разными характеристиками, так как они обратно совместимы по тактовой частоте. Правда, итоговая частота работы подсистемы памяти будет ограничена возможностями самого медленного модуля или контроллера памяти.

Для всех типов памяти SDRAM есть общий набор базовых характеристик, влияющий на объем и производительность:


Конечно, отличий на самом деле больше, но для сборки правильно работающей системы можно ограничиться этими.


Понятно, что чем выше частота — тем выше общая производительность памяти. Но память все равно не будет работать быстрее, чем ей позволяет контроллер на материнской плате. Кроме того, все современные модули умеют работать в в многоканальном режиме, который увеличивает общую производительность до четырех раз.

Режимы работы можно условно разделить на четыре группы:


  • Single Mode — одноканальный или ассиметричный. Включается, когда в системе установлен только один модуль памяти или все модули отличаются друг от друга. Фактически, означает отсутствие многоканального доступа;


  • Dual Mode — двухканальный или симметричный. Слоты памяти группируются по каналам, в каждом из которых устанавливается одинаковый объем памяти. Это позволяет увеличить скорость работы на 5-10 % в играх, и до 70 % в тяжелых графических приложениях. Модули памяти необходимо устанавливать парами на разные каналы. Производители материнских плат обычно выделяют парные слоты одним цветом;


  • Triple Mode — трехканальный режим работы. Модули устанавливаются группами по три штуки — на каждый из трех каналов. Аналогично работают и последующие режимы: четырехканальные (quad-channel), восьмиканальные (8-channel memory) и т.п.


  • Flex Mode – позволяет увеличить производительность оперативной памяти при установке двух модулей различного объема, но с одинаковой частотой.

Для максимального быстродействия лучше устанавливать одинаковые модули с максимально возможной для системы частотой. При этом используйте установку парами или группами — в зависимости от доступного многоканального режима работы.


Ранг (rank) — область памяти из нескольких чипов памяти в 64 бита (72 бита при наличии ECC, о чем поговорим позже). В зависимости от конструкции модуль может содержать один, два или четыре ранга.


Узнать этот параметр можно из маркировки на модуле памяти. Например уKingston число рангов легко вычислить по одной из трех букв в середине маркировки: S (Single — одногоранговая), D (Dual — двухранговая), Q (Quad — четырехранговая).

Пример полной расшифровки маркировки на модулях Kingston:

Серверные материнские платы ограничены суммарным числом рангов памяти, с которыми могут работать. Например, если максимально может быть установлено восемь рангов при уже установленных четырех двухранговых модулях, то в свободные слоты память добавить не получится.

Перед покупкой модулей есть смысл уточнить, какие типы памяти поддерживает процессор сервера. Например, Xeon E5/E5 v2 поддерживают одно-, двух- и четырехранговые регистровые модули DIMM (RDIMM), LRDIMM и не буферизированные ECC DIMM (ECC UDIMM) DDR3. А процессоры Xeon E5 v3 поддерживают одно- и двухранговые регистровые модули DIMM, а также LRDIMM DDR4.


Тайминги или латентность памяти (CAS Latency, CL) — величина задержки в тактах от поступления команды до ее исполнения. Числа таймингов указывают параметры следующих операций:


  • CL (CAS Latency) – время, которое проходит между запросом процессора некоторых данных из памяти и моментом выдачи этих данных памятью;


  • tRCD (задержка от RAS до CAS) – время, которое должно пройти с момента обращения к строке матрицы (RAS) до обращения к столбцу матрицы (CAS) с нужными данными;


  • tRP (RAS Precharge) – интервал от закрытия доступа к одной строке матрицы, и до начала доступа к другой;


  • tRAS – пауза для возврата памяти в состояние ожидания следующего запроса;


  • CMD (Command Rate) – время от активации чипа памяти до обращения к ней с первой командой.

Разумеется, чем меньше тайминги – тем лучше для скорости. Но за низкую латентность придется заплатить тактовой частотой: чем ниже тайминги, тем меньше допустимая для памяти тактовая частота. Поэтому правильным выбором будет «золотая середина».

Существуют и специальные более дорогие модули с пометкой «Low Latency», которые могут работать на более высокой частоте при низких таймингах. При расширении памяти желательно подбирать модули с таймингами, аналогичными уже установленным.


Ошибки при хранении данных в оперативной памяти неизбежны. Они классифицируются как аппаратные отказы и нерегулярные ошибки (сбои). Память с контролем четности способна обнаружить ошибку, но не способна ее исправить.

Для коррекции нерегулярных ошибок применяется ECC-память, которая содержит дополнительную микросхему для обнаружения и исправления ошибок в отдельных битах.

Метод коррекции ошибок работает следующим образом:


  1. При записи 64 бит данных в ячейку памяти происходит подсчет контрольной суммы, составляющей 8 бит.


  2. Когда процессор считывает данные, то выполняется расчет контрольной суммы полученных данных и сравнение с исходным значением. Если суммы не совпадают – это ошибка.


  3. Если ошибка однобитовая, то неправильный бит исправляется автоматически. Если двухбитовая – передается соответствующее сообщение для операционной системы.

Технология Advanced ECC способна исправлять многобитовые ошибки в одной микросхеме, и с ней возможно восстановление данных даже при отказе всего модуля DRAM.

Исправление ошибок нужно отдельно включить в BIOS

Большинство серверных модулей памяти являются регистровыми (буферизованными) – они содержат регистры контроля передачи данных.

Регистры также позволяют устанавливать большие объемы памяти, но из-за них образуются дополнительные задержки в работе. Дело в том, что каждое чтение и запись буферизуются в регистре на один такт, прежде чем попадут с шины памяти в чип DRAM, поэтому регистровая память оказывается медленнее не регистровой на один такт.

Источник — nix.ru

Все регистровые модули и память с полной буферизацией также поддерживают ECC, а вот обратное не всегда справедливо. Из соображений надежности для сервера лучше использовать регистровую память.


Для правильной и быстрой работы нескольких процессоров, нужно каждому из них выделить свой банк памяти для доступа «напрямую». Об организации этих банков в конкретном сервере лучше почитать в документации, но общее правило такое: память распределяем между банками поровну и в каждый ставим модули одного типа.


Если пришлось поставить в сервер модули с меньшей частотой, чем требуется материнской плате – нужно включить в BIOS дополнительные циклы ожидания при работе процессора с памятью.

Для автоматического учета всех правил и рекомендаций по установке модулей можно использовать специальные утилиты от вендора. Например, у HP есть Online DDR4 (DDR3) Memory Configuration Tool.


Вместо пространственного заключения приведу общие рекомендации по выбору памяти:


  • Для многопроцессорных серверов HP рекомендуется использовать только регистровую память c функцией коррекции ошибок (ECC RDIMM), а для однопроцессорных — небуферизированную с ECC (UDIMM). Планки UDIMM для серверов HP лучше выбирать от этого же производителя, чтобы избежать самопроизвольных перезагрузок.


  • В случае с RDIMM лучше выбирать одно- и двухранговые модули (1rx4, 2rx4). Для оптимальной производительности используйте двухранговые модули памяти в конфигурациях 1 или 2 DIMM на канал. Создание конфигурации из 3 DIMM с установкой модулей в третий банк памяти значительно снижает производительность.


  • Из тех же соображений максимальной скорости желательно избегать использования четырехранговой памяти RDIMM, поскольку она снижает частоту до 1066 МГц в конфигурациях с одним модулем на канал, и до 800 МГц – в конфигурациях с двумя модулями на канал. Справедливо для серверов на базе Intel Xeon 5600 и Xeon E5/E5 v2.

Список короткий, но здесь все самое необходимое и наименее очевидное. Конечно же, старый как мир принцип RTFM никто не отменял.

Одноранговая или двухранговая оперативная память?

Если с двухканальной оперативной памятью все более-менее понятно (четное количество модулей работает быстрее нечетного), то термин «двухранговая память» знаком уже куда меньшему числу компьютерных энтузиастов. Более того, даже те немногие, кто знают о двухранговости, не могут однозначно ответить, хорошо это или плохо. И действительно, двухранговая память имеет как преимущества, так и недостатки. Что же из них сильнее перевешивает, давайте вместе разбираться.

Single Rank vs Dual Rank

Ранг памяти — это количество массивов из микросхем памяти разрядностью 64 бита каждый, распаянных на одном модуле памяти. Проще говоря, это два виртуальных модуля на одном физическом. Самыми распространенными являются одноранговые (Single Rank) и двухранговые планки памяти (Dual Rank), но изредка встречаются и четырехранговые (Quad Rank).

Нехотя напрашивается аналогия с физическими и виртуальными ядрами процессора — Intel Hyper-Threading и AMD SMT. Некое сходство действительно есть: одна двухранговая планка памяти быстрее одноранговой (Single Channel), но медленее двух одноранговых, работающих в двухканальном режиме (Dual Channel).

На данный момент преобладающее большинство модулей памяти DDR4 объемом 4 или 8 ГБ являются одноранговыми (распаяно четыре или восемь чипов по 1 ГБ), а объемом 16 ГБ — двухранговыми (шестнадцать чипов, то есть два массива). Впрочем, в продаже все еще можно встретить старые 8-гиговые двухранговые планки (16 чипов малой плотности 512 МБ).

А с появлением первых чипов повышенной плотностью 2 ГБ в продажу начали поступать одноранговые 16-гиговые (один массива из 8 чипов) и двухранговые 32-гиговые модули (16 чипов). Четырехранговые 32-гиговые планки (32 чипа, четыре массива) — совсем уж диковинка.

Проще говоря, если чипов на планке памяти до восьми штук включительно — она одноранговая, а если шестнадцать — двухранговая. С теорией более-менее разобрались, теперь же проведем практическое тестирование на примере парочки двухранговых 16-гиговых модулей Apacer DDR4 суммарным объемом 32 ГБ.

 

Низкая цена за большой объем, двухранговая, есть небольшой запас для ручного разгона.

 

 

Относительно высокие тайминги.

 

Apacer DDR4 — серия бюджетной оперативной памяти для современных компьютерных платформ Intel LGA1151-v2 и AMD AM4. Текстолит моделей с частотой 2133 и 2400 МГц окрашен в олдскульный зеленый цвет, а 2666-МГц моделей — в уже более современный черный. На выбор доступны модели объемом 4, 8 и 16 ГБ. Первые два варианта — одноранговые, тогда как последний — двухранговый.

Готовых заводских наборов на два или четыре модуля не предусмотрено, только отдельные планки. Поэтому если планируете заняться оверклокингом, советуем покупать в одном магазине и в одно время. Чтобы уж наверняка попались чипы из одной партии с примерно одинаковым коэффициентом утечек тока и разгонным потенциалом.

Пожалуй, самыми интересными являются планки Apacer DDR4 объемом 16 ГБ и частотой 2666 МГц. Построены они на шестнадцати чипах Hynix A-die (по данным приложения Thaiphoon Burner), то есть являются двухранговыми. Парочка таких модулей позволяет собрать ПК на процессоре AMD Ryzen с высокой пропускной способностью подсистемы памяти — двухканальная и одновременно двухранговая.

Правда, большое количество чипов повышает нагрузку на встроенный в процессор контроллер памяти. Из-за этого частота памяти, которую можно выжать из памяти ручным разгоном, будет ниже, а тайминги (задержки) наоборот выше. Даже по умолчанию Apacer DDR4-2666 16 ГБ работает на таймингах CL19 вместо типичных для этой частоты CL17.

Но все же Apacer DDR4 подкупает едва ли не лучшим на рынке соотношением цены и объема. Быстрая память требуется для сравнительно узкого круга приложений, а вот много ОЗУ — для куда более широкого. А платить почти двойную сумму за оверклокерский кит 2х16ГБ, вроде Apacer Commando DDR4 EK.32GAT.GEAK2 , согласятся, пожалуй, лишь заядлые компьютерные энтузиасты.

Оперативная память Apacer

Конфигурация тестового стенда

Результаты бенчмарков

Для сравнительного тестирования одноранговых и двухранговых модулей был нарочно выбран наиболее чувствительний к пропускной способности памяти процессор — Ryzen 3 2200G. В его случае шина памяти делится между четырьмя вычислительными ядрами Zen и встроенным графическим ускорителем Vega 8 с 512 микроядрами. Дополнительная дискретная видеокарта не использовалась.

Оверклокерских рекордов с двухранговой Apacer DDR4 установить ожидаемо не получилось — она разогналась с базовых 2666 лишь до 2933 МГц, что впрочем тоже неплохо. Из одноранговых модулей как правило можно выжать на сотню-две мегагерц больше. Впрочем, это ограничение может быть и по вине материнской платы Biostar B450GT3 с пока еще сыроватой прошивкой BIOS.

Тестирование проводилось в приложении AIDA64, а точнее встроенном в него бенчмарке памяти и кеша, а также в старенькой, но как раз хорошо подходящей для интегрированной видеокарты игре — Tomb Raider (2013) при разрешении FullHD и высоких настройках графики. В нее тоже встроен бенчмарк, раз за разом прогоняющий одну и ту же демо-сцену, что минимизирует погрешность замеров частоты кадров.

Так, скорость чтения, записи и копирования двургановой памяти Apacer DDR4 2666 МГц в бенчмарке AIDA64 оказалась примерно на 7 процентов больше, чем у одноранговой памяти с аналогичной частотой. Ручной разгон до 2933 МГц прибавил еще около 5 процентов быстродействия. На эти же 5 процентов у двухранговой памяти ниже латентность, то есть задержки, измеряемые в наносекундах.

Фреймрейт в игре Tomb Raider в случае двухранговой памяти был пусть немного, всего на 2 кадр/с, но стабильно выше одноранговой. Еще парочку кадров в секунду прибавил оверклокинг памяти. Больше бесплатных FPS можно получить, разогнав по ядру интегрированную видеокарту Vega 8. Но для этого желателен хотя бы небольшой башенный кулер, тогда как мы, ради чистоты эксперимента, проводили тестировании на боксовом.

Выводы

Как показало тестирование, двухранговые модули ОЗУ (с двумя виртуальными каналами памяти) однозначно быстрее одноранговых при равной частоте — выигрыш составляет от 5 до 7 процентов. Цифры, вроде, и небольшие, но получить прирост быстродействия памяти всегда труднее, чем любого другого компонента ПК. Если лень заморачиваться с оверклокингом, то покупка двухранговых модулей — самый простой и эффективный способ ускорить подсистему памяти ПК. А в случае процессоров с мощной интегрированной графикой (AMD Vega и Intel Gen11), двухранговая память прямо-таки обязательна к покупке.

Читайте также:

ТОП-5 бескомпромиссных игровых ноутбуков с 17-дюймовым дисплеем
Игровые ноутбуки с большим экраном и железом не слабее, чем у настольных компьютеров. Сила X470: ТОП-5 игровых материнских плат для процессоров AMD
Платы, которые лучше всего раскроют способности процессоров Ryzen. Собираемся в поход: перечень необходимого снаряжения
Список из 20 вещей для пешего туриста, как залог хорошего времяпрепровождения на природе. ТОП-5 бюджетных материнских плат на чипсетах AMD
Выбираем основу для крепкой рабочей машины или недорого игрового ПК c чипом Ryzen. Зажигай огни: ТОП-5 компьютерных корпусов с RGB подсветкой
Идеальные корпуса для идеальных игровых компьютеров.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *