Amd zen 2 дата выхода – вот почему мы ждём Ryzen 3000 / Процессоры и память

Содержание

вот почему мы ждём Ryzen 3000 / Процессоры и память

Через две недели с небольшим нас, по всей видимости, ожидает чудо. Такой вывод можно сделать, если обобщить все те предположения, которые высказывают пользователи в ожидании предстоящего анонса процессоров Ryzen третьего поколения. Но даже самые смелые высказывания о том, будто бы во второй половине года на рынке процессоров для ПК нас ждёт смена лидера (по производительности), нельзя назвать полностью беспочвенными. Ещё в начале года, на выставке CES 2019, компания AMD пообещала, что её процессоры нового поколения увеличат удельное быстродействие (при неизменной тактовой частоте) как минимум на 15 %. А теперь мы узнали, что к этому приложится заметный рост тактовых частот, кардинальное увеличение числа вычислительных ядер и снижение тепловыделения.

Каждое из этих обещаний в отдельности уже кажется как минимум очень смелым. Но чтобы всё сразу?! Тем не менее всё это возможно. На прошедшем в рамках выставки E3 2019 специальном мероприятии Next Horizon компания AMD подробно объяснила, как так вышло, что микроархитектура Zen 2, которая изначально должна была стать банальным переводом Zen на рельсы 7-нм техпроцесса, смогла оказаться настоящим прорывом, имеющим шансы перевернуть весь процессорный рынок.

С момента выхода первых процессоров с микроархитектурой Zen прошло чуть более двух лет. За это время AMD уже успела выпустить промежуточное поколение микроархитектуры, Zen+. Однако в нём мы не увидели практически никаких улучшений. Суть прошлого обновления фактически свелась к переходу с 14-нм на 12-нм производственную технологию, да и только. Новая микроархитектура Zen 2, встреча с которой нас ожидает в июле, вновь предполагает смену техпроцесса — с 12 нм на 7 нм — с одновременной сменой производственного подрядчика: теперь CPU компании будет изготавливать не GlobalFoundries, а TSMC. Но это далеко не всё: вместе с техпроцессом кардинально меняется и масса других вещей.

Чтобы понять, насколько Ryzen 3000 будут непохожими на своих предшественников, достаточно посмотреть на любую фотографию этих процессоров со снятой теплорассеивающей крышкой. Одного взгляда будет достаточно, чтобы понять: процессоры AMD уходят от использования монолитного полупроводникового кристалла. Ядра в них распределены по нескольким полупроводниковым кристаллам – чиплетам, также в отдельный чиплет будут вынесены и все контроллеры ввода-вывода. К этому стоит добавить, что одновременно с внедрением коренных изменений в конструктив процессоров AMD переработала внутреннее устройство вычислительных ядер и позаботилась о том, чтобы устранить основные узкие места прошлых CPU с микроархитектурами Zen и Zen+.

Кроме того, с приходом Ryzen 3000 изменения затронут и всю экосистему, в которой будут работать такие процессоры. Совместимость новинок с традиционным разъёмом Socket AM4 при этом сохранится, но полностью все их преимущества можно будет почувствовать лишь в новых материнских платах, которые смогут обеспечить поддержку интерфейса PCI Express 4.0.

Все многочисленные улучшения и оптимизации, сделанные в процессорах поколения Zen 2, заслуживают явно большего, чем простого перечисления. Поэтому по итогам мероприятия AMD Next Horizon, на котором смог побывать представитель нашего сайта, мы решили подготовить отдельный обстоятельный материал и подробно проанализировать, почему Zen 2 – это действительно круто.

⇡#Технология 7 нм – ключ ко всему

Цели, которые ставила перед собой компания AMD во время работы над новой микроархитектурой Zen 2, были вполне очевидными. Основная задача состояла в улучшении производительности процессоров как для десктопов, так и в серверном сегменте, при обязательном сохранении преемственности и совместимости с имеющимися платформами. Иными словами, речь шла о дальнейшей масштабируемости имеющихся процессорных семейств Ryzen и EPYC и комплексном улучшении их потребительских качеств.

Прочный фундамент под дизайн Zen 2 должен был подвести новый технологический процесс. При переходе от 14- к 12-нм нормам, который произошел в апреле прошлого года, процессоры Ryzen лишь немного выиграли в тактовых частотах и смогли довольно незначительно нарастить свою удельную производительность. Но свежий техпроцесс с разрешением 7-нм должен был катализировать куда более существенный прогресс в улучшении всего набора потребительских характеристик. В силу того, что давний производственный партнёр AMD, компания GlobalFoundries, отказался от освоения 7-нм технологии, чипмейкеру пришлось переориентироваться на сотрудничество с TSMC. И в конечном итоге AMD явно не прогадала. В пользу этого говорят числа: базовый процессорный строительный блок — четырёхъядерный комплекс CCX (Core Complex) с L3-кешем объёмом 8 Мбайт — при производстве по 12-нм техпроцессу GlobalFoundries имел площадь 60 мм2. Подобный комплекс Zen 2 с четырьмя усовершенствованными ядрами и вдвое более вместительным, 16-мегабайтным L3-кешем, произведённый на TSMC по 7-нм техпроцессу, занимает почти вдвое меньшую площадь – 31,3 мм2.

Полный процессорный кристалл (чиплет) в Zen 2, как и раньше, формируется из двух CCX. То есть он содержит восемь ядер и кеш-память третьего уровня объёмом 32 Мбайт. При этом суммарная площадь такого кристалла составляет всего 74 мм2, что существенно меньше 213 мм2, которые занимает кристалл процессора с дизайном Zen/Zen+, например, того же Ryzen 7 2700X. Столь заметный выигрыш в плотности размещения транзисторов открыл перед разработчиками AMD широкие возможности по усовершенствованию микроархитектуры, которое могло бы быть проведено без какого-либо существенного ущерба для себестоимости новых процессоров.

Ещё в начале этого года компания AMD объявила о том, что микроархитектура Zen 2 обеспечит 15-процентное преимущество в производительности по сравнению с Zen+ за счёт одних только микроархитектурных улучшений, то есть на одинаковой тактовой частоте. Однако массу преимуществ дал и новый прогрессивный полупроводниковый процесс. Например, при одинаковом энергопотреблении для Zen 2 обещана как минимум в 1,25 раза более высокая производительность, чем у предшественников, а при одинаковом быстродействии новые процессоры должны быть чуть ли не вдвое экономичнее. Более того, AMD не стесняется даже говорить о том, что в отдельных ситуациях преимущество новых процессоров Zen 2 будет составлять более 75 % по сравнению с прошлыми Zen+ того же класса и более 45 % по сравнению с равноценными решениями конкурента.

Безусловно, все эти выкладки ещё должны будут пройти проверку на прочность независимыми тестами и обзорами, которые выйдут 7 июля. В рамках же своего мероприятия AMD активно оперировала показателями Cinebench R20, которые говорят о том, что если сравнивать Zen 2 и процессоры Intel с аналогичным количеством ядер, то предложения AMD выигрывают как по однопоточной, так и по многопоточной производительности, а также по энергопотреблению и по цене.

Один лишь пример: согласно данным AMD, старший восьмиядерный Ryzen 7 3800X с ценой $400 очень близок к 500-долларовому восьмиядерному Core i9-9900K в однопоточном и многопоточном рендеринге, но при этом его энергопотребление сравнимо с потреблением Core i7-9700K.

⇡#Ядра Zen 2: «тик» и «так» одновременно

Согласно первоначальному плану, микроархитектура Zen 2 должна была представлять собой простой перенос старого дизайна Zen на новый техпроцесс. Однако позднее, анализируя слабые места своих первых поколений процессоров Zen и Zen+, инженеры AMD приняли решение по возможности подрихтовать и базовую микроархитектуру. И надо сказать, этот план, судя по всему, отлично сработал. Несмотря на то, что в Zen 2 нет никаких кардинальных переделок, рост IPC (среднего числа выполняемых за такт инструкций) на 15 % — прекрасная иллюстрация того, что всё было сделано правильно.

В то же время нужно понимать, что Zen 2 — микроархитектура, очень похожая на оригинальную Zen/Zen+. Все базовые элементы процессорного ядра остались неизменными, а переделки касаются лишь повышения эффективности имеющихся функциональных блоков. Соответственно, внутренняя конфигурация ядра не изменилась: оно способно декодировать до четырёх инструкций и исполнять до шести инструкций за такт. Кроме того, осталась неизменной и поддержка технологии SMT: каждое ядро Zen 2 может исполнять по два потока одновременно.

Что же поменялось? Как обычно и бывает при работе над совершенствованием имеющихся микроархитектур, первым местом приложения сил инженеров стал блок выборки инструкций и предсказания переходов. Впрочем, здесь изменения не очень явные, поскольку в основе этого блока продолжает лежать «нейронный» алгоритм, основанный на использовании перцептрона. Хотя в целом такая схема даёт не очень впечатляющие результаты, при работе с буфером целей ветвления первого уровня она обеспечивает хорошую энергоэффективность, поэтому AMD не стала от неё отказываться и просто добавила к ней дополнительный многоступенчатый статистический механизм TAGE (Tagged geometric), работающий с буфером целей ветвления второго уровня.

Одновременно были увеличены и размеры буферов целей ветвления. Таблица первого уровня в Zen 2 включает 512 записей вместо 256, а второго уровня – 7К записей вместо 4К. Что касается нулевого уровня, то соответствующий буфер, как и раньше, включает 16 записей, но зато массив адресов косвенных переходов расширился до 1K записей. Иными словами, в новой микроархитектуре переходы прогнозируются явно лучше, чем в первоначальных Zen/Zen+. А это значит, что ситуации, когда процессор должен полностью сбрасывать исполнительный конвейер из-за неправильно предсказанного перехода, будут случаться гораздо реже.

Другим усовершенствованием Zen 2 стало то, что AMD решила существенно перераспределить ресурсы, занятые кешированием инструкций. Кеш микроопераций, в котором хранятся уже декодированные x86-инструкции, был увеличен вдвое – до 4096 записей. При этом классический кеш инструкций первого уровня, в котором сохраняются команды до их декодирования, напротив, сократился. В то время как раньше его объём составлял 64 Кбайт при 4-канальной ассоциативности, в Zen 2 он был урезан до 32 Кбайт с одновременным увеличением степени ассоциативности до 8.

Моделирование, проведённое AMD, показало, что такие изменения положительно сказываются на производительности. И если судить по произошедшему росту IPC, это действительно так. Любопытно, что в результате изменений в размерах кеш-памяти, Zen 2 стали процессорами с самым вместительным кешем микроопераций. Например, в микроархитектуре Skylake этот кеш рассчитан на 1,5К операций, в то время как в Sunny Cove инженеры Intel расширили его всего до 2,25К операций.

Изменения во входной части исполнительного конвейера не повлекли за собой никаких существенных перемен в организации работы планировщиков. Как и раньше, декодер Zen 2 способен поставлять по четыре инструкции за такт и вместе с кешем микроопераций, из которого может поступать до восьми связанных инструкций, они заполняют очередь микроопераций, из которой инструкции выбирают два планировщика: один для целочисленных операций, другой — для операций с числами с плавающей точкой. При этом целочисленный планировщик может отправлять на исполнение по шесть микроопераций за такт, а вещественночисленный – по четыре.

Зато заметные изменения в микроархитектуре произошли на стадии исполнения инструкций. Если говорить об исполнении целочисленных инструкций, то тут — впридачу к увеличению размера буферов (как самого планировщика, так регистрового файла и буфера переупорядочивания) примерно на 10-15 % — появился дополнительный блок генерации адресов (AGU). В сумме это означает, что число исполнительных портов в Zen 2 выросло с шести до семи: четыре порта для арифметико-логических операций (ALU) и три порта – для операций генерации адресов (AGU). В результате микроархитектура Zen 2 может инициировать по две 256-битных операции чтения и по одной 256-битной операции записи каждый такт. Прошлая версия микроархитектуры была по понятным причинам ограничена только двумя подобными операциями за такт, причём лишь шириной 128 бит.

Но что ещё важнее, в Zen 2 компания AMD удвоила пропускную способность блока операций с плавающей точкой. Теперь он стал полностью 256-битным, что означает возможность прямого исполнения им AVX2-инструкций. В первоначальной архитектуре Zen/Zen+ такие команды, работающие с 256-битными регистрами, перед выполнением разбивались на пару 128-битных инструкций и обрабатывались в два приёма, следовательно, от Zen 2 можно ожидать двукратного увеличения темпа работы с AVX2-кодом. Состав же исполнительных устройств в FPU при этом остался старым. Предусмотрено два устройства для операций сложения и два – для операций умножения, что даёт Zen 2 возможность одновременно выполнять по две 256-битные FMA-команды. Здесь же очень пригождается способность новой микроархитектуры инициировать 256-битные операции пересылки данных: в результате исполнение AVX2-кода может происходить без каких-либо задержек. К тому же в Zen 2 AMD смогла добиться того, что обработка AVX2-инструкций может проводиться без какого-либо снижения тактовой частоты, как это происходит в процессорах Intel.

Попутно AMD сообщила и о том, что ей удалось увеличить скорость умножений чисел с плавающей точкой с четырёх до трёх тактов. В конечном итоге это также вносит свой вклад в увеличение удельной производительности процессоров с новой микроархитектурой.

Как следует из сказанного, микроархитектура Zen 2 стала немного «шире» Zen в смысле способностей параллельного исполнения инструкций. Но в то же время она стала «шире» и в смысле работы с данными. Хотя подсистема кеш-памяти, работающей с данными, структурно не изменилась, она получила шины с большей пропускной способностью, которые позволяют получать необходимые данные, не задерживая выполнение AVX2-команд. Если конкретнее, то это означает, что L1-кеш данных сохранил размер 32 Кбайт на ядро с 8-канальной ассоциативностью, а L2-кеш, как и раньше, имеет объём 512 Кбайт на ядро с 8-канальной ассоциативностью, но теперь кеш-память может обслуживать по две 256-битных операции чтения и по одной 256-битной операции записи за такт на уровне L1, а также по одной 256-битной операции чтения и записи за такт на уровне L2. Латентность кеш-памяти не изменилась и составляет 4 такта для L1 и 12 тактов для L2.

Несмотря на неизменность структуры кеш-памяти, в Zen 2 была улучшена работа L2 TLB (буфера трансляции адресов). В первом поколении процессоров Zen размер этой таблицы составлял 1,5К, теперь же она увеличилась до 2К, причём её латентность при этом даже стала ниже. Но самое главное, теперь L2 TLB поддерживает страницы объёмом 1 Гбайт, чего в прошлых версиях микроархитектуры реализовано не было.

Ещё одним заметным изменением в Zen 2 стало удвоение объёма кеш-памяти третьего уровня. В новых процессорах её объём составляет не 8, как раньше, а 16 Мбайт на каждый четырёхъядерный CCX. Так AMD попыталась компенсировать расчленение процессора на несколько независимых кристаллов. Разработчики Zen 2 полагают, что рост объёма L3-кеша позволит снизить количество пересылок данных между чипсетами с ядрами и чиплетом с контроллером памяти. Может, это и так, но не стоит забывать о том, что увеличение объёма кеш-памяти практически всегда сопряжено с ростом латентности. И она у L3-кеша в Zen 2 действительно выросла до 40 тактов, в то время как в процессорах Zen L3-кеш имел латентность примерно на 5 тактов ниже.

⇡#От ядра – к CCX и CCD, и далее – к CPU

Выше уже говорилось о том, что конструкция процессоров Ryzen 3000 заметно отличается от того, как были устроены все прошлые Ryzen. Тем не менее CCX-комплексы собираются из ядер Zen 2 ровно так же, как и раньше. В один блок CCX объединяется 4 ядра и 16 Мбайт общей кеш-памяти третьего уровня.

Пара CCX располагается на одном 7-нм полупроводниковом кристалле и формирует процессорный чиплет, получивший аббревиатуру CCD (Core Complex Die). Помимо ядер и кеша, в CCD-чиплет входит также контроллер шины Infinity Fabric, посредством которого должно обеспечиваться соединение CCD с обязательным для любого Ryzen 3000 чиплетом ввода-вывода.

В чиплете ввода-вывода (I/O) процессоров поколения Zen 2 располагаются так называемые внеядерные компоненты, а также элементы северного моста и SoC. В нём, помимо всего прочего, находятся контроллер памяти и контроллер шины PCI Express 4.0. Также в I/O-чиплете реализованы и две шины Infinity Fabric, необходимые для соединения с CCD-чиплетами.

В зависимости от того, о каком процессоре семейства Ryzen 3000 идёт речь, он может состоять либо из двух, либо из трёх чиплетов. В процессорах с числом ядер восемь и менее применяется один CCD-чиплет и один I/O-чиплет. В процессорах с числом ядер более восьми CCD-чиплетов становится уже два. Однако нужно понимать, что процессор при этом всё равно остаётся единым целым. За счёт того, что в любых Ryzen 3000 контроллер памяти находится в I/O-чиплете и он всего один, любое из ядер может гладко обращаться к любым её областям: никаких NUMA-конфигураций, которые портили жизнь владельцам процессоров Threadripper, в случае Zen 2 не будет.

Стоит напомнить, что Zen 2 – далеко не первая попытка перейти на многокристальную компоновку процессоров. Раньше производители уже прибегали к такому подходу. Например, опирались на два полупроводниковых кристалла четырёхъядерные Core 2 Quad, а ещё раньше такой же приём был использован при создании двухъядерных Pentium D. Но впоследствии производители всё же перешли на монолитную конструкцию процессоров, так как она оказалась более эффективной при росте числа ядер и переносе в процессор компонентов северного моста. Однако новые Ryzen 3000, в состав которых входит два или три чиплета, – отнюдь не шаг назад. Напротив, это переход на следующий уровень, поскольку AMD в новом поколении процессоров идёт не простым экстенсивным методом, наращивая количество вычислительных ядер за счёт добавления дополнительных кристаллов, а применяет куда более интеллектуальный подход, вводя в обиход чиплеты с различной функциональностью и объединяя их в единое целое специализированной высокоскоростной шиной Infinity Fabric.

Выигрыш, который даёт использование многокристальной компоновки, вполне очевиден. В первую очередь она позволяет снизить себестоимость. Производство чиплетов, имеющих сравнительно небольшую площадь кристалла, заметно проще, чем изготовление крупного монолитного процессора. Меньшие кристаллы не только позволяют получить более высокий выход годных чипов, но и эффективнее размещаются на круглой полупроводниковой подложке, что дополнительно снижает количество отходов. В конце концов, именно чиплетная компоновка позволила AMD создать весьма сложные процессоры Ryzen 3000 сравнительно недорогими, даже несмотря на то, что их выпуск организован на мощностях TSMC по самому передовому и новому для индустрии техпроцессу с нормами 7 нм.

Распределение функций процессора по различным чиплетам позволило AMD сэкономить и ещё в одном аспекте. Новый техпроцесс оказалось совсем необязательно применять при производстве всех частей процессоров. «Тонкие» передовые нормы важны для процессорных ядер, поскольку они прямо влияют на частотный потенциал и энергопотребление, но нет никакой нужды использовать их для изготовления более простого чиплета, отвечающего за функции ввода-вывода. Именно поэтому I/O-чиплет в Ryzen 3000 производится по-старинке – на фабриках GlobalFoundries по 12-нм техпроцессу, который использовался при изготовлении процессоров Ryzen второго поколения.

Впрочем, нужно иметь в виду, что чиплетная конструкция порождает и определённые трудности. Например, в современных процессорах очень высокие требования предъявляются к тому, как соединяются и взаимодействуют друг с другом различные части CPU. Реализовать такую шину при многочиповой компоновке оказывается несколько сложнее. Впрочем, эта задача была успешно решена инженерами AMD. Процессоры Ryzen первого и второго поколений, хотя они и были основаны на монолитном ядре, использовали для соединения CCX и контроллера памяти, северного моста и элементов SoC специализированную шину Infinity Fabric. В новых процессорах Ryzen 3000 применяется вторая версия этой шины: именно она отвечает за передачу данных между всеми чиплетами.

Откровенно говоря, к тому, как работает Infinity Fabric, ранее высказывались вполне обоснованные претензии: она не всегда могла обеспечить должный уровень быстродействия при взаимодействии процессорных ядер с L3-кешем и с контроллером памяти. В процессорах Ryzen 3000 компания AMD постаралась исправить основные недостатки Infinity Fabric.

Во-первых, эта шина была расширена вдвое: теперь её ширина составляет 512 бит, что означает двукратное увеличение пропускной способности и возможность пересылки по 32 байта за такт в каждом направлении. Разработчики уверяют, что на этот шаг они пошли в первую очередь из-за появления в Ryzen 3000 поддержки PCI Express 4.0, но очевидно, что более производительная шина, которая связывает все ключевые компоненты процессора, сыграет положительную роль и во многих других случаях.

Во-вторых, Infinity Fabric теперь «развязана» с контроллером памяти по частоте. Раньше частота работы этой шины была синхронизирована с частотой памяти, что, с одной стороны, приводило к сильной зависимости производительности процессоров Ryzen от скорости установленных в системе модулей DDR4 SDRAM, а с другой – препятствовало разгону памяти выше 3466-3600 МГц. Теперь же шина Infinity Fabric сможет работать с контроллером памяти не только синхронно, но и на вдвое меньшей относительно него частоте – с применением делителя 2:1. Это — по крайней мере теоретически — означает гораздо большую свободу в выборе скорости памяти, хотя AMD продолжает настаивать на том, что синхронный режим для Infinity Fabric всё равно будет обеспечивать лучшую производительность, и оптимальнее с Ryzen 3000 использовать модули памяти DDR4-3600 с низкими таймингами.

Тем не менее уже сейчас известно о том, что память в Socket AM4-системах, оснащённых процессорами Ryzen 3000, действительно можно будет сильно разгонять.

Например, AMD показала работу модулей памяти в режиме DDR4-5100 в системе, построенной на Socket AM4-материнской плате MSI MEG X570 Godlike.

Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.

3dnews.ru

Zen2. Эволюция платформы AM4 на примере Ryzen 7 3700x / Habr

AMD продолжает развивать свою долгоиграющую платформу AM4. Недавно вышло новое поколение процессоров Ryzen на микроархитектуре Zen 2. Вообще, цикл развития архитектур AMD стал чем-то напоминать тик-так Intel, но не 1 в 1. Так, второе поколение Ryzen было скорее вариацией на тему изначальной архитектуры Zen с исправлением основных косяков и реализованное на чуть более тонком техпроцессе, что нашло отражение даже в названии архитектуры чипов 2xxx — Zen+. Сейчас же AMD выкатили чиплетную архитектуру. Получилась прямо классическая спираль развития — AMD в 2003 году первыми начали перенос компонент северного моста в ядра, начав с переноса в процессорах линейки K8 контроллера памяти в CPU и закончив тем, что Ryzen тысячной и двухтысячной серий представляли из себя полноценные SoC, так в 2019 они же снова вынесли северник в отдельный кристалл, пусть и на той же подложке, что и ядра.

Теоретических материалов, обзоров и тестов хватает и на русском (например Разгон Matisse или в поисках предела. Обзор архитектуры Zen 2), и на английском языках, мне же захотелось лично сравнить свежий AMD Ryzen 7 3700x с 2700x на моих тестах, аналогичным использованных в прошлых постах (пост 1, пост 2).

UPD 2019/08/04: Внимание! Все результаты и выводы относятся к версии BIOS на AGESA ComboAM4 1.0.0.2. Дополнение по тестам на AGESA 1.0.0.3 (BIOS 5204) смотрите в конце статьи.

Участники тестирования

Материнская плата ASUS ROG Strix X470F-Gaming (BIOS 5007, AGESA ComboAM4 1.0.0.2):

Память G.Skill Trident Z DDR4 DIMM 3600MHz PC4-28800 CL17:

Система охлаждения Deepcool Captain 360EX.

Конфиг 1:
CPU: AMD Ryzen 7 2700X
RAM: G.Skill Trident Z DDR4 DIMM 3600MHz PC4-28800 CL17 @ 3400CL16

Конфиг 2:

CPU: AMD Ryzen 7 3700X
RAM: G.Skill Trident Z DDR4 DIMM 3600MHz PC4-28800 CL17 (DOCP Profile)

Конфиг 3:

CPU: AMD Ryzen 7 3700X
RAM: G.Skill Trident Z DDR4 DIMM 3600MHz PC4-28800 CL17 @ 16-16-16-32

Прежде чем перейти к результатам тестов, хочу отметить пару проблем, затруднивших тестирование:

  1. Все тесты Ryzen 7 3700x проводились под сборкой 1903 Windows 10. При этом 2700х тестировался на октябрьской сборке. Не все тесты 2700x удалось прогнать под 1903, но те, что были прогнаны, показали, что майское обновление Windows снизило производительность системы по крайней мере на платформе AMD, так что результаты с предыдущими статьями напрямую не сравнимы. Там, где тесты прогонялись повторно, это будет явно указано.

  2. Платформа Zen 2, точнее её поддержка со стороны BIOS материнских плат на чипсетах старого поколения (например, на чипсете X470 на моей материнской плате), откровенно сырая, и при попытке запустить процессор Ryzen 7 3700x на всех настройках, установленных в Auto, были получены очень странные результаты, а именно отвратительная работа нового CPU с памятью, с низкой пропускной способностью (далее ПСП) и огромными задержками:

В настройках BIOS отображалось, что частота северного моста составляет 1600 MHz, но по факту он запускался на 800 (по данным CPU-Z), что и давало соответствующую картину. Мало того, что активировался асинхронный режим работы с памятью, вносящий дополнительные задержки, так и сам контроллер, и Infinity Fabric работали с черепашьей скоростью. При этом попытки установить частоту работы северника синхронной с частотой памяти приводили через раз к мёртвому зависанию при POST на этапе инициализации памяти.

Алгоритм получения рабочих настроек в итоге получился следующий:

  • сброс настроек CMOS джампером
  • загрузка оптимизированных настроек по умолчанию, сохранение настроек
  • отключение питания (именно обесточивание БП, а не просто soft off)
  • установка частоты работы памяти (активация DOCP профиля), сохранение настроек
  • отключение питания (именно обесточивание БП, а не просто soft off)
  • установка частоты работы северного моста, равной частоте работы памяти, сохранение настроек
  • отключение питания (именно обесточивание БП, а не просто soft off)

если пропустить обесточивание системы на любом из этапов, есть шанс словить ошибку тренировки памяти и как следствие, необходимость сбрасывать настройки джампером и начинать всё сначала из-за невозможности загрузиться в BIOS. Надо ли говорить, что на 2700x таких танцев с бубном совершенно не требовалось.

По конфигам видно, что тестирование проходило при разных частотах памяти. AMD утверждают, что контроллер памяти в чиплете процессоров на микроархитектуре Zen 2 стал более всеядным и поддерживает бОльшие частоты, чем прежние версии. Судя по моим наблюдениям, это действительно так: на Ryzen 7 2700x эти плашки памяти не удавалось стабилизировать даже на их дефолтных XMP таймингах на частоте 3600, при этом на частоте 3400 тайминги удавалось выставить довольно жёсткие. На Ryzen 7 3700x память сходу завелась на родной частоте и позволила без особых плясок с бубном выставить тайминги по DRAM-Calculator-for-Ryzen.

Методика тестирования

Методика не менялась с прошлого года.

Тесты платформы AM4 проводились под управлением ОС Windows 10 Pro 1903 (сборка 18362.239)

Защита от Spectre и Meltdown деактивирована на всех тестовых системах с помощью утилиты InSpectre.

Все тесты проводились по несколько раз (не менее трёх-четырёх), результат первого прогона отбрасывался, так как на результат первого прогона заметно сильнее влияют задержки ввода-вывода. Брался максимальный результат, остальные прогоны теста проводились для проверки возможных аномалий.

Производительность

Passmark

Passmark 9.0

Ryzen 7 2700x

Ryzen 7 3700x D.O.C.P.

Ryzen 7 3700x manual timings

Тест памяти

AIDA 64 memory & cache benchmark

По производительности памяти прогресс прямо скажем, так себе. Вынос контроллера памяти из кристалла с ядрами не дался бесплатно — выросли задержки, общая производительность упала. Кроме того, видно проседание скорости записи в два раза по сравнению с прошлым поколением и скоростью чтения/копирования. Судя по всему, чиплет cIOD оптимизирован под два CCX чиплета, и на одном выдаёт вот такие слегка кривые результаты (да, на Ryzen 9 проседания скорости записи тоже нет). Но это с одной стороны. С другой — по скоростям чтения и комбинированных нагрузок чтение-запись такого провала нет. Учитывая, что в среднем чтение-запись в коде соотносятся как 3/1, то компромисс выглядит разумным. А учитывая возросшие скорости кэш-памяти и здоровенный кэш третьего уровня, то по памяти ± выходит то на то.

Рендеринг

Cinebench R15

Cinebench R20

Проявка RAW-снимков

А вот в работе с 2D графикой, в которой до сих пор безраздельно рулили процессоры Intel, трёхтысячная серия сделал нехилый такой рывок. Ускорение в Adobe Lightroom 7.5 полтора раза!

3DMark

Производительность в играх

Скриншоты настроек
Скриншоты результатов встроенных бенчмарков

Температура и энергопотребление

Не смотря на заявленный TDP в 65Вт камешек Rayzen 7 3700x получился довольно прожорливым и горячим. Температура в простое колеблется от 35 до 50 градусов. Потребление и температура под нагрузкой сильно зависит от характера нагрузки (внезапно!).

Под типичной игровой нагрузкой частота ядер CPU колеблется в районе 4.25-4.35 GHz, потребление в таком режиме составляет в среднем 95-100Вт.

Под нагрузкой от рендеринга процессор начинает потреблять уже в районе 120Вт:

Под стресс-тестами (Prime95 Small FFTs) потребление подскакивает до 170+ Вт, температура упирается в 95 градусов даже под водянкой с вентиляторами на максимальных оборотах и частоты падают до 4-4.05GHz:

Заключение

Процессоры трёхтысячной серии AMD Ryzen вышли и правда довольно интересными, но общий восторженный информационный фон вокруг них лично у меня породил завышенные ожидания, которые не особо оправдались.

С одной стороны, производительность на такт действительно подросла, но заметно без микроскопа только в некоторых сценариях. Частотный потенциал вообще подрос в среднем на 50-100MHz, ни о каком прорыве речь не идёт. С памятью стали работать даже хуже, чем прошлое поколение. При заявленном TDP в 65Вт процессор не стесняется потреблять почти в три раза больше, при этом греется так, что трёхсекционная водянка перестаёт справляться с охлаждением. BIOS-ы с поддержкой этих процессоров пока что откровенно сырые. Всё это приправлено ошибками в микрокоде (RDRAND на материнских платах на x570 чипсете). Косячат конечно все, но настолько сырого продукта на старте я давно не видел.

С другой — это уже третье поколение процессоров на одной и той же платформе AM4. Если сравнивать 3700x с первым поколением Ryzen, то по рендерингу получим ускорение уже в 1.5 раза за 2.5 года. В этом поколении AMD опять удалось увеличить количество ядер в процессорах потребительского сегмента — 12 ядер уже условно доступны, хотя и являются тем ещё дефицитом, да и ценник на них гуманностью не отличается, а на горизонте маячат 16-ядерные CPU на этой же платформе. Да и платформа получилась удачной — за 2.5 года не превратилась в тыкву, материнские платы менять не надо, совместимость с памятью и частотный потенциал в очередной раз подтянули, и даже на тех же самых материнских платах новые процессоры скорее всего позволят запускать память на бОльших частотах и более жёстких таймингах.

В общем, продукт в очередной раз вышел неоднозначным. Ни разу не идеальным, но уже предлагает хорошую производительность даже без оговорки «за свои деньги», а соотношение цена/производительность у него вообще вышло отличное. BIOS-ы подтянутся спустя пару-тройку месяцев и версий. В общем, всё как всегда у AMD.

UPD от 2019/08/04. Тесты на AGESA ComboAM4 1.0.0.3 patch AB

Судя по всему, как я писал выше, первые BIOS-ы оказались несколько дико кривыми. После выхода обновленного BIOS на AGESA ComboAM4 1.0.0.3 patch AB многое изменилось:

  • лимиты по питанию были приведены в соответствии со спецификациями AMD. PPT лимит срезали со 114Вт до 88Вт;
  • лимиты по питанию заработали. На старом BIOS-е, не смотря на установленный лимит в 114Вт, процессор без зазрения совести потреблял почти 180. Теперь этот номер не проходит, и лимит энергопотребления, установленный в BIOS, не превышается;
  • заработал нормально сон, а то было ощущение работы на китайских материнках со сломанным S3 powe state. Комп засыпал и потом намертво вис при попытке проснуться. Теперь всё работает.

Очевидно, что не повлиять на результаты тестов всё это не могло. В полном объёме прогнать я их ещё не успел, но основные прогнаны, и вот что получилось:

скриншоты тестов

Итог — падение результатов на 2-4% при практически двукратном снижении пикового энергопотребления и соответствующем снижении рабочих температур и напряжений. Вот теперь да, можно безо всяких оговорок сказать, что у AMD получился очень удачный — быстрый, энергоэффективный и недорогой процессор. Думаю, если поднять PPT до уровня 3800х (105Вт), можно будет и результаты получить практически аналогичные.

habr.com

восьмиъядерный Zen 2 с PCIe 4.0 для настольных ПК / ua-hosting.company corporate blog / Habr

AMD Ryzen Matisse третьего поколения выйдет в середине 2019 года: восьмиъядерный Zen 2 с PCIe 4.0 для настольных ПК

Моргните, и вы уже рискуете пропустить это событие: основной доклад AMD в этом году стал вихрем анонсов прайм-тайма для компании. Идея ясна: AMD пообещала использовать 7 нм техпроцесс в новых продуктах, начиная с 2019 года. Первыми представителями 7 нм станут процессоры Ryzen 3-го поколения для настольных ПК с ядрами Zen 2, и более чем достаточной производительностью, чтобы конкурировать с лучшим оборудованием Intel. Кроме того, в планах компании вернуть свои позиции в сегменте высокопроизводительных видеокарт, поскольку AMD собирается выпустить 7-нм графическую карту, которая сможет конкурировать в ценовом диапазоне около 700 долларов.

AMD на CES 2019

Во время показ в этом году доклад AMD выглядел несколько странно. Обычно компания делает один крупный пресс-релиз за один доклад, раскрывая все детали нового продукта. В этом году AMD начала с новостей о мобильных процессорах серии Ryzen-3000 и Chromebook AMD, как только открылся показ, и мы были в замешательстве, восприняв это как основной анонс. Было бы странно, в конце концов, для компании «предварительно анонсировать будущие анонсы». К счастью, у AMD действительно есть о чем рассказать.

Прежде всего, процессоры. AMD представила 7-нм настольный процессор следующего поколения — Ryzen 3rd Generation.

Атака на основной рынок процессоров: ноздря в ноздрю с Core i9-9900K

Забудьте все, что вы, возможно, слышали о будущем процессоре AMD для настольных ПК. Вот большинство подробностей, которые вам нужно знать.

Новые процессоры под кодовым названием Matisse появятся на рынке в середине 2019 года (где-то во 2 или 3 квартале). Процессор, который компания демонстрировала, состоит из двух кремниевых матриц в одном корпусе: один 8-ядерный 7-нм чипсет, изготовленный кампанией TSMC, и 14-нм чип ввода/вывода с двумя контроллерами памяти и линиями PCIe, изготовленный в GlobalFoundries.

Компания заявила, что это первый в мире 7-нм игровой процессор, а также первый в мире основной процессор с поддержкой PCIe 4.0 x16. В настоящее время компания не комментирует, будет ли 3-е поколение иметь максимум восемь ядер, и является ли представленный процессор лучшей моделью в линейке.

Поскольку процессор еще далек от запуска, частоты не были озвучены. Тем не менее процессор предназначен для сокета AM4, учитывая, что AMD ранее заявляла, что намерена сохранить обратную совместимость в течение нескольких поколений. Следовательно, этот процессор будет работать на материнских платах AMD серий 300 и 400.

Что же касается PCIe 4.0, на самом деле все довольно очевидно. Мы ожидаем, что появится новая линейка материнских плат, предположительно что-то вроде X570, будет совместима с PCIe 4.0 (с возможностью поддержки любых новых видеокарт PCIe 4.0, которые появятся на рынке). Одно из отличий PCIe 4.0 заключается в том, что он может работать только с дорожками печатных плат длиной до 7 дюймов, а затем потребуется переадресация и ретаймер, значит, эти дополнительные микросхемы необходимы для портов на плате. Но первый слот PCIe на большинстве материнских плат находится в пределах 7 дюймов, поэтому может оказаться, что многие современные материнские платы серий 300 и 400 (при условии, что дорожки соответствуют спецификациям целостности сигнала) могут иметь свой первый слот PCIe с рейтингом PCIe 4.0 после обновления прошивки.

Поговорим о размере

Как мы видим на приведенном выше снимке, 8-ядерный чипсет меньше, чем IO-кристалл, аналогично дизайну чипсета 8 + 1 на EPYC. Учитывая, что размер IO-кристалл — не ровно четверть от EPYC IO-кристалла, как я предсказывал, это может быть намеком на анонс серверного процессора в Риме. Размер нового IO-кристалла «находится» где-то между четвертью и половиной EPYC.

Выполняя некоторые измерения на нашей фотографии процессора, и зная, что процессор AM4 имеет площадь 40 мм, мы измерили чиплет как 10,53 x 7,67 мм = 80,80 кв. мм, тогда как размер кристалла ввода-вывода 13,16 x 9,32 мм = 122,63 кв.мм.

+ 15% к производительности при переходе к новому поколению, как минимум

Во время основного анонса AMD продемонстрировала показатели производительности нового процессора Ryzen 3-го поколения (Matisse). Рассматривались результаты теста Cinebench R15.

Наши внутренние тесты показывают, что Ryzen 7 2700X второго поколения набирает 1754 балла.

Новый процессор Ryzen 3-го поколения набрал 2023 балла.

Это означает, что при нынешних, еще не окончательно подтвержденных частотах, новые процессоры дают увеличение производительности на 15,3% в сравнении с прошлым поколением. Тест Cinebench — идеальная ситуация для AMD, но, результат изменится с изменением частот. В целом же производительность будет зависеть от рабочей нагрузки, а это уже интересный момент для дальнейшего исследования.

Такая же производительность, как у Core i9-9900K, минимум

На тестировании Anandtech 9900K набрал 2032 балла.

По данным AMD, их 8-ядерный процессор набрал 2023, а Intel Core i9-9900K — 2042.

Обе системы работали с сильным воздушным охлаждением, и нам сказали, что Core i9-9900K работал на стандартных частотах на материнской плате ASUS. Чип AMD, напротив, не работал на последних частотах. AMD говорит, что обе тестовые системы имеют идентичные блоки питания, DRAM, SSD, операционные системы, патчи и обе с видеокартой Vega 64.

Чуть больше половины мощности… ?!

Кроме того, по результатам того же теста была определена потребляемая мощность системы. Это включает в себя материнскую плату, DRAM, SSD и так далее. Поскольку системы были предположительно идентичны, результаты касаются именно сравнения потребления ЦП. Система Intel во время тестирования Cinebench работала на 180 Вт. Этот результат соответствует тому, что мы видели в наших системах, и выглядит верным. Система AMD, с другой стороны, работала на 130-132 Вт.

Если мы вспомним среднюю потребляемую мощность системы в режиме бездействия их наших собственных обзоров, которая составляет около 55 Вт, то определим мощность процессора Intel — около 125 Вт, тогда как процессор AMD — около 75 Вт.


* Грубая оценка с учетом нашего предыдущего тестирования

Это говорит о том, что новые процессоры AMD с таким же количеством ядер дают производительность примерно равную (в отдельных тестах производительности) лучшему мейнстрим процессору Intel, потребляя при этом гораздо меньше энергии. Почти вдвое меньше энергии.

Это серьезная заявка на победу.

Как AMD сделала это? IPC или частота?

Мы знаем кое-что о новой микроархитектуре Zen 2. Мы знаем, что она имеет улучшенный модуль предсказания ветвлений и улучшенный префетчер, лучшее управление микрооперационным кешем, увеличенный микрооперационный кеш, увеличенную пропускную способность диспатчера, увеличенную пропускную способность retire инструкций, встроенную поддержку 256-битной математики с плавающей запятой, двойные блоки FMA и удвоенное количество load-store units. Эти последние три факта являются ключевыми элементами для бенчмарка Cinebench, и хорошо работают в пользу AMD.

Поскольку процессору Intel позволили работать в стандартной комплектации, даже на плате ASUS, он должен достигать около 4,7 ГГц турбо на всех ядрах. Частоты AMD на процессоре неизвестны; но они также не являются окончательными, и мы «должны ожидать большего». Что ж, если процессор работал только на 75 Вт, и они могут разогнать его еще на 20–30 Вт, то будет еще больше частоты и производительности.

Одна вещь, которую мы пока не знаем, это как хорошо 7 нм TSMC справляется с ростом напряжения и частоты. Единственные чипы 7 нм, которые в настоящее время существуют — это чипы для смартфонов с тактовой частотой менее 3 ГГц. Сравнивать попросту не с чем — можно предположить, что для того, чтобы конкурировать с Core i9-9900K, процессор должен был бы иметь all-core частоту (4,7 ГГц), если бы он был на том же IPC.

Если же процессор не может соответствовать по IPC или частоте, то возможны три варианта:

  1. Если процесс TSMC не может работать на таких высоких частотах, то AMD заметно опережает Intel по IPC, что приведет значительным изменением в современной аппаратуре x86.
  2. Если процесс TSMC может работать с тактовой частотой выше 5,0 ГГц, и в бюджете мощности есть запас для еще большего увеличения, то будет очень забавно увидеть, на что эти процессоры будут способны в итоге.
  3. Hyperthreading от AMD сводит с ума такие программы, как CineBench.

Процессоры AMD третьего поколения Ryzen — еще один шаг вперед

Во время разговора с AMD, их представитель сказал, что по мере приближения к запуску будет предоставлено больше информации. Они рады, что пользователи обсуждают, является ли IPC или частота секретом производительности процессора AMD, и будут раскрывать информацию ближе к времени выпуска.

Ян, я думал, ты предсказал два чиплета?

Естественно, я предполагал, что AMD представит настольный процессор серии Ryzen-3000 с шестнадцатью ядрами. Для меня и многих других это было естественным прогрессом, но сегодня мы говорим о том, что AMD упоминает только восьмиъядерный чип.

Я ошибся с предсказанием, и потерял свои деньги (прим. редакции: в Лас-Вегасе не меньше). Но если мы посмотрим на процессор, интрига все еще есть.

Там есть место для чего-то еще. Там не так много места, но я уверен, что если AMD захочет, в этом пакете будет еще один чип процессора (или чип GPU). Тогда снова поднимется вопрос о частоте и мощности.

Существует также вопрос о процессорах с меньшим количеством ядер для более дешевого сегмента рынка. Новый процессор использует кремний от TSMC, сделанный в Тайване, и GlobalFoundries, сделанный в Нью-Йорке, затем упакованный вместе. Мы слышали мнение людей, не работающих в отрасли, о том, что такой подход делает дешевые процессоры (менее 100 долл. США) менее целесообразными. Вполне возможно, что AMD сможет выйти на этот рынок с помощью будущих графических процессоров.

Какие у AMD дальнейшие планы, я не знаю. У меня нет волшебного хрустального шара. Но, похоже, у AMD есть куда расти в будущем.

Спасибо, что остаетесь с нами. Вам нравятся наши статьи? Хотите видеть больше интересных материалов? Поддержите нас оформив заказ или порекомендовав знакомым, 30% скидка для пользователей Хабра на уникальный аналог entry-level серверов, который был придуман нами для Вас: Вся правда о VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps от $20 или как правильно делить сервер? (доступны варианты с RAID1 и RAID10, до 24 ядер и до 40GB DDR4).

VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps до весны бесплатно при оплате на срок от полугода, заказать можно тут.

Dell R730xd в 2 раза дешевле? Только у нас 2 х Intel Dodeca-Core Xeon E5-2650v4 128GB DDR4 6x480GB SSD 1Gbps 100 ТВ от $249 в Нидерландах и США! Читайте о том Как построить инфраструктуру корп. класса c применением серверов Dell R730xd Е5-2650 v4 стоимостью 9000 евро за копейки?

habr.com

стали известны подробности о реализации новой архитектуры Zen 2 / ИТ-ГРАД corporate blog / Habr

В начале месяца в AMD рассказали о Zen 2. Первые чипы ожидаются уже в 2019. Рассказываем об особенностях архитектуры и о том, что она даст в контексте AMD vs Intel.

/ фото Fritzchens Fritz PD / 14-нм AMD Zeppelin

Что изменилось

Zen 2 разрабатывалась c прицелом на 7-нм техпроцесс. В компании заявляют, что переход на 7-нм позволит повысить производительность на 25%, сохранив уровень потребления энергии.

На выполнение одной операции чипам на Zen 2 потребуется на 50% меньше мощности. Это придется кстати в современных дата-центрах, для которых важны параметры энергоэффективности оборудования (к слову чипы EPYC, о которых мы расскажем ниже, созданы специально для работы в ЦОД). При этом чипы имеют умные функции управления энергопотреблением. Они могут динамически менять уровень напряжения в зависимости от загрузки ядер. Алгоритмы самостоятельно снижают частоту ядра, если понимают, что возможные задержки не отразятся на работе нагрузки.

AMD внесли ряд изменений в архитектуру Zen 2, по сравнению с предшественниками. Часть из них коснулась векторных регистров и показателя IPC (instructions per cycle).

Векторные регистры расширили. Их размер увеличили с 128 до 256 бит. Это позволило удвоить производительность при выполнении AVX-операций с числами с плавающей запятой. Теперь 256-битные AVX-операции не нужно разбивать на две 128-битные микрооперации. Поэтому Zen 2 показала результат в 16 FLOPS за такт, как архитектура Skylake от Intel.

IPC увеличили на 20%. Процентного прироста удалось добиться за счет балансировки нагрузки между компонентами архитектуры и расширения кеша. Прирост IPC позволил повысить производительность на 13%, по сравнению с Zen+. Отметим, что Zen+ превосходит Zen по этому показателю всего на 2–5%.

Первые чипы на новой архитектуре

Этим чипом станет серверный процессор EPYC Rome. Он будет обладать структурой, которую в AMD называют Chiplet Design. Компоновка микросхемы подразумевает соединение 7-нм CPU с 14-нм чипом I/O. Процессор будет содержать восемь вычислительных блоков, расположенных вокруг 14-нм чиплета. Соединение обеспечивается по шине InfinityFabric без прямых кремниевых соединений. В каждом блоке будет представлено восемь ядер — в сумме это 64 ядра.

Процессоры EPYC Rome смогут обрабатывать 128 потоков одновременно. Интерфейс памяти будет поддерживать восьмиканальный контроллер DDR4, который обеспечит чипу доступ к четырем терабайтам DRAM на каждый сокет.

Дополнительно процессор получит поддержку PCIe Gen 4, что увеличит количество гигатранзакций за секунду в два раза — с 8 до 16 ГТ/с.

В сентябре в сеть утекли результаты тестирования нового CPU в многопоточном бенчмарке Cinebench R15 — счет составил 12587. Это больше, чем у любого из процессоров текущего поколения компании (результат для AMD Ryzen Threadripper 2990WX — 5500).

Сейчас в AMD уже начали поставку первых образцов процессоров EPYC Rome своим клиентам и производителям серверов. Массовые поставки новых устройств начнутся уже в 2019 году, тогда же можно ожидать появления этих чипов в дата-центрах.

Intel vs AMD

Генеральный менеджер AMD Форест Норрод (Forrest Norrod) еще летом говорил, что серверные CPU EPYC Rome разрабатывались с целью составить конкуренцию 10-нм решениям Intel вроде Ice Lake-SP. Однако Intel долгое время откладывали выпуск чипов нового поколения из-за проблем с выходом годных микросхем. Релиз намечен на 2019 год, но точная дата выхода процессоров Intel на новом техпроцессе остается неизвестной.

Таким образом, Intel придётся конкурировать с новыми процессорами AMD с помощью «старого» семейства Cascade Lake-SP. Поэтому в AMD ожидают, что микросхемы на базе Zen 2 отвоюют у Intel первенство по производительности. Но особых иллюзий они все же не питают — долго удерживать лидерство может не получиться.

Представители компании AMD считают, что, в конце концов, конкуренты представят архитектуру аналогичную Zen 2. «Ответного удара» Intel в AMD ожидают уже к концу 2019 года.

/ фото Fritzchens Fritz PD / 14-нм AMD Zeppelin

Аналитики прогнозируют, что пока Intel будут налаживать производство 10-нм, цена акций AMD вырастет на 15%. Но когда новые процессоры Intel увидят свет, AMD сразу потеряют 4% от стоимости акций. И дальше их цена продолжит снижаться. Эксперты считают, что ни Zen 2, ни использование 7-нм техпроцесса не поможет AMD удержать временное преимущество на рынке.

Что дальше: от Zen 2 до Zen 5

Проектирование Zen 2 уже официально завершено. Серверные процессоры появятся на рынке уже в конце этого года, а десктопные решения — в 2019 году.

AMD также подтвердили, что разработка Zen 3 по техпроцессу 7nm+ идет полным ходом и закончится в 2020 году. О Zen 4 ходят противоречивые слухи. WikiChip Fuse сообщают, что разработка архитектуры уже началась, а WCCFTECH пишут, якобы Zen 4 решили пропустить и перейти сразу к Zen 5.

Zen 5 планируют изготавливать по 3-нм техпроцессу и новостей по этой архитектуре не стоит ждать раньше 2020 года.


P.S. Материалы из нашего корпоративного блога:
P.P.S. Еще мы пишем об IaaS и смежных темах в корпоративном Telegram-канале:

habr.com

новая линейка процессоров AMD Zen 2 и будущее компании / Мероприятия и выставки / iXBT Live

На мероприятии AMD New Horizon Gaming (AMD Techday 2019) компания рассказала о своих новых процессорах и графических картах, а также представила несколько новых технологий.

Первым был доклад Марка Пейпермастера, который рассказал о новых CPU компании. 

Процессоры семейства Zen: их особенности, ближайшее и отдаленное будущее

Путешествие компании AMD в мир высокопроизводительных впечатлений продолжается и все идет по плану. Действительно, кто бы мог об этом подумать еще пару-тройку лет назад, но сегодня у компании и правда очень сильная линейка устройств Ryzen, а грядущие планы еще интереснее. Так, в июле к уже поставляющимся процессорам на Zen и Zen+ (14/7 мм) добавится Zen 2, а в дальнейшем настанет время и Zen 3. При этом, технология процессоров Zen используется во всех вариантах ПК — от ноутбуков, до серверов.

Одной из самых очевидных инноваций в грядущих процессорах Zen 2 является переход на 7-нанометровый техпроцесс. Развитие в какой-то мере понятное — еще Intel во времена tick-tock приучила нас к тому, что более тонкий техпроцесс = меньшие потери энергии, более плотная упаковка, и, в конечном счете, бОльшая призводительность). Переход с 14 на 7 нм позволяет вдвое плотнее упаковать компоненты, вдвое уменьшить потребление энергии (при той же производительности), ну или в 1,25 раза увеличить производительность при том же потреблении энергии. 

Но, конечно, обновленным техпроцессом инновации не ограничиваются: самым важным изменением при переходе от Zen до Zen 2 являются архитектурные и внутренние изменение, которые позволяют суммарно на 15% увеличить количество выполняемых инструкций за такт (хотя корректнее будет тут все же говорить не о такте, а просто о некоем определенном количестве тактов). Ключевые компоненты этого: обновленная архитектура, улучшенное предсказание ветвлений, увеличение производительности целочисленных вычислений, удвоение вычислений с плавающей точкой, а также уменьшенные задержки при работе с памятью. 

Для начала остановимся на архитектурных изменениях. Был переработан кеш инструкций, а также увеличен вдвое кеш операций (OpCache). Ну и уже упомянутое ранее новое предсказание ветвлений. В целочисленной производительности изменения незначительные — в основном увеличение скорости загрузки/выгрузки, а также увеличение количества блоков генерации адресов до 3. 

В числах с плавающей точкой интересна поддержка вычислений с удвоенной точностью (до 256 бит), а также тоже оптимизирована загрузка и выгрузка. И стоит обратить внимание на обновленную работу с кешем — теперь в два раза больше L3-кеша на ядро. 

Кроме увеличения кеша, обновленная архитектура также поддерживает новые команды работы с ним: CLBW (выгрузка данных в энергонезависимую память), WBNOINVD (сброс модифицированных линий кеша в память без инвалидации) и QOS (контроль распределения кеша и пропускной способности памяти для потоков). Кстати, последняя также может использоваться и для контроля распределения прав доступа.

В общем же работа с кешем не изменилась — все также используется объединенный L3-кеш (16 МБ), а кеш L2 (КБ) уже свой у каждого ядра. Главным нововведением в этой области стало ускорение операций копирования данных кеш-кеш, а также удвоенная скорость загрузки/выгрузки (load/store) данных в кеш L1.

Таким образом, в увеличении производительности на поток (21% в Cinebench) в Zen 2 большой вклад будет как у техпроцесса 7 нм, так и у увеличения производительности на такт. Интересная особенность также в том, что все замеры компания проводит еще до выхода патча для процессоров AMD в Windows 10 (а все сравнения с конкурентом — без установленного патча для Meltdown). То есть, на практике производительность линейки Zen 2 может быть еще больше. Раз уж начал говорить, чуть добавлю и про уязвимости: большинству из них процессоры AMD мало подвержены или не подвержены вообще (что, впрочем, и неудивительно, так как сами по себе уязвимости изначально эксплуатировали особенности предсказания ветвлений у Intel). 

Резюмируя: процессоры новой линейки Zen 2, по рассказам AMD, оказались на 10-15% быстрее предыдущего. Ну что же, протестируем. Как бы то ни было, развитие линейки процессоров Zen на этом не остановится: уже сейчас в разработке Zen 3, а в дальнейшем нас ждет и Zen 4 (конечно, коммерческое название архитектурной концепции может быть иным.

Из еще интересных технологий, которые теперь есть в Ryzen — Precision Boost. Если я не ошибаюсь, она пришла к нам из «Бульдозеров». В зависимости от температурного режима, процессор автоматически «подразгоняется» на частоту до 200 МГц. При этом если установить кулер получше, то и автоматический разгон будет работать более агрессивно. Впрочем, это скорее особенность новых материнских плат на 570X, а не самих процессоров. 

Новые процессоры AMD: тестирование, сравнение с конкурентами

Конечно, большинству геймеров и «криэйтеров» все эти технологические особенности не очень важны, их волнует прежде всего то, как поведет себя процессор в реальных задачах и в сравнении с конкурентами. И людей таких много (см. первый слайд, а еще все удивляются, что это в мире заводы стоят). При этом, желательно обеспечить лидерство во всех ценовых сегментах, начиная с недорогого (AMD Ryzen 3600X) и заканчивая топовым (3900X). Видно, что конкурентов компания подбирает прежде всего по цене (они были объявлены еще в мае). 

При этом, каждая ценовая ступенька незначительно увеличивает производительность, да и по сравнению с предыдущим поколением разница не так впечатляет, как, например, в докладах Intel. Так, Ryzen 5 3600 у нас на 9% быстрее Ryzen 7 2700X, а вроде как соответствующей ему Ryzen 3700X — на 15%. Надо сказать, что с именованием процессоров AMD традиционно поступила по-своему, запутав всех максимально. 

Здесь стоит сделать определенную ремарку: большая часть тестирования производилась еще до майского апдейта Windows 10, то есть в процессах, которые требуют агрессивного переключения вычислительных блоков, результаты могут стать лучше. Кстати, если у вас Ryzen, то скорее обновляйтесь, чтобы получить увеличение производительности совершенно бесплатно. 

Основное улучшение производительности и уменьшение латентности было достигнуто за счет удвоения объема L3-кеша. График немного запутанный, но постараюсь разъяснить. Среднее увеличение производительности при переходе с DDR4-2677 на DDR4-3600 в CS:GO составило 9%, а вот за счет удвоение объема кеша L3 — уже 21% (в других играх показатели не такие впечатляющие). Интересно, что комбинацию из L2- и L3-кеша AMD теперь называет Gamecache и считает общий объем именно таким образом. 

Технология проведения бенчмарков была не очень понятна, так что, мы подождем, когда эти процессоры появятся у нас, чтобы протестировать по нашей методике. Но в целом ситуация всегда примерно одна и та же: в играх AMD Ryzen идет практически нос к носу со своим конкурентом (см. табличку с ценами выше), и значительно опережает в задачах монтажа видео и им подобных. 

Core i9-9900K против AMD Ryzen 9 3900X

ИгрыПрофессиональное ПОПроизводительность на ватт и абсолютное потребление энергииОсновные преимущества Ryzen 9 3900X

Core i9-9700K против AMD Ryzen 9 3700X

Сравнительная демка Core i7-9700K и Ryzen 7 3700X в CinebenchОбщее сравнение Core i7-9700K и AMD Ryzen 7 3700X

Интерес также вызвал сравнительный термоснимок процессора AMD и Intel после прогона этого теста. 

С остальными процессорами ситуация была примерно та же — AMD значительно превосходил конкурента в профессиональном ПО и практически так же работал в играх. 

Сравнение Core i5-9600K и AMD Ryzen 5 3600X в играхСравнение Core i5-9600K и AMD Ryzen 5 3600X в профессиональном  ПООбщее сравнение Core i5-9600K и AMD Ryzen 5 3600XОбщее перечисление преимуществ AMD Ryzen 5 3600X

Итого

Это первая статья из цикла о AMD Tech Day 2019. Обсуждаем архитектуру новых процессоров и читаем остальные части по тегу AMD Tech Day 2019

www.ixbt.com

Подробная информация о CPU AMD Zen 3 и GPU RDNA 2 на 7нм+ » Overclocked

AMD обновила свои дорожные карты для процессоров и графических процессоров, которые подтверждают, что Zen 3 и RDNA 2 будут поставляться клиентам в 2020 году. Новые продукты будут использовать новейшую литографию TSMC 7 нм+, обеспечивая более высокую производительность и гораздо лучшую эффективность, чем существующие продукты.

Согласно новой дорожной карте AMD процессоры Ryzen 4000 появятся раньше ГП RDNA 2 — запуск намечен на 2020 год

Хотя AMD еще не закончила работу с 7-нм графическими процессорами RDNA, их дорожная карта подтверждает, что в 2020 году мы сможем попробовать новые разработки. Архитектура AMD Zen 2 будет заменена на Zen 3, в то время как Архитектура RDNA 1-го поколения будет заменена архитектурой RDNA 2-го поколения.

AMD Zen 3 7nm+ — улучшенный Zen 2 для серверов и настольных компьютеров следующего поколения

Разработка 7nm+ архитектуры Zen 3 была завершена, и мы можем увидеть, что производство начнется где-то в 1-м полугодии 2020 года. Хотя Zen 2 была первой процессорной архитектурой, основанной на 7-нм, Zen 3 будет основан на эволюционном 7-нм+, который позволяет увеличить плотность размещения транзисторов на 20% по сравнению с 7-нм Zen 2. Применение 7 нм+ также обеспечивает повышение эффективности на 10%. Вполне возможно, что мы не сможем добиться столь значительного увеличения одноядерной производительности, как с процессорами Zen 2, но, тем не менее, дополнительное повышение производительности будет оказывать большее давление на Intel в области серверов и настольных ПК.
Одним из ведущих продуктов архитектуры Zen 3 будет линейка EPYC 3-го поколения, известная как Milan. Серия процессоров EPYC Milan будет развернута на суперкомпьютере Perlmutter Exascale, разработанном CRAY. Ранние спецификации показывают, что процессор серии Milan имеет 64 ядра и 128 потоков и поддержку AVX2 SIMD (256 бит). Также имеется поддержка 8-канальной оперативной памяти DDR и поддержка более 256 гигабайт на чип.Помимо Zen 3 и Zen 4, также был подтвержден Zen 5. Линейка EPYC 3-го поколения, которая была официально подтверждена как «Genoa» во время мероприятия по запуску EPYC Rome 2-го поколения. Zen 4 в настоящее время находится в разработке, и его запуск запланирован на 2021-2022 годы. Он будет использовать техпроцесс тоньше 7 нм и определенно будет отличным обновлением по сравнению с дизайном Zen 2/Zen 3. Как и в каждом поколении Zen, линейки Ryzen и Ryzen Threadripper также никуда не пропадут и продолжат жесткую конкуренцию на рынке.

Дорожная карта процессоров AMD (2018-2020)

Ryzen Family Ryzen 1000 Series Ryzen 2000 Series Ryzen 3000 Series Ryzen 4000 Series Ryzen 5000 Series
Architecture Zen (1) Zen (1) / Zen+ Zen (2) Zen (3) Zen (4)
Process Node 14nm 14nm / 12nm 7nm 7nm+ 5nm/6nm?
High End Server (SP3) EPYC ‘Naples’ EPYC ‘Naples’ EPYC ‘Rome’ EPYC ‘Milan’ EPYC ‘Genoa’
Max Server Cores / Threads 32/64 32/64 64/128 TBD TBD
High End Desktop (TR4) Ryzen Threadripper 1000 Series Ryzen Threadripper 2000 Series Ryzen Threadripper 3000 Series (Castle Peak) Ryzen Threadripper 4000 Series Ryzen Threadripper 5000 Series
Max HEDT Cores / Threads 16/32 32/64 64/128? TBD TBD
Mainstream Desktop (AM4) Ryzen 1000 Series (Summit Ridge) Ryzen 2000 Series (Pinnacle Ridge) Ryzen 3000 Series (Matisse) Ryzen 4000 Series (Vermeer) Ryzen 5000 Series
Max Mainstream Cores / Threads 8/16 8/16 16/32 TBD TBD
Budget APU (AM4) N/A Ryzen 2000 Series (Raven Ridge) Ryzen 3000 Series (Picasso 14nm Zen+) Ryzen 4000 Series (Renior) Ryzen 5000 Series
Year 2017 2018 2019 2020 2021?

ГПУ на базе архитектуры AMD RDNA 2 7nm+ — высокопроизводительная графическая линейка с поддержкой Ray Tracing

Переходя к ГПУ, AMD также показала, что архитектура RDNA 2 в настоящее время разрабатывается и планируется к запуску в 2020 году. Учитывая, что проект Zen 3 завершен, а RDNA 2 все еще находится в разработке, можно сказать, что запуск процессоров будет немного впереди 7-нм+ графических процессоров. Мы видим возможный запуск CPU в середине 2020 года, а графических процессоров — в конце 2020 года.
Мы мало что знаем о RDNA 2, кроме слухов, но то, о чем AMD официально сообщала, — это Ray Tracing с аппаратным ускорением, который будет доступен в линейке GPU следующего поколения. Со своей архитектурой RDNA следующего поколения AMD планирует интегрировать поддержку аппаратного ускорения в свои графические процессоры для поддержки трассировки лучей в реальном времени в играх. Это поставит их в один ряд с NVIDIA RTX, в которых реализована поддержка трассировки лучей благодаря интеграции аппаратного уровня в картах серии GeForce RTX 20.
AMD также хочет подтолкнуть RDNA 2 к более широкому спектру рынка. В то время как графические процессоры RDNA первого поколения отлично показали себя в сегменте от 300 до 500 долларов, мы, скорее всего, увидим ряд ГПУ для энтузиастов с графическими картами серии Radeon RX на базе RDNA 2. Это приведет к конкуренции с NVIDIA RTX 2080 SUPER / RTX 2080 Ti, но NVIDIA — это не та компания, которая просто молча будет наблюдать за выходом конкурентов. Планы 7-нм графических процессоров NVIDIA находятся в стадии реализации, и вполне вероятно, что мы увидим грандиозный запуск в 2020 году их графической архитектуры следующего поколения, предположительно известной как «Ampere».
Следует также отметить, что высокопроизводительные графические процессоры Navi могут сохранять дизайн памяти с высокой пропускной способностью, как нынешний флагман. В то время как AMD использует память GDDR6 на своих основных картах на основе RDNA, вполне вероятно, что компания пойдет дальше с новой HBM2E VRAM.

HBM2E поставляется в конфигурации стека 8-Hi и использует матрицы памяти 16 ГБ, объединенные вместе и работающие на скорости 3,2 Гбит/с. Это приведет к общей пропускной способности 410 ГБ/с на одной и 920 ГБ/с с двумя стеками HBM2E, что просто безумие. В довершение всего, VRAM имеет интерфейс шины шириной 1024 бита, который совпадает с текущим HBM2. Samsung заявляет, что их решение HBM2E, когда оно установлено в 4-х стороннюю конфигурацию, может предложить до 64 ГБ памяти с пропускной способностью 1,64 ТБ/с. Такие продукты подходят только для серверов / HPC, но высокопроизводительный графический продукт для энтузиастов может иметь до 32 ГБ памяти всего с двумя стеками, что в два раза больше памяти, чем у Radeon VII.

Сравнение архитектур GPU AMD:

AMD Radeon RX 400 Series AMD Radeon RX 500 Series AMD Radeon RX Vega Series AMD Radeon RX 5700 Series AMD Radeon RX 5800 Series?
Architecture Polaris Polaris Vega Navi Navi
Process Node Global Foundries 14nm Global Foundries 14nm Global Foundries 14nm / TSMC 7nm TSMC 7nm TSMC 7nm+
Memory GDDR5 GDDR5 HBM2 GDDR6 GDDR6/HBM2?
Year 2016-2017 2017-2018 2017-2019 2019 2020
GPUs Polaris 10, Polaris 11 Polaris 20, Polaris 21, Polaris 22, Polaris 30 Vega 10, Vega 20 Navi 10, Navi 11 Navi 20, Navi 21, Navi 23

AMD определенно подробно расскажет о своей линейке продуктов следующего поколения на CES 2020, так что следите за обновлениями.

overclocked.ru

чего ждать от будущих процессоров Ryzen 3000

Вчера компания AMD анонсировала свои новые 7-нм серверные процессоры EPYC «Rome» на базе микроархитектуры Zen 2. Благодаря этому уже сейчас мы можем попробовать предположить, чего стоит ожидать от перспективных потребительских процессоров Ryzen 3000 на базе новой микроархитектуры.

Ключевой особенностью процессоров EPYC «Rome» стали так называемые «чиплеты» — восьмиядерные кристаллы, лишённые привычных элементов северного моста. Объединяя на одной процессорной подложке до восьми чиплетов, старший EPYC «Rome» предлагает до 64 ядер. За сопряжение чиплетов в единое целое с помощью шины Infinity Fabric 2.0 теперь отвечает отдельный узел — центральный чип ввода-вывода (IO-чип), который получил восьмиканальный контроллер памяти DDR4 и внешние интерфейсы.

Однако «чиплеты» стали не единственной особенностью новых процессоров AMD. По словам компании, она переработала микроархитектуру ядра Zen 2 так, чтобы удвоить пропускную способность операций чтения/записи (Load/Store Bandwidth) и увеличить в два раза производительность при AVX-операциях с числами с плавающей запятой за счёт увеличения размерности векторов с 128 до 256 бит. К этому нужно добавить улучшения в предсказании переходов и увеличение объёма кеша микроопераций. По оценкам, эти меры должны обеспечить примерно 20-процентный прирост показателя IPC.

Также отмечается, что на выполнение одной операции теперь затрачивается на 50 % меньше энергии. А сам по себе переход на 7-нм техпроцесс позволяет повысить производительность на 25 % при том же уровне потребления энергии. По всей видимости, за счёт повышения частот.

В подтверждение своих слов о росте производительности AMD продемонстрировала, что предпродажный образец EPYC «Rome» с 64 ядрами и 128 потоками способен обойти систему на базе двух процессоров Intel Skylake-SP, которые в сумме обладают 56 ядрами и 112 потоками. Для демонстрации использовался тест C-ray, обеспечивающий нагрузку операциями с числами с плавающей запятой.

Так всё же, что это значит для рядовых пользователей будущих процессоров Ryzen 3000? До начала следующего года мы вряд ли узнаем наверняка. Но можно спрогнозировать, что мы увидим восьмиядерные кристаллы или даже 16-ядерные связки «чиплетов». Возможно, в настольных процессорах AMD также использует отдельный IO-чип для размещения контроллера памяти и интерфейсов ввода-вывода. Но, скорее, новые процессоры Ryzen, как и актуальные модели, будут построены на одном цельном кристалле, включающем и ядра, и все контроллеры, что будет означать конец унификации между настольными и серверными процессорами.

Тем не менее, все улучшения, присущие архитектуре Zen 2 в серверных процессорах, скорее всего, будут унаследованы и настольными процессорами. То есть можно смело ожидать повышения IPC, улучшения работы с числами с плавающей запятой, увеличения частот и так далее. И, конечно же, свой вклад внесёт переход на 7-нм техпроцесс. По оценке Патрика Мурхеда (Patrick Moorhead), главного аналитика компании Moor Insights & Strategy, чистая производительность ядра возрастёт как за счёт увеличения IPC, так и за счёт повышения тактовой частоты. Это положительно скажется на производительности будущих процессоров как в задачах, которые задействуют только одно или несколько ядер, так и в задачах, способных загрузить все ядра одновременно.

На процессоры Ryzen 3000 возлагаются большие надежды, потому как они должны закрепить успех чипов Ryzen первых двух поколений и обеспечить AMD дальнейший рост доли рынка. И судя по представленной информации, они могут быть в состоянии соперничать с процессорами Intel на равных. Во всяком случае, должно произойти давно назревшее повышение производительности одного ядра.

Остаётся лишь неясным, в какие сроки Ryzen 3000 появятся на рынке. Пока по этому поводу не было сделано никаких определённых заявлений. Больше информации по этому поводу можно ожидать от программного выступления Лизы Су (Lisa Su), которое состоится 9 января на открытии CES 2019.

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.

3dnews.ru

Оставьте комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *