Поддержка nvme что это: Nvm express — Википедия – NVMe — что это такое и в чем отличие от SSD

чем лучше и как работает?

Опубликовано 19.01.2020 автор — 0 комментариев

Всем привет! Сегодня поговорим про то, что такое NVME, как работает этот протокол, в чем отличие от SATA и почему он быстрее.

NVMе – это

Как вы уже знаете, в отличие от ставших привычными жестких дисков, которые подключаются почти всегда через порт SATA, для подключения твердотельных накопителей возможностей немного больше. Кроме привычного слота САТА, еще есть два основных типа подключения.

Один из них — порт m.2, сконструированный специально под ССД и использующий собственные драйвер и протоколы управления. Второй способ подключения — через универсальный слот PCI Express.

Для поддержки такого типа накопителей памяти создан NVME — протокол доступа к данным. Программный комплекс универсальный и работает на любой операционной системе — как Windows 10, так и уже устаревшей «Семерке». Устаревшей морально, так как с недавних пор официальная поддержка этой ОС прекращена разработчиком.

Необходимость в дополнительном протоколе вызвана тем, что стандартный контроллер PCI — по сути, обычная «железяка», которой нужно объяснить, как правильно взаимодействовать с подключенными устройствами.

Также на эту тему советую почитать публикацию «Отличие SSD от SSD M2» (так сказать: для напоминания).

NVMe boot — что это такое

Ничего эдакого, просто полное и правильное название технологии.

Хочу обратить ваше внимание, что этот протокол поддерживают только материнки с UEFI. Старые версии БИОС, даже если физически подключить все правильно, доступа к данным на PCI‑E SSD не обеспечат.

Закономерный вопрос: зачем нужно такое решение и чем лучше обычных, то есть подключаемых через интерфейс САТА, такие накопители? Главное достоинство — более высокая пропускная способность этой шины, а значит и более быстрый доступ к хранимым данным.

А так как обычно ССД для этих целей и покупается, то при сборке нового компа ориентироваться рекомендую или на интерфейс M.2, или на PCI‑E.

Хочу отметить и некоторые недостатки.

Такая сборка подразумевает покупку более дорогой материнской платы, оборудованной как минимум парой портов PCI Express. У бюджетных моделей такой порт всего один и обычно он используется для подключения графического адаптера.

С другой стороны, и системная плата с портом М.2 стоит дороже массовых решений. Так что по деньгам получается приблизительно «один к одному». Особой разницы в скорости передачи данных тоже нет.

Также для вас будут полезными статьи «Что такое SSD cache» и «Сколько живет диск ССД». Не забывайте делиться статьями моего блога в социальных сетях — так вы поможете другим пользователям узнать полезную информацию. До скорой встречи!

С уважением, автор блога Андрей Андреев.

первый NVMe – комом / Накопители

⇡#Введение: что нужно знать о NVMe

Твердотельные накопители, пожалуй, можно считать уже самым настоящим мэйнстримом. Любой уважающий себя владелец персонального компьютера если и не имеет хотя бы один SSD в своей системе, то очень серьёзно настроен на его приобретение. Однако называть рынок систем хранения данных, основанных на использовании флеш-памяти, окончательно оформившимся и устоявшимся всё ещё преждевременно. На нём появляются всё новые и новые технологии, и это значит, что впереди нас ждёт ещё много всего интересного. Так, ближайшей инновацией, которая должна выступить лейтмотивом очередных крупных изменений в сфере потребительских SSD, скорее всего, станет технология с названием Non-Volatile Memory Express, или NVM Express, или, как её чаще всего называют, NVMe. Это перспективный интерфейсный протокол, созданный специально для высокоскоростных SSD консорциумом из ведущих отраслевых разработчиков, включая Intel, Samsung, SanDisk, Dell и Seagate.

Первый потребительский NVMe SSD – Intel SSD 750

Если вы следите за прогрессом в сфере твердотельных накопителей, то наверняка знаете, что они в своём развитии столкнулись с серьёзной преградой – устаревшими шинами. Serial ATA и Serial Attached SCSI (SAS) предоставляют достаточную полосу пропускания для механических жёстких дисков, но более скоростные SSD с лёгкостью выбирают весь их потенциал. Поскольку пропускная способность SATA ограничена величиной 6 Гбит/с, максимальная скорость флагманских SATA SSD не выходит за величину порядка 500 Мбайт/с. Не спасает и более скоростной SAS-интерфейс: он ограничивает скорость передачи данных величиной 1,2 Гбайт/с. Современные же накопители, основанные на флеш-памяти, способны на гораздо большее.

Этот тупик на самом деле не стал неожиданностью для индустрии: о нём было известно с самого начала. Твердотельные накопители имеют больше общего с системной памятью, нежели с механическими жёсткими дисками, и поэтому рано или поздно они должны были перерасти возможности интерфейсов, традиционно применявшихся для подключения HDD. Но до сих пор встраивать SSD в имеющуюся инфраструктуру было проще и лучше для популяризации новой технологии. И только лишь к настоящему моменту скорости твердотельных накопителей возросли настолько, что отрицательное влияние старых интерфейсов стало игнорировать категорически невозможно, а значит, пришло время от них отказаться.

К счастью, подходящая для использования SSD высокоскоростная шина давно изобретена, и это – PCI Express. Сейчас она активно применяется в качестве транспортного уровня при подключении графических карт и прочих дополнительных контроллеров, нуждающихся в обмене данными с высокой скоростью, например Thunderbolt. Одна линия PCI Express второго поколения обеспечивает пропускную способность на уровне 500 Мбайт/с, а линия PCI Express 3.0 может развивать скорость до 985 Мбайт/с. Таким образом, интерфейсная карта, устанавливаемая в слот PCIe x4 (с четырьмя линиями), может обмениваться данными на скорости до 2 Гбайт/с в случае PCI Express 2.0 и до почти 4 Гбайт/с – при использовании PCI Express третьего поколения. Это отличные показатели, которые вполне подходят и для современных твердотельных накопителей.

Из сказанного закономерно следует, что на рынке не только доступны потребительские SATA SSD, но и потихоньку распространяются варианты для шины PCI Express. Скажем, через наши руки прошли такие модели, как OCZ RevoDrive, Kingston HyperX Predator и Plextor M6e. Но все они характерны тем, что, используя в качестве транспорта данных прогрессивную шину PCI Express, продолжают общаться с системой посредством старых SCSI- или SATA-протоколов. А такой подход не только неверен методологически, но и попросту не даёт полностью раскрыться всем сильным сторонам скоростных твердотельных накопителей. Иными словами, назрела необходимость в реализации принципиально нового подхода, коим и стал специализированный логический интерфейс NVMe, наложенный на транспорт PCI Express.

Как ожидается, к 2018 году более 70 % потребительских SSD будут иметь интерфейс NVMe

Как ожидается, к 2018 году более 70 % потребительских SSD будут иметь интерфейс NVMe

В отличие от распространённых интерфейсов SCSI или SATA, которые создавались в предшествующую SSD эпоху, NVMe спроектирован с целью извлечения преимуществ из уникальных свойств именно твердотельных накопителей, которые, основываясь на энергонезависимой флеш-памяти с произвольным доступом, обладают очень низкими задержками и позволяют глубоко конвейеризировать операции чтения и записи. NVMe содержит целый ряд усовершенствований, направленных на уменьшение паразитных латентностей при работе с данными по сравнению с интерфейсом SATA и AHCI-протоколом, где этому вопросу специального внимания не уделялось. Кроме того, в NVMe наконец-то учтена многопоточная природа современных платформ, прекрасно сочетающаяся с архитектурой актуальных моделей SSD.

Как ожидается, к 2018 году более 70 % потребительских SSD будут иметь интерфейс NVMe

Если говорить об улучшениях, нашедших место в NVMe, конкретнее, в первую очередь упоминания заслуживает стремление к снижению накладных расходов. Например, передача наиболее типичных 4-килобайтных блоков в новом протоколе требует подачи лишь одной команды вместо двух. А весь набор управляющих инструкций упрощён настолько, что их обработка на уровне драйвера позволяет уменьшить загрузку процессора и возникающие при этом задержки как минимум вдвое. Второе же важное нововведение – поддержка глубокой конвейеризации и многозадачности, заключающаяся в возможности параллельно создавать множественные очереди запросов вместо имевшейся ранее единой очереди на 32 команды. Интерфейсный протокол NVMe способен обслуживать до 65536 очередей, причём каждая из них может содержать до 65536 команд. Фактически какие-либо ограничения ликвидируются вообще, и это очень важно для серверных сред, где на дисковую подсистему может возлагаться огромное количество одновременных операций ввода-вывода. Для персональных компьютеров данное новшество не столь критично, но при одновременной работе нескольких приложений, активно общающихся с накопителем, загрузка процессора благодаря NVMe всё-таки может быть несколько понижена.

Как ожидается, к 2018 году более 70 % потребительских SSD будут иметь интерфейс NVMe

Надо сказать, что технология NVMe к моменту своего внедрения оказалась очень хорошо проработанной не только на теоретическом, но и на практическом уровне. Драйверы, которые необходимы для поддержки твердотельных накопителей, работающих по этому протоколу, сейчас имеются во всех основных операционных системах. В Linux поддержка NVMe появилась в версии ядра 3.1; «врождённый» драйвер NVMe имеется в Windows 8.1 и Windows Server 2012 R2; совместимость с NVMe-накопителями была добавлена и в OS X 10.10.3.

Расстраивает лишь то, что NVMe SSD поддерживается далеко не всеми материнскими платами. Для того чтобы такие накопители можно было использовать в качестве загрузочных, UEFI материнской платы должен тоже обладать соответствующим драйвером. Однако производители встроили необходимый микрокод лишь в последние версии прошивок, выпущенные для наиболее свежих моделей материнок. Поэтому поддержка загрузки операционной системы с NVMe-накопителей есть лишь на самых современных платах для энтузиастов, основанных на наборах логики Intel Z97 и Intel X99. В более старых и дешёвых платформах пользователи смогут воспользоваться NVMe SSD лишь как вторыми дисками.

Ещё одна проблема переходного периода заключается в отсутствии в существующих системах необходимых коннекторов для подключения NVMe-накопителей. Именно поэтому на первом этапе большинство SSD с таким интерфейсом будут выпускаться в виде простых PCIe- или M.2-плат, требующих для своей работы подключения к шине PCI Express 3.0. Однако на самом деле для нового поколения SSD разработан и специальный разъём U.2, ранее известный под именем SFF-8639. Этот разъём подразумевает более традиционное кабельное соединение и должен позволить высокопроизводительным SSD сохранить привычное 2,5-дюймовое исполнение. Пока порты U.2 можно найти лишь на единичных системных платах, причём преимущественно серверной направленности. Однако в перспективе U.2 станет повсеместным решением. Он объединяет в себе четыре линии PCI Express 3.0, два наследственных SATA-порта, а также 3,3- и 12-вольтовые линии питания, то есть обладает свойством универсальности. Именно поэтому U.2 должен с лёгкостью вытеснить так и не завоевавший популярность интерфейс SATA Express, который предлагает существенно более скудные возможности.

Схема кабельного соединения для NVMe SSD

Схема кабельного соединения для NVMe SSD

Стоит упомянуть, что некоторые производители материнских плат стали предлагать переходники со слота M.2 на разъём U.2. Однако в M.2 нет линий 12 В, поэтому такие переходники требуют подключения внешнего питания. Кроме того, не следует забывать, что большинство имеющихся на современных материнских платах слотов M.2 подключается не к процессору, а к южному мосту набора системной логики, а потому располагает лишь двумя линиями PCI Express 2.0. В результате U.2 NVMe-накопители, подсоединённые через переходник, в большинстве случаев не смогут продемонстрировать максимальную заложенную в них производительность.

Материнская плата c U.2-переходником ASUS Hyper Kit, установленным в слот M.2

Материнская плата c U.2-переходником ASUS Hyper Kit, установленным в слот M.2

Впрочем, в настоящее время на рынке доступно всего несколько моделей твердотельных накопителей с интерфейсом NVMe. И в первую очередь это серверные Intel DC P3500, P3600 и P3700, а также Samsung MZ-WEIT10, которые вряд ли могут заинтересовать обычных пользователей. До появления же на рынке широкого ассортимента U.2 NVMe SSD ситуация c распространением нового разъёма вполне может измениться в лучшую сторону. Первые же решения потребительского уровня, ориентированные на радикальных энтузиастов, вполне могут обходиться и обычными слотами PCIe или M.2. Такими, в частности, являются готовящаяся к поступлению в продажу NVMe-версия накопителя Samsung SM951 и уже доступный в магазинах Intel SSD 750, речь о котором как раз и пойдёт в этом обзоре.

⇡#Технические характеристики

Intel на рынке твердотельных накопителей придерживается довольно-таки оригинальной стратегии, заключающейся в том, что разработке SSD для потребительского сегмента уделяется не слишком серьёзное внимание. Основные же усилия при этом направляются на модели, ориентированные на корпоративный и серверный сегменты, и в них Intel удалось прочно закрепиться в числе лидеров. В рамках этой концепции пользователи персональных компьютеров последние несколько лет получают лишь побочные продукты, которые тем не менее пользовались и продолжают пользоваться устойчивым спросом, обеспечиваемым не столько выдающимися характеристиками, сколько репутацией производителя. Но с технологической точки зрения такие модели особого интереса не представляют. Например, до недавних пор ассортимент интеловских потребительских SSD состоял из нескольких модификаций, использующих безнадёжно устаревший контроллер SandForce SF-2281, и из основанного на собственном контроллере накопителя Intel SSD 730, представляющего собой слегка адаптированный для десктопов аналог серверного Intel DC S3500.

Однако то, что Intel до недавнего времени не хотела расходовать много сил на разработку моделей SATA SSD для персональных компьютеров, совершенно не значит, что компании этот рыночный сегмент стал вообще неинтересен. Просто она решила действовать по-другому – дождаться подходящего момента и выпустить принципиально новое флагманское решение, которое по технологической насыщенности будет заведомо превосходить все конкурирующие варианты. И вот этот момент настал – в начале апреля Intel представила свой новый SSD 750-й серии, ставший первым доступным на рынке потребительским твердотельным накопителем с интерфейсом NVMe.

Материнская плата c U.2-переходником ASUS Hyper Kit, установленным в слот M.2

Надо сказать, что платформа, позволяющая создавать NVMe SSD, у компании была заготовлена уже достаточно давно. Однако до выпуска Intel SSD 750 она применялась лишь в высокопроизводительных SSD для дата-центров, в которые, помимо всего прочего, шла и высоконадёжная, но дорогая eMLC NAND. Теперь же Intel решила попробовать внедрить аналогичную платформу в основанные на обычной MLC-флеш-памяти накопители для энтузиастов, которые должны совместить высокую мощность и принципиально новый интерфейс NVMe с удобоваримой стоимостью. Именно так мы и получили Intel SSD 750.

Производитель Intel
Серия SSD 750
Модельный номер SSDPE2MW400G4
SSDPEDMW400G4
SSDPE2MW012T4
SSDPEDMW012T4
Форм-фактор 2.5″ 15-мм U.2 или карта PCIe x4 (HHHL)
Интерфейс PCI Express 3.0 x4 — NVMe
Ёмкость 400 Гбайт 1,2 Тбайт
Конфигурация
Микросхемы памяти: тип, интерфейс, техпроцесс, производитель Intel 128 Гбит 20-нм MLC NAND
Контроллер Intel Ch39AE41AB0
Производительность
Макс. устойчивая скорость последовательного чтения 2200 Мбайт/с 2400 Мбайт/с
Макс. устойчивая скорость последовательной записи 900 Мбайт/с 1200 Мбайт/с
Макс. скорость произвольного чтения (блоки по 4 Кбайт) 430000 IOPS 440000 IOPS
Макс. скорость произвольной записи (блоки по 4 Кбайт) 230000 IOPS 290000 IOPS
Физические характеристики
Потребляемая мощность: бездействие/чтение-запись 9/12 Вт 10/22 Вт
MTBF (среднее время наработки на отказ) 1,2 млн ч
Ресурс записи 127 Тбайт
Габаритные размеры: Д×В×Г 2,5 дюйма – 100,45 × 69,85 × 15 мм
PCIe – 167,65 × 68,9 × 18,74 мм
Масса 2,5 дюйма – 125 г
PCIe – 195 г
Гарантийный срок 5 лет
Рекомендованная цена $389 $1 029

Надо сказать, что Intel SSD 750 – это не простая адаптация серверного продукта, как было в случае с Intel SSD 730. В данном случае разработчики отнеслись к своей миссии более ответственно и на базе изначально серверной платформы сделали принципиально иной накопитель, в котором проведена глубокая оптимизация микропрограммы под клиентские задачи. Так, в Intel SSD 750 огромное внимание уделено высокому быстродействию при работе с 4-килобайтными блоками. Скорости последовательного чтения и записи при этом несколько пострадали, но, по утверждению разработчиков, усреднённая производительность при типичной десктопной нагрузке в результате стала выше. Да и к тому же переживать о недостатке какого-либо аспекта мощности в Intel SSD 750 попросту глупо – платформа, используемая в этом продукте, настолько сильна, что никаких других SSD для ПК с подобными заявленными скоростями попросту не существует.

Однако серверные корни Intel SSD 750 всё-таки нашли отражение в характеристиках. Так, этот накопитель доступен всего в двух вариантах объёма – 400 Гбайт и 1,2 Тбайт. Выбор далеко не самый удобный, и особенно расстраивает отсутствие какой-либо промежуточной ёмкости. В этой связи можно сказать наверняка, что гораздо более востребованной версией станет Intel SSD 750 400 Гбайт, рекомендованная стоимость которой составляет $389. Это дороже флагманских SATA SSD, но в сравнении с потребительскими PCI Express-накопителями Intel SSD 750 – вполне выгодное предложение, особенно если учесть его новаторство и потрясающе высокие скорости случайных операций.

Intel SSD 750 доступен в двух различных форм-факторах: в виде уже привычной энтузиастам карты расширения с интерфейсом PCI Express 3.0 x4 либо в виде 2,5-дюймового накопителя, но с увеличенной, 15-миллиметровой толщиной. При этом 2,5-дюймовая модель требует для своей интеграции в систему «правильный» интерфейс U.2, что делает её первым потребительским накопителем, рассчитанным на использование разъёмов нового типа. Если говорить о десктопах, то прямое подключение такой разновидности SSD на данный момент возможно лишь через конвертеры. Соответствующие решения есть у ASUS и MSI: обе фирмы предлагают переходники для слота M.2, позволяющие преобразовать такой разъём с линиями PCI Express 3.0 в порт U.2.

2,5-дюймовая версия Intel SSD 750, подключенная к плате ASUS Sabertooth X99 через M.2-переходник

2,5-дюймовая версия Intel SSD 750, подключённая к плате ASUS Sabertooth X99 через M.2-переходник

Однако даже если принять во внимание существование U.2-переходников и накопителя Intel SSD 750, сделанного в виде PCIe-карты, следует понимать, что установить его можно далеко не в любую систему. И дело не только в ограниченной поддержке NVMe в BIOS материнских плат прошлых поколений. Intel SSD 750 нуждается в четырёх линиях PCI Express 3.0, которые суммарно могут обеспечить пропускную способность до 4 Гбайт/с. Соответственно, для Intel SSD 750 подходят только такие слоты и разъёмы, которые питаются от процессорного, а не от чипсетного PCI Express-контроллера. Поэтому наилучшей платформой для Intel SSD 750 выступают системы с LGA2011-v3-процессорами, которые располагают PCI Express-контроллером с достаточным количеством линий PCI Express 3.0. Если же говорить о LGA1150-системах, то в них в пользу интеловского накопителя придётся отнять четыре линии от видеокарты. В слотах же PCI Express 2.0 высокопроизводительный Intel SSD 750 свою феноменальную производительность раскрыть попросту не сможет.

PCIe 3.0 x4 NVMe SSD должен коммутироваться с CPU для получения максимальной произодительности

PCIe 3.0 x4 NVMe SSD должен коммутироваться с CPU для получения максимальной производительности

Откуда берётся такая высокая производительность, что интеловской новинке действительно нужны четыре линии PCI Express 3.0, несложно понять, если посмотреть на его аппаратную начинку. В его основе лежит контроллер серверного уровня Intel Ch39AE41AB0, который работает на частоте 400 МГц и обладает восемнадцатью каналами для подключения флеш-памяти. Если учесть, что большинство контроллеров для потребительских SSD располагают либо восемью, либо четырьмя каналами, становится понятно, что Intel SSD 750 действительно может прокачивать по шине значительно больше данных, чем все те модели SSD, с которыми мы сталкивались до сих пор, включая и варианты, работающие через PCI Express.

Контроллер Intel Ch39AE41AB0

Контроллер Intel Ch39AE41AB0

Однако применение контроллера со столь высоким уровнем параллелизма имеет и свои отрицательные стороны. А именно, по своему тепловыделению и энергопотреблению он заметно превосходит все другие чипы такого же назначения. Пиковое тепловыделение старшей версии Intel SSD 750 при операциях записи может доходить до 25 Вт, что требует отдельной заботы об теплоотводе. Конечно, до необходимости активного охлаждения дело не доходит, однако высокое тепловыделение и энергопотребление контроллера ставит крест на возможности создания с его помощью накопителей в компактном форм-факторе M.2.

Что касается используемой флеш-памяти, то в этой части Intel SSD 750 не проводит никаких инноваций. Он основывается на обычной MLC NAND интеловского же производства, выпущенной по 20-нм техпроцессу и имеющей ядра объёмом 128 Гбит. Следует заметить, что большинство прочих производителей SSD достаточно давно отказались от подобной памяти, перейдя на чипы, сделанные по более тонким нормам. Да и сама Intel начала перевод на 16-нм память не только своих потребительских, но и серверных накопителей. Однако несмотря на всё это, в Intel SSD 750 устанавливается более старая память, которая имеет более высокий ресурс.

При этом никаких из ряда вон выходящих показателей надёжности для Intel SSD 750 не заявляется. Производитель говорит о возможности перезаписи 70 Гбайт ежедневно в течение пятилетнего гарантийного срока. Таким образом, ресурс записи для новинки составляет порядка 127 Тбайт, что не превышает декларируемую выносливость флагманских моделей SATA SSD, предлагаемых лидерами рынка. Но зато интеловский SSD обеспечивает полную защиту данных от утраты при перебоях питания. На Intel SSD 750 имеется два электролитических конденсатора, и их ёмкости хватает для штатного завершения работы накопителя в автономном режиме.

⇡#Внешний вид и внутреннее устройство

Для тестирования наша лаборатория получила PCIe-вариант Intel SSD 750 ёмкостью 400 Гбайт. Эта версия имеет наиболее ходовые сочетания объёма и исполнения, но при этом её скорости чуть ниже, чем у 1,2-Тбайт модификации, из-за меньшего параллелизма массива флеш-памяти. Выглядит она следующим образом.

Контроллер Intel Ch39AE41AB0   Контроллер Intel Ch39AE41AB0

Плата накопителя имеет половинную высоту, что позволяет устанавливать её не только в традиционные десктопы, но и в 2U-серверы. Необходимая для этого укороченная планка задней панели входит в комплект поставки.

Сам же накопитель полностью закрыт бронёй. С лицевой стороны это алюминиевый радиатор, а с оборотной – декоративная металлическая пластина, которая на самом деле с микросхемами не соприкасается. Следует отметить, что применение радиатора – необходимость. Основной контроллер интеловского SSD выделяет немало тепла, и при высокой нагрузке даже оснащённый таким охлаждением накопитель может разогреваться до температур порядка 50-55 градусов. Но благодаря радиатору никаких намёков на троттлинг не наблюдается – производительность остаётся постоянной даже в процессе непрерывного и интенсивного использования.

Дизайн печатной платы Intel SSD 750 вызывает немалое удивление. Она несёт на себе такое количество микросхем флеш-памяти, которого хватило бы как минимум на четыре обычных SSD 480-гигабайтного объёма. Однако Intel решила отказаться от повсеместно применяемых чипов большой ёмкости с несколькими полупроводниковыми кристаллами внутри, благо площадь платы это вполне позволяет.

Контроллер Intel Ch39AE41AB0   Контроллер Intel Ch39AE41AB0

Ещё один интересный факт заключается в том, что среди 36 микросхем MLC NAND, имеющихся на Intel SSD 750 400 Гбайт, встречаются две различные разновидности. Обе они произведены компанией Intel, однако 24 микросхемы имеют маркировку 29F16B08MCMFS и содержат внутри себя по одному 128-гигабитному 20-нм MLC NAND-устройству, а ещё 12 микросхем с маркировкой 29F64G08LCMFS базируются на единичных 20-нм 64-гигабитных кристаллах. Это значит, что 18-канальный контроллер Intel Ch39AE41AB0 в общей сложности работает с массивом из 36 NAND-устройств и пользуется всего лишь двукратным чередованием, которое и обуславливает несколько более низкие, чем у модели на 1,2 Тбайт, показатели быстродействия.

Если просуммировать ёмкость всех микросхем, то получится, что общий объём флеш-памяти в Intel SSD 750 400 Гбайт составляет 480 ГиБ, от которых пользователю доступно лишь около 78 процентов. Остальное отводится на подменный фонд, сборку мусора и технологии защиты данных. В Intel SSD 750 реализована традиционная для флагманских накопителей RAID 5 подобная схема на уровне кристаллов MLC NAND, что позволяет успешно восстанавливать данные даже в том случае, когда один из чипов полностью выходит из строя.

Ещё одна особенность применённой в Intel SSD 750 платформы заключается в том, что его контроллер Intel Ch39AE41AB0 взаимодействует со сравнительно объёмным массивом DRAM. Добавление в конструкцию накопителя быстродействующего и вместительного кеша – ещё один из способов получения высокой производительности. Поэтому общая ёмкость оперативной памяти у интеловского флагмана составляет 1,25 Гбайт, и набрана она аж пятью DDR3-1600-чипами Micron MT41K512M4DA-125.

Говоря о практических аспектах применения Intel SSD 750, следует напомнить, что это – не совсем обычный SSD для шины PCI Express 3.0 x4. Одного лишь скоростного слота для него недостаточно, от материнской платы требуется также поддержка NVMe-интерфейса на уровне UEFI. Сама Intel предлагает достаточно скромный список совместимых плат, но на самом деле подходящих вариантов несколько больше, правда все они основываются исключительно на последних наборах логики Intel X99 и Z97. В тех же системах, в которых NVMe в UEFI не поддерживается, загрузка операционной системы с Intel SSD 750 невозможна и он может служить лишь дополнительным накопителем.

Любопытно, что хотя Windows 8.1 и имеет встроенный NVMe-драйвер, Intel рекомендует использовать с SSD 750 альтернативный драйвер собственной разработки, который позволяет получить более высокую производительность. И это действительно так — скорость рассматриваемого SSD с драйвером от разработчиков Intel заметно возрастает. Да и вообще, программная поддержка Intel SSD 750 проработана гораздо лучше, чем это принято у других производителей потребительских PCIe SSD. С ним даже оказалась совместима фирменная утилита Intel SSD Toolbox, обладающая набором полезных инструментов для мониторинга состояния твердотельного накопителя, оптимизации операционной системы, обновления прошивок и выполнения операции Secure Erase. Правда, популярные сторонние программы для SMART-мониторинга, например та же CrystalDiskInfo, с Intel SSD 750 не работают, но это – проблема совсем не интеловских разработчиков.

Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.

NVMe-накопители в разных режимах работы интерфейса PCI Express:

Если спросить, какой интерфейс следует использовать для твердотельного накопителя с поддержкой протокола NVMe, то любой человек (вообще знающий, что такое NVMe) ответит: конечно PCIe 3.0 x4! Правда, с обоснованием у него, скорее всего, возникнут сложности. В лучшем случае получим ответ, что такие накопители поддерживают PCIe 3.0 x4, а пропускная способность интерфейса имеет значение. Иметь-то имеет, однако все разговоры об этом начались только тогда, когда некоторым накопителям на некоторых операциях стало тесно в рамках «обычного» SATA. Но ведь между его 600 МБ/с и (столь же теоретическими) 4 ГБ/с интерфейса PCIe 3.0 x4 — просто пропасть, причем заполненная массой вариантов! А вдруг и одной линии PCIe 3.0 хватит, поскольку это уже в полтора раза больше SATA600? Масла в огонь подливают производители контроллеров, грозящиеся в бюджетной продукции перейти на PCIe 3.0 x2, а также тот факт, что у многих пользователей и такого-то нет. Точнее, теоретически есть, но высвободить их можно, лишь переконфигурировав систему или даже что-то в ней поменяв, чего делать не хочется. А вот купить топовый твердотельный накопитель — хочется, но есть опасения, что пользы от этого не будет совсем никакой (даже морального удовлетворения от результатов тестовых утилит).

Но так это или нет? Иными словами, нужно ли действительно ориентироваться исключительно на поддерживаемый режим работы — или все-таки на практике можно поступиться принципами? Именно это мы сегодня и решили проверить. Пусть проверка будет быстрой и не претендующей на исчерпывающую полноту, однако полученной информации должно оказаться достаточно (как нам кажется) хотя бы для того, чтобы задуматься… А пока вкратце ознакомимся с теорией.

PCI Express: существующие стандарты и их пропускная способность

Начнем с того, что́ представляет собой PCIe и с какой скоростью этот интерфейс работает. Часто его называют «шиной», что несколько неверно идеологически: как таковой шины, с которой соединены все устройства, нет. На деле имеется набор соединений «точка—точка» (похожий на многие другие последовательные интерфейсы) с контроллером в середине и присоединенными к нему устройствами (каждое из которых само по себе может быть и концентратором следующего уровня).

Первая версия PCI Express появилась почти 15 лет назад. Ориентация на использование внутри компьютера (нередко — и в пределах одной платы) позволила сделать стандарт скоростным: 2,5 гигатранзакции в секунду. Поскольку интерфейс последовательный и дуплексный, одна линия PCIe (x1; фактически атомарная единица) обеспечивает передачу данных на скоростях до 5 Гбит/с. Однако в каждом направлении — лишь половина от этого, т. е. 2,5 Гбит/с, причем это полная скорость интерфейса, а не «полезная»: для повышения надежности каждый байт кодируется 10 битами, так что теоретическая пропускная способность одной линии PCIe 1.x составляет примерно 250 МБ/с в каждую сторону. На практике нужно еще передавать служебную информацию, и в итоге правильнее говорить о ≈200 МБ/с передачи пользовательских данных. Что, впрочем, на тот момент времени не только покрывало потребности большинства устройств, но и обеспечивало солидный запас: достаточно вспомнить, что предшественница PCIe в сегменте массовых системных интерфейсов, а именно шина PCI, обеспечивала пропускную способность в 133 МБ/с. И даже если рассматривать не только массовую реализацию, но и все варианты PCI, то максимумом были 533 МБ/с, причем на всю шину, т. е. такая ПС делилась на все подключенные к ней устройства. Здесь же 250 МБ/с (поскольку и для PCI приводится обычно полная, а не полезная пропускная способность) на одну линию — в монопольном использовании. А для устройств, которым нужно больше, изначально была предусмотрена возможность агрегирования нескольких линий в единый интерфейс, по степеням двойки — от 2 до 32, т. е. предусмотренный стандартом вариант х32 в каждую сторону мог передавать уже до 8 ГБ/с. В персональных компьютерах х32 не использовался из-за сложности создания и разведения соответствующих контроллеров и устройств, так что максимумом стал вариант с 16 линиями. Использовался он (да и сейчас используется) в основном видеокартами, поскольку большинству устройств столько не требуется. Вообще, немалому их количеству и одной линии вполне достаточно, но некоторые применяют с успехом и х4, и х8: как раз по накопительной теме — RAID-контроллеры или SSD.

Время на месте не стояло, и около 10 лет назад появилась вторая версия PCIe. Улучшения касались не только скоростей, но и в этом отношении был сделан шаг вперед — интерфейс начал обеспечивать 5 гигатранзакций в секунду с сохранением той же схемы кодирования, т. е. пропускная способность удвоилась. И еще раз она удвоилась в 2010 году: PCIe 3.0 обеспечивает 8 (а не 10) гигатранзакций в секунду, но избыточность уменьшилась — теперь для кодирования 128 бит используется 130, а не 160, как ранее. В принципе, и версия PCIe 4.0 с очередным удвоением скоростей уже готова появиться на бумаге, но в ближайшее время в железе мы ее массово вряд ли увидим. На самом деле и PCIe 3.0 до сих пор в массе платформ используется совместно с PCIe 2.0, потому что и производительность последней для многих сфер применения просто… не нужна. А где нужна — работает старый добрый метод агрегации линий. Только каждая из них стала за прошедшие годы вчетверо быстрее, т. е. PCIe 3.0 х4 — это PCIe 1.0 x16, самый быстрый слот в компьютерах середины нулевых. Именно этот вариант поддерживают топовые контроллеры SSD, и именно его рекомендуется использовать. Понятно, что если такая возможность есть — много не мало. А если ее нет? Будут ли возникать какие-то проблемы, и если да, то какие? Вот с этим-то вопросом нам и предстоит разобраться.

Методика тестирования

Провести тесты с разными версиями стандарта PCIe несложно: практически все контроллеры позволяют использовать не только поддерживаемый ими, но и все более ранние. Вот с количеством линий — сложнее: нам хотелось непосредственно протестировать и варианты с одной-двумя линиями PCIe. Используемая нами обычно плата Asus H97-Pro Gamer на чипсете Intel H97 полного набора не поддерживает, но кроме «процессорного» слота х16 (который обычно и используется) на ней есть еще один, работающий в режимах PCIe 2.0 х2 или х4. Вот этой тройкой мы и воспользовались, добавив к ней еще и режим PCIe 2.0 «процессорного» слота, дабы оценить, есть ли разница. Все-таки в этом случае между процессором и SSD посторонних «посредников» нет, а вот при работе с «чипсетным» слотом — есть: собственно чипсет, фактически соединяющийся с процессором тем же PCIe 2.0 x4. Можно было добавить еще несколько режимов работы, но основную часть исследования мы все равно собирались провести на другой системе.

Дело в том, что мы решили воспользоваться случаем и заодно проверить одну «городскую легенду», а именно поверие о полезности использования топовых процессоров для тестирования накопителей. Вот и взяли восьмиядерный Core i7-5960X — родственника обычно применяемого в тестах Core i3-4170 (это Haswell и Haswell-E), но у которого ядер в четыре раза больше. Кроме того, обнаруженная в закромах плата Asus Sabertooth X99 нам сегодня полезна наличием слота PCIe x4, на деле способного работать как х1 или х2. В этой системе мы протестировали три варианта х4 (PCIe 1.0/2.0/3.0) от процессора и чипсетные PCIe 1.0 х1, PCIe 1.0 х2, PCIe 2.0 х1 и PCIe 2.0 х2 (во всех случаях чипсетные конфигурации отмечены на диаграммах значком (c)). Есть ли смысл сейчас обращаться к первой версии PCIe, с учетом того, что вряд ли найдется хоть одна плата с поддержкой только этой версии стандарта, способная загрузиться с NVMe-устройства? С практической точки зрения — нет, а вот для проверки априори предполагаемого соотношения PCIe 1.1 х4 = PCIe 2.0 х2 и подобных оно нам пригодится. Если проверка покажет, что масштабируемость шины соответствует теории, значит, и неважно, что нам не удалось пока получить практически значимые способы подключения PCIe 3.0 x1/х2: первый будет идентичен как раз PCIe 1.1 х4 или PCIe 2.0 х2, а второй — PCIe 2.0 х4. А они у нас есть.

В плане ПО мы ограничились только Anvil’s Storage Utilities 1.1.0: разнообразные низкоуровневые характеристики накопителей она измеряет неплохо, а ничего другого нам и не нужно. Даже наоборот: любое влияние других компонентов системы является крайне нежелательным, так что низкоуровневая синтетика для наших целей безальтернативна.

В качестве «рабочего тела» мы использовали Patriot Hellfire емкостью 240 ГБ. Как было установлено при его тестировании, это не рекордсмен по производительности, но его скоростные характеристики вполне соответствуют результатам лучших SSD того же класса и той же емкости. Да и более медленные устройства на рынке уже есть, причем их будет становиться все больше. В принципе, можно будет повторить тесты и с чем-нибудь более быстрым, однако, как нам кажется, необходимости в этом нет — результаты предсказуемы. Но не станем забегать вперед, а посмотрим, что же у нас получилось.

Результаты тестов

Тестируя Hellfire, мы обратили внимание на то, что максимальную скорость на последовательных операциях из него можно «выжать» лишь многопоточной нагрузкой, так что это тоже надо принимать во внимание на будущее: теоретическая пропускная способность на то и теоретическая, что «реальные» данные, полученные в разных программах по разным сценариям, будут больше зависеть не от нее, а от этих самых программ и сценариев — в том случае, конечно, когда не помешают обстоятельства непреодолимой силы 🙂 Как раз такие обстоятельства мы сейчас и наблюдаем: выше уже было сказано, что PCIe 1.x x1 — это ≈200 МБ/с, и именно это мы и видим. Две линии PCIe 1.x или одна PCIe 2.0 — вдвое быстрее, и именно это мы и видим. Четыре линии PCIe 1.x, две PCIe 2.0 или одна PCIe 3.0 — еще вдвое быстрее, что подтвердилось для первых двух вариантов, так что и третий вряд ли будет отличаться. То есть в принципе масштабируемость, как и предполагалось, идеальная: операции линейные, флэш с ними справляется хорошо, так что интерфейс имеет значение. Флэш перестает справляться хорошо на PCIe 2.0 x4 для записи (значит, подойдет и PCIe 3.0 x2). Чтение «может» больше, но последний шаг дает уже полутора-, а не двукратный (каким он потенциально должен быть) прирост. Также отметим, что заметной разницы между чипсетным и процессорным контроллером нет, да и между платформами тоже. Впрочем, LGA2011-3 немного впереди, но на самую малость.

Все ровно и красиво. Но шаблоны не рвет: максимум в этих тестах составляет лишь немногим больше 500 МБ/с, а это вполне по силам даже SATA600 или (в приложении к сегодняшнему тестированию) PCIe 1.0 х4 / PCIe 2.0 х2 / PCIe 3.0 х1. Именно так: не стоит пугаться выпуску бюджетных контроллеров под PCIe х2 или наличию лишь такого количества линий (причем версии стандарта 2.0) в слотах М.2 на некоторых платах, когда больше-то и не нужно. Иногда и столько не нужно: максимальные результаты достигнуты при очереди в 16 команд, что для массового ПО не типично. Чаще встречается очередь с 1-4 командами, а для этого обойтись можно и одной линией самого первого PCIe и даже самым первым SATA. Впрочем, накладные расходы и прочее имеют место быть, так что быстрый интерфейс полезен. Однако излишне быстрый — разве что не вреден.

А еще в этом тесте по-разному ведут себя платформы, причем с единичной очередью команд — принципиально по-разному. «Беда» вовсе не в том, что много ядер — плохо. Они тут все равно не используются, разве что одно, и не настолько, чтоб вовсю развернулся буст-режим. Вот и имеем разницу где-то в 20% по частоте ядер и полтора раза по кэш-памяти — она в Haswell-E работает на более низкой частоте, а не синхронно с ядрами. В общем, топовая платформа может пригодиться разве что для вышибания максимума «йопсов» посредством максимально многопоточного режима с большой глубиной очереди команд. Жаль только, что с точки зрения практической работы это совсем уж сферическая синтетика в вакууме 🙂

На записи положение дел принципиально не изменилось — во всех смыслах. Но, что забавно, на обеих системах самым быстрым оказался режим PCIe 2.0 х4 в «процессорном» слоте. На обеих! И при многократных проверках/перепроверках. Тут уж поневоле задумаешься, нужны ли эти ваши новые стандарты или лучше вообще никуда не торопиться…

При работе с блоками разного размера теоретическая идиллия разбивается о то, что повышение скорости интерфейса все же имеет смысл. Результирующие цифры такие, что хватило бы пары линий PCIe 2.0, но реально в таком случае производительность ниже, чем у PCIe 3.0 х4, пусть и не в разы. И вообще тут бюджетная платформа топовую «забивает» в куда большей степени. А ведь как раз такого рода операции в основном в прикладном ПО и встречаются, т. е. эта диаграмма — наиболее приближенная к реальности. В итоге нет ничего удивительного, что никакого «вау-эффекта» толстые интерфейсы и модные протоколы не дают. Точнее, переходящему с механики — дадут, но ровно такой же, какой ему обеспечит любой твердотельный накопитель с любым интерфейсом.

Итого

Для облегчения восприятия картины по больнице в целом мы воспользовались выдаваемым программой баллом (суммарным — по чтению и записи), проведя его нормирование по «чипсетному» режиму PCIe 2.0 x4: на данный момент именно он является наиболее массово доступным, поскольку встречается даже на LGA1155 или платформах AMD без необходимости «обижать» видеокарту. Кроме того, он эквивалентен PCIe 3.0 x2, который готовятся освоить бюджетные контроллеры. Да и на новой платформе AMD АМ4, опять же, именно этот режим как раз можно получить без влияния на дискретную видеокарту.

Итак, что мы видим? Применение PCIe 3.0 x4 при наличии возможности является, безусловно, предпочтительным, но не необходимым: NVMe-накопителям среднего класса (в своем изначально топовом сегменте) он приносит буквально 10% дополнительной производительности. Да и то — за счет операций в общем-то не столь уж часто встречающихся на практике. Для чего же в данном случае реализован именно этот вариант? Во-первых, была такая возможность, а запас карман не тянет. Во-вторых, есть накопители и побыстрее, чем наш тестовый Patriot Hellfire. В-третьих, есть такие области деятельности, где «атипичные» для настольной системы нагрузки — как раз вполне типичные. Причем именно там наиболее критично быстродействие системы хранения данных или, по крайней мере, возможность сделать ее часть очень быстрой. Но к обычным персональным компьютерам это все не относится.

В них, как видим, и использование PCIe 2.0 x2 (или, соответственно, PCIe 3.0 х1) не приводит к драматическому снижению производительности — лишь на 15-20%. И это несмотря на то, что потенциальные возможности контроллера в этом случае мы ограничили в четыре раза! Для многих операций и такой пропускной способности достаточно. Вот одной линии PCIe 2.0 уже недостаточно, поэтому контроллерам имеет смысл поддерживать именно PCIe 3.0 — и в условиях жесткой нехватки линий в современной системе это будет работать неплохо. Кроме того, полезна ширина х4 — даже при отсутствии поддержки современных версий PCIe в системе она все равно позволит работать с нормальной скоростью (пусть и медленнее, чем могло бы потенциально), если найдется более-менее широкий слот.

В принципе, большое количество сценариев, в которых узким местом оказывается собственно флэш-память (да, это возможно и присуще не только механике), приводит к тому, что четыре линии третьей версии PCIe на этом накопителе обгоняют одну первой примерно в 3,5 раза — теоретическая же пропускная способность этих двух случаев различается в 16 раз. Из чего, разумеется, не следует, что нужно спешно бежать осваивать совсем медленные интерфейсы — их время ушло безвозвратно. Просто многие возможности быстрых интерфейсов могут быть реализованы лишь в будущем. Или в условиях, с которыми обычный пользователь обычного компьютера никогда в жизни непосредственно не столкнется (за исключением любителей меряться известно чем). Собственно, и всё.

Накопители NVMe SSD становятся стандартом для всех СХД на базе флеш-памяти | Журнал сетевых решений/LAN

NVMe — разработано для флеш-памяти

Что такое NVMe? Спецификация на протоколы доступа к твердотельным накопителям (SSD), подключенным по шине PCI Express, (от англ. Non-Volatile Memory Express), разработанная рабочей группой из более сотни компаний. В чем преимущество стека NVMe? Очевидно, он обеспечивает беспрецедентную скорость и максимальную пропускную способность для твердотельных накопителей. Обычные SSD не обеспечивают пропускной способности, необходимой приложениям с особенно интенсивным обменом данными, таких как массивные базы данных, для которых NVMe дает небывало низкие задержки и высокие пиковые скорости.

Стандартные интерфейсы чрезвычайно важны для роста использования флеш-памяти. NVMe дает стандартный метод доступа к флеш-памяти, способный использовать возможности низкой задержки и параллелизма интерфейсов PCIe, современных процессоров, платформ и приложений. Сокращение задержек при работе протокола и увеличение параллелизма значительно повышают производительность операций чтения/записи SSD при одновременном контроле затрат на хранение. Потенциал флеш-памяти до конца не реализован, и использование SSD в центрах обработки данных продолжает расширяться.

Обычные протоколы SAS предназначены для механических жестких дисков. Быстрое развитие флеш-носителей и постоянно растущая потребность в улучшенной производительности различных систем обозначили недостатки SAS-протоколов. Протоколы признаны слабым звеном в разработке СХД на базе флеш-памяти. По сравнению с жесткими дисками SAS пропускная способность и максимальное количество операций ввода-вывода в секунду (IOPS) на SSD значительно улучшились, а в некоторых случаях задержка была снижена до сверхнизкого уровня 100 мкс. Емкость SSD продолжает расти. Возникает вопрос: как решить проблему слабого звена – протокола передачи? Организация NVM Express разработала стандарт протокола NVMe, удалив планировщик ввода-вывода и сложные уровни протокола SCSI в системах жестких дисков SAS, заменив их на легкий стек NVMe.

Стек протокола NVMe
Стек протокола NVMe

 

NVMe дает огромный рост эффективности, поскольку для каждой операции ввода-вывода требуется менее половины цикла процессора SAS. Другими словами, NVMe дает в два раза больше IOPS, чем SAS при аналогичном цикле процессора. Недостатки SAS очевидны:

  1. Больше взаимодействий, (требуется преобразование между PCIe и сложным стеком SAS/SCSI, а затраты на обработку весьма высоки), это затрудняет получение большего количества IOPS. Диски NVMe могут напрямую подключаться к интерфейсам PCIe, упрощая взаимодействие протоколов для повышения производительности.
  2. Протокол SAS поддерживает одну очередь, а NVMe — до 65536 (64K) очередей, каждая с глубиной до 65536 команд. Множественные очереди позволяют достичь высокого уровня параллелизма при обработке, для соответствия высокой производительности многоканальных микросхем с выбором кристалла, присущей SSD. Механизмы блокировки должны быть добавлены к одиночным очередям SAS в многоядерных средах, тогда как NVMe сразу поддерживает механизмы без блокировки, чтобы максимально использовать преимущества параллелизма для настройки нескольких ядер при одновременном снижении накладных расходов.

NVMe, безусловно, более эффективный протокол, но относительно новый. Протокол SAS проверен многолетней практикой, является весьма зрелым и, соответственно, обладает некоторыми преимуществами:

  1. Собственная поддержка многопортовых и двухпортовых дисковых технологий. Протокол стабилен и надежен в многоядерных системах, в то время как двухпортовая технология PCIe по-прежнему нуждается в доработке.
  2. Хорошая поддержка операций «горячей» замены. Механизмы ввода-вывода не позволяют неисправностям распространяться по всей системе. Добавление функции «горячей замены» в PCIe технологически сложно, что означает необходимость накопления информации, прежде чем будет обеспечена высокая надежность протокола.
  3. Сеть SAS гибкая и легко масштабируется. Особенности сетевого развертывания были полностью учтены с самого начала разработки протокола SAS. Опора протокола на обмен маршрутами упрощает последующее расширение. Напротив, масштабируемость PCIe довольно ограничена, когда речь идет о глубине каскада и общем количестве поддерживаемых устройств.

Системы хранения SSD на основе SAS используются в обычных высокопроизводительных средах, в то время как системы хранения на базе NVMe широко используются в сценариях, чувствительных к задержкам. SAS будет использоваться еще долгое время, ведь NVMe имеет определенные особенности обслуживания.

Аналитики прогнозируют, что поставки SSD превысят объемы SAS в 2017 году, и этот разрыв заметно увеличится с течением времени. PCIe SSD является основным направлением развития, для которого лучше всего подходит протокол NVMe. Ускоряющиеся темпы развертывания ЦОД и облачных решений также повышает привлекательность NVMe SSD для сценариев гибридных приложений. Для высокоскоростных операций с кэш-памятью используются новые носители SCM, такие как 3D XPoint. Сверхвысокие требования к производительности могут быть реализованы только за счет использования линий PCIe, что стимулирует дальнейшую разработку и использование стека NVMe. Помимо использования в локальных SSD-модулях PCIe, организация NVM Express выпустила в июне 2016 года спецификацию NVMe over Fabrics, что позволило перенести стек на протоколы RDMA/FC и тем самым обеспечить высокопроизводительное решение для удаленного доступа к твердотельным накопителям и решить проблему совместного использования межсайтовых и локальных ресурсов SSD.

В чем заключаются проблемы СХД с применением NVMe?

NVMe — это новый протокол, основанный на технологии PCIe. Несмотря на большие успехи, достигнутые с точки зрения производительности, имеется ряд проблем, связанных с конструкцией дисков и систем.

NVMe SSD представляет собой тип жесткого диска, поэтому он должен обладать возможностями быстрой замены без прерывания обслуживания. Однако PCIe не обладает надежными возможностями «горячей» замены, особенно когда речь заходит о внезапной «горячей» установке PCIe. В результате некоторые настройки могут привести к прерыванию обслуживания и ошибкам системы. Кроме того, СХД корпоративного класса требуют высокой надежности и, следовательно, дублированной схемы контроллеров как минимум, в то время как реализация двухпортовой технологии на основе PCIe в конструкции SSD представляет определенные сложности. Некоторые из выпускаемых дисков SSD не имеют встроенных двухпортовых PCIe (например, ряд SSD NVMe от Intel, которые используют внутренний PCIe-коммутатор для реализации дублированных портов. Использование таких упрощенных схем защиты неизбежно приведет к снижению надежности системы.

Еще одним вызовом для NVMe СХД является сложность проведения оптимизации на системном уровне. Некоторые полагают, что использование системы NVMe в качестве простого накопителя NVMe SSD дает огромные преимущества в производительности системы. Однако не все так просто. Архитектура системы ввода-вывода требует доработки, чтобы сделать ее более подходящей для параллельной обработки в многоядерных конфигурациях. Такая доработка позволит полностью использовать преимущества NVMe.

Опыт Hiawei в области NVMe

Huawei начала изучать флеш-технологии в 2005 году. Двенадцать лет накопленного опыта и непрерывных инвестиций позволили компании получить многочисленные основные патенты в этой области, и большинство из них относятся к твердотельным накопителям. Сегодня Huawei является единственным самостоятельным производителем операционных систем хранения данных, контроллеров и твердотельных накопителей, что дает ей единственную в своем роде возможность осуществлять сквозную оптимизацию флеш-технологий. Клиенты могут наслаждаться отличными возможностями услуг обработки данных, привнесенными революцией в области флеш-технологий, используя комплексные продукты и решения, предоставляемые Huawei, не говоря уже о собственной открытой экосистеме компании. Благодаря полнейшему портфелю продуктов и решений в отрасли и участию в открытой экосистеме, Huawei позволяет клиентам использовать преимущества технологий услуг обработки, которые стали возможными благодаря революции в области флеш-памяти.

SSD-накопители Huawei поддерживают двухпортовую технологию. Два порта PCIe 3.0×2 независимы друг от друга. Это позволяет устранить взаимные помехи, обеспечивая при этом улучшенную работоспособность в процессе восстановления системы и обработки исключений. Дублированием контроллера также обеспечивается повышенная надежность системы.

Обработка исключений в конфигурациях PCIe довольно сложна, особенно когда дело доходит до обеспечения надежности системы при неожиданном добавлении устройства. Huawei уже много лет инвестирует в исследования PCIe и имеет максимально полное представление об управлении каналами, обработке исключений и возможностях «горячей замены» для повышения надежности системы, так как замена диска может выполняться без прерывания обслуживания и ошибок.

«Горячая» замена NVMe SSD
«Горячая» замена NVMe SSD

 

На рисунке выше при выполнении «горячей» замены NVMe SSD переводит PCIe в неисправное состояние. SSD могут быть извлечены в любое время и любым способом в системе OceanStor Dorado V3 Huawei, что является явным преимуществом для систем NVMe. В конструкции диска PCIe предусматриваются следующие варианты использования:

  • При стандартном процессе обработки ошибки AER будут передаваться до тех пор, пока процесс ввода-вывода не будет остановлен на обслуживаемой стороне, что может привести к шквалу ошибок и, в свою очередь, сильно усложнить процедуру обработки. Huawei отключает AER на диске PCIe, после чего отключаются процессы ввода-вывода. В результате распространение шквала ошибок останавливается.
  • Если операция извлечения выполняется не достаточно быстро, то канал восстанавливается и ошибки распространяются в обратном направлении. Для этого случая в системе Huawei предусмотрено быстрое отключение каналов диска PCIe в процессе обработки.
  • В случае обнаружения неожиданного «горячего» добавления устройства запуск функции DPC (отключение нижестоящего порта) может быть инициирован другими критическими ошибками, хотя ошибка «Неожиданное отключение» не возникает. Отключение канала может пройти быстрее, и возврат пакетов, отправленных на верхний уровень, происходит гораздо быстрее, чем при стандартных процессах обработки.
  • Даже при медленном извлечении дисков функция быстрого разъединения линии связи поможет обеспечить надежность системы.

В разработке систем NVMe компании Huawei помогает богатый опыт работы с жесткими дисками, в основе которого лежат всесторонний мониторинг работоспособности, прогнозирование жизненного цикла, мониторинг неисправностей аппаратного и программного обеспечения, а также средства восстановления и изоляции носителей, работающих в этих окружениях. Всё это помогает сгладить процесс развертывания NVMe. Запатентованная функция включения/выключения питания через разъем P3 обеспечивает эффективное решение для устранения аппаратных неисправностей и большинства программных сбоев на SSD, что эффективно снижает частоту отказов.

Для использования высокой производительности NVMe необходима оптимизация на уровне системы. Huawei разработала набор механизмов определения очередности операций ввода-вывода. Эти механизмы полностью удаляют мьютексы(блокировки) на уровне диска из трактов ввода-вывода, чтобы избежать конфликтов при блокировке очереди. Данный подход существенно улучшает производительность обработки на стороне хранилища. Пример схемы определения очередности операций ввода-вывода приведен ниже; показаны несколько потоков и очередей (такая схема позволяет добиться максимальной производительности).

Очередность операций ввода-вывода в системах NVMe
Очередность операций ввода-вывода в системах NVMe

 

Huawei полностью готова вступить в эру All-flash NVMe

Система хранения Huawei OceanStor Dorado V3 на базе флеш-накопителей предназначена для поддержки критически важных тяжело нагруженных приложений организаций любого масштаба. Массивы обеспечивают производительность до 4 миллионов IOPS при сохранении прогнозируемого и стабильного уровня задержки в 0,5 мс. Организации ускоряют работу своих основных процессов при обеспечении полной надежности системы. OceanStor Dorado V3 работает по протоколу NVMe, а недавно разработанная аппаратная архитектура поддерживает двухпортовые SSD-накопители NVMe и возможности «горячей» замены в непредвиденных ситуациях. Недавно разработанная параллельная программная архитектура обеспечивает максимальные эксплуатационные преимущества NVMe.

Huawei OceanStor Dorado5000 V3
Huawei OceanStor Dorado5000 V3

 

Huawei полностью готова к All-flash NVMe и продолжает вкладывать средства в развитие систем хранения на базе NVMe. Huawei представила новый носитель SCM для еще большей производительности. Выпуск спецификации NVMe over Fabrics обеспечивает глобальный совместный доступ к ресурсам SSD, а предоставление внешних интерфейсов NVMe помогает оптимизировать аппаратную и программную архитектуру системы, повышая конкурентоспособность хранилищ All-flash в новой эре.

Накопители NVMe SSD становятся стандартом для всех СХД на базе флеш-памяти

Поделитесь материалом с коллегами и друзьями

Действительно ли PCI Express 4.0 – важное преимущество Ryzen 3000? Проверяем на NVMe SSD

Одним из ключевых направлений в маркетинговой стратегии AMD по продвижению процессоров Ryzen 3000 стал акцент на появившейся в них поддержке скоростного интерфейса PCI Express 4.0. Действительно, новые Ryzen, построенные на микроархитектуре Zen 2, стали первыми процессорами потребительского уровня, которые получили этот скоростной интерфейс, и, более того, ни одна из актуальных платформ Intel пункта PCI Express 4.0 в списке характеристик на сегодняшний день не имеет. Не использовать такой повод для выпячивания прогрессивности своей продукции AMD, естественно, не могла, и поэтому как в момент анонса Ryzen 3000, так и после него представители компании не упустили ни единого случая козырнуть соответствующей возможностью.

Доводы AMD в пользу новой шины, которая позволяет выделять для устройств интерфейс с вдвое большей, чем раньше, пропускной способностью, сводились к двум тезисам: «это хорошо для графических карт» и «это хорошо для твердотельных накопителей». Однако, честно говоря, их аргументация безупречностью не отличалась.

Говоря о пользе перехода на шину PCI Express 4.0 для графических карт, представители AMD ссылаются на синтетический тест пропускной способности 3DMark, который действительно показывает 69-процентное улучшение производительности при использовании более скоростной версии шины.

Однако к этому нужно приложить два больших но, о которых AMD умалчивает. Во-первых, поддерживают PCI Express 4.0 лишь избранные видеокарты, относящиеся к сериям Radeon RX 5700 и RX 5500, в то время как представители семейства GeForce вполне успешно обходятся традиционным интерфейсом PCI Express 3.0. Во-вторых, если говорить о реальной игровой нагрузке, то она заведомо не создаёт таких объёмов данных, которым не хватало бы пропускной способности общеупотребительной графической шины PCI Express 3.0 x16, достигающей 16 Гбайт/с. Более того, даже использование интерфейса PCI Express 2.0 снижает частоту кадров в популярных играх в разрешении 4K на единицы процентов, а разница в быстродействии GPU при соединении с процессором при использовании третьей и четвёртой версии шины в самом неблагоприятном случае составляет десятые доли процента.

Перевод твердотельных накопителей на работу через PCI Express 4.0 кажется куда более осмысленным шагом, ведь современные NVMe SSD и впрямь подобрались к пределу пропускной способности шины PCI Express 3.0 x4. Увеличение скорости интерфейса за счёт добавления линий PCI Express при этом было бы не слишком удобным выходом, поскольку потребительские SSD прочно вжились в форм-фактор M.2, позволяющий подвести к накопителю не более четырёх линий. Зато переключение на PCI Express 4.0 можно без проблем провести в рамках сложившейся экосистемы, и это действие кажется вполне осмысленным, ведь оно позволяет поднять планку пиковых скоростей с 3,9 до 7,9 Гбайт/с. Именно на это и указывают маркетинговые материалы AMD, в которых компания заявляет о почти полуторакратном росте производительности дисковой подсистемы в системах на базе процессоров Ryzen 3000.

Но и тут не всё так просто. В первую очередь нужно понимать, что речь идёт исключительно о росте линейных скоростей, в то время как в отзывчивости твердотельные накопители за счёт перевода на более скоростной интерфейс определённо не выиграют, потому что здесь всё определяется не внешней шиной, а их внутренней архитектурой и возможностями флеш-памяти. То есть в распространённых среднестатистических сценариях такого впечатляющего прироста, который изображён на маркетинговом слайде AMD, конечно же, не будет.

К тому же стоит учесть и ещё один немаловажный момент: ведущие производители SSD пока не поддерживают PCI Express 4.0 в своих продуктах. Поэтому, если вы захотите установить в свою Ryzen 3000-систему NVMe-накопитель с новым скоростным интерфейсом, выбирать придётся среди предложений фирм второго-третьего эшелона. И более того, все SSD с поддержкой шины PCI Express 4.0 x4 однотипны и полагаются на один и тот же контроллер PS5016-E16 независимого тайваньского разработчика Phison, инженеры которого пока не смогли отметиться какими-либо заметными достижениями на поприще создания высокопроизводительных платформ для потребительских SSD. Иными словами, особого оптимизма такие SSD не вызывают.

Тем не менее мы не привыкли полагаться на какие-то оценочные суждения и всё стараемся проверять на практике. Тем более что вопрос о том, какой SSD стоит рекомендовать обладателю современной системы на базе Ryzen 3000, стремящемуся выжать из неё максимум возможного, отнюдь не праздный. Накопители на базе контроллера Phison PS5016-E16 с поддержкой PCI Express 4.0 x4 наконец-то добрались до отечественных магазинов. А значит, многие покупатели, решившие остановить свой выбор на актуальной и многообещающей платформе AMD, встают перед выбором: то ли установить в систему проверенный временем производительный SSD с интерфейсом PCI Express 3.0; то ли поддаться на агитацию AMD и Phison и попробовать получить более высокую производительность, связавшись с новинками с поддержкой PCI Express 4.0. В этом материале мы постараемся выяснить, что лучше, протестировав оба варианта в реальных условиях.

⇡#Почему мы вообще заговорили про PCI Express 4.0

Спецификация PCI Express 3.0 была утверждена в ноябре 2010 года, и нет ничего удивительного, что к настоящему времени эта шина прочно закрепилась в роли базового интерфейса для сопряжения компьютерных устройств. Особенно помогло этому два фактора: затянувшаяся разработка следующей версии стандарта, с одной стороны, и отсутствие запроса на скорости выше возможностей PCI Express 3.0 — с другой. Тем не менее постепенно индустрия всё же пришла к осознанию необходимости дальнейшего прогресса, в чём особенно посодействовали твердотельные накопители. Бурный рост в этой отрасли привёл к тому, что SSD смогли быстро упереться в скоростные ограничения имеющегося интерфейса, и вывод на массовый рынок PCI Express 4.0 действительно обрёл смысл.

Стандарт PCI Express 4.0 был принят в июне 2017 года. В нём улучшилась гибкость и масштабируемость — например, учтена возможность физической реализации не только в виде слотов и дорожек на плате, но и в виде внешних разъёмов и кабелей; добавлены дополнительные управляющие команды для целей энергосбережения; ну и самое главное — удвоена скорость передачи данных. Что не менее важно, все эти улучшения не повлекли за собой никаких принципиальных изменений в протоколе. Двукратное увеличение пропускной способности достигнуто простым ростом частоты передачи данных с сохранением старой схемы кодирования сигнала. В результате между новым и старым стандартами сохраняется как прямая, так и обратная совместимость, а значит, хосты и оконечные устройства с поддержкой разных версий PCI Express могут без каких-либо проблем работать друг с другом.

Обмен данными по шине PCI Express 3.0 происходит с частотой 8 млрд пересылок в секунду, а в стандарте PCI Express 4.0 эта частота достигает уже 16 млрд пересылок в секунду. Таким образом, в то время как пропускная способность одной линии PCI Express 3.0 составляла 985 Мбайт/с (с учётом 128b/130b-кодирования), в стандарте PCI Express 4.0 она выросла вдвое – до 1969 Мбайт/с. Далее естественным образом расширились полосы пропускания всех стандартных для массовых ПК шин. Скорость PCI Express 4.0 x4 увеличилась до 7,9 Гбайт/с, а шина PCI Express 4.0 x16 оказалась способна пересылать данные с максимальной пропускной способностью 31,5 Гбайт/с (в каждую сторону).

  Пропускная способность, Гбайт/с
×1 ×2 ×4 ×8 ×16
PCI Express 1.0 0,25 0,5 1,0 2,0 4,0
PCI Express 2.0 0,5 1,0 2,0 4,0 8,0
PCI Express 3.0 0,98 1,97 3,94 7,88 15,75
PCI Express 4.0 1,97 3,94 7,88 15,75 31,51

Новая версия платформы Socket AM4, использующая набор системной логики X570, оказалась первой и пока единственной точкой присутствия PCI Express 4.0 в массовых системах. Благодаря ей пользователи могут построить систему с новой высокоскоростной шиной уже сегодня, но, чтобы проверить эту скоростную шину в деле, нужны сразу три компонента. Во-первых, процессор семейства Ryzen 3000, PCI Express-контроллер в котором поддерживает четвёртую версию соответствующего протокола. Во-вторых, материнская плата с чипсетом AMD X570, которая обладает оптимизированной разводкой сигнальных линий, способной гарантировать целостность информации при передаче по высокочастотной шине. И в-третьих, оконечное устройство с поддержкой PCI Express 4.0, которым может быть либо графическая карта, либо, как в нашем случае, твердотельный накопитель. В отсутствие одного из этих компонентов система всё равно будет работать благодаря двухсторонней совместимости версий PCI Express, но уже в более медленном, чем 4.0, режиме.

Таким образом, воспользоваться высокоскоростной шиной на практике пока получится лишь в очень небольшом числе настольных систем. Однако постепенно парк платформ с поддержкой PCI Express 4.0 будет расширяться. Так, в течение ближайших месяцев AMD планирует добавить этот интерфейс ещё в одном своём наборе логики – B550. Это позволит снизить входной ценовой порог для систем с поддержкой скоростных шин, но процессор семейства Ryzen 3000 будет всё равно необходим.

Что же касается продукции Intel, то в ней с поддержкой PCI Express 4.0 всё очень непросто. Микропроцессорный гигант почему-то пропустил момент, когда новая спецификация была готова, и теперь сильно отстал от AMD по срокам её внедрения. Отчётливо говорит за себя тот факт, что даже в серверном сегменте поддержка PCI Express 4.0 у Intel может появиться не ранее середины следующего года. Что же касается обычных персональных компьютеров на платформе Intel, то им скоростная шина «светит» совсем нескоро, поскольку в запланированных на 2020 год процессорах Comet Lake и в чипсетах 400-й серии предусмотрена лишь привычная PCI Express 3.0, а дальше планы компании выглядят очень неопределённо.

Иными словами, Intel в ближайшее время будет играть роль своеобразного тормоза прогресса, и можно сказать практически наверняка, что из-за этого внедрение PCI Express 4.0 будет происходить не такими быстрыми темпами, как того можно было бы ожидать. Например, если говорить о SSD, то на данный момент поддерживает эту скоростную шину лишь единственный контроллер разработки Phison, и появление каких-то альтернатив в обозримом будущем не предвидится. Особенно скептически к идее выпуска NVMe SSD под интерфейс PCI Express 4.0 в ближайшее время относятся ведущие производители масштаба Western Digital и Samsung. Судя по всему, они намерены дожидаться того момента, когда PCI Express 4.0 появится в платформах Intel, и массовые решения с его поддержкой предложат лишь в преддверии этого события.

Именно поэтому сегодня нам придётся говорить о полезности PCI Express 4.0 для потребительских NVMe SSD, используя в качестве иллюстрации лишь один пример – построенный на контроллере Phison PS5016-E16 накопитель Gigabyte Aorus NVMe Gen4 SSD.

⇡#Главный герой – Gigabyte Aorus NVMe Gen4 SSD

Хотя мы и вынесли в подзаголовок этого раздела название накопителя компании Gigabyte, который побывал у нас в лаборатории, всё сказанное ниже равным образом справедливо и для любого другого NVMe SSD на контроллере Phison PS5016-E16, и даже для любого другого доступного сейчас массового накопителя под PCI Express 4.0, покуда на рынке не появятся альтернативные чипы с поддержкой этого перспективного интерфейса. Сделать данное обобщение нам позволяет производственная стратегия Phison, не претерпевшая на протяжении последних лет никаких изменений. Дело в том, что этот разработчик контроллеров поставляет своим партнёрам не микросхемы, а уже готовые SSD с ними. Поэтому всё многообразие моделей накопителей на базе Phison PS5016-E16 – кажущееся. На самом деле все такие продукты сделаны по одним лекалам на одном и том же заводе и различаются лишь названиями, обвесом и аксессуарами, например системами охлаждения.

Это значит, что любой доступный в настоящее время накопитель с поддержкой PCI Express 4.0 имеет совершенно предсказуемую аппаратную конфигурацию: в его основе будет лежать контроллер PS5016-E16, который управляет TLC 3D NAND-памятью, относящейся к классу BiCS4. Такая память имеет 96-слойный дизайн и уже достаточно давно поставляется компанией Toshiba. Её, кстати, можно встретить не только в составе накопителей с интерфейсом PCI Express 4.0, но и в некоторых других моделях NVMe SSD с традиционным интерфейсом, например, в Kingston KC2000. Но для накопителя, который претендует на существенное улучшение скоростных характеристик, применение трёхбитовой BiCS4-памяти – момент принципиальный. Такая флеш-память работает быстрее предыдущих модификаций и способна лучше раскрыть потенциал внешней шины с удвоенной полосой пропускания.

Безусловно, для увеличения линейных скоростей, обеспечиваемых массивом флеш-памяти, всегда существует экстенсивный путь – наращивание в нём числа каналов. Однако платформа Phison PS5016-E16 продолжает опираться на традиционную восьмиканальную схему. И это вполне логично: добавление каналов сильно бы усложнило и схемотехнику накопителя, и дизайн самого контроллера. Инженеры же Phison при разработке своего первого PCI Express 4.0-контроллера отнеслись к нему как к переходному решению и потому особенно не напрягались. Архитектурно чип PS5016-E16 сильно похож на PCI Express 3.0-контроллер PS5012-E12 — с некоторыми улучшениями в микропрограмме и единственным аппаратно модернизированным блоком, отвечающим за реализацию внешнего интерфейса.

В остальном Phison PS5016-E16 почти не отличается от предшественника, с которым мы подробно знакомились на примере Silicon Power P34A80 и Gigabyte Aorus RGB M.2 NVMe SSD. Он представляет собой средний по вычислительной мощности чип, основанный на двухъядерном 32-битном процессоре ARM Cortex R5, который предлагает восемь каналов для подключения трёхбитовой или четырёхбитовой флеш-памяти с 800-МГц интерфейсом. Также в контроллере присутствует DRAM-контроллер для работы с буферной памятью, в роли которой может выступать DDR4 SDRAM. Кроме того, он обладает набором привычных фирменных технологий Phison, включая специальный сопроцессор CoXprocessor, обслуживающий технологию ускоренной записи, алгоритм LDPC-кодирования и исправления ошибок четвёртого поколения, аппаратное шифрование по схеме AES256 и прочее.

Весьма показательно, что в действительности мощности Phison PS5016-E16 для полного заполнения пропускной способности четырёх линий PCI Express 4.0 не хватает. В официальных спецификациях этого чипа значится максимальная скорость линейного чтения 5,0 Гбайт/с и записи – 4,4 Гбайт/с, что на треть ниже возможностей шины. Пиковая же производительность случайных операций ожидаемо близка к показателям PS5012-E12 и составляет 750 и 600 тысяч IOPS при чтении и записи соответственно. Иными словами, даже сама Phison не даёт оснований думать, что на базе PS5016-E16 можно собирать какие-то действительно высокопроизводительные NVMe SSD, которые можно было бы отнести к числу флагманских решений нового поколения. Тем не менее выбирать не приходится — других вариантов построить накопитель с поддержкой PCI Express 4.0 x4 на сегодня попросту нет.

В результате ради продвижения PCI Express 4.0 на массовый рынок конечным производителям накопителей вместе с AMD пришлось идти на определённый подлог и пытаться создавать вокруг платформы Phison E16 ореол элитного продукта, коим она с технической точки зрения являться не может. Проявляется псевдоэлитность, например, в том, что выбранный нами для тестирования Gigabyte Aorus NVMe Gen4 SSD стоит много, поставляется в крупной аккуратно оформленной строгой упаковке и комплектуется массивной и качественной системой охлаждения, сделанной из бруска меди. Когда берёшь в руки такое устройство, действительно начинает казаться, что это – премиальный и высокопроизводительный твердотельный накопитель для систем самого верхнего уровня.

Для тестов мы взяли версию Gigabyte Aorus NVMe Gen4 SSD объёмом 2 Тбайт. Это максимальный по ёмкости вариант такого накопителя. Поскольку 96-слойные кристаллы Toshiba BiSC4 имеют ёмкость 512 Гбит, массив флеш-памяти 2-Тбайт накопителя формируется из 32 NAND-устройств. Это, в свою очередь, означает, что в каналах контроллера Phison PS5016-E16 применяется четырёхкратное чередование, которое обеспечивает достижение наивысшей производительности. Иными словами, на примере Gigabyte Aorus NVMe Gen4 SSD мы увидим максимум того, на что способна платформа Phison PS5016-E16.

Разоблачённый Gigabyte Aorus NVMe Gen4 SSD со снятым радиатором выглядит совершенно обыденно. Это привычная взору энтузиаста М.2-плата форм-фактора 2280 с ключом типа M в ножевом разъёме. Понять по её внешнему виду, что этот накопитель умеет использовать четыре линии PCI Express 4.0, совершенно невозможно. Впрочем, не нужно забывать, что благодаря обратной совместимости такой SSD можно установить и в систему без поддержки новой версии интерфейса: в этом случае он будет использовать внешнюю шину в режиме 3.0.

При близком знакомстве с Gigabyte Aorus NVMe Gen4 SSD сразу же бросается в глаза, что его печатная плата практически не отличается по разводке от платы Gigabyte Aorus RGB M.2 NVMe SSD на базе прошлого контроллера PS5012-E12. И это значит, что новый PCI Express 4.0-контроллер Phison PS5016-E16 не только наследует от своего предшественника большую часть внутренних блоков, но и совместим с ним по выводам.

Но сам контроллер PS5016-E16 выглядит при этом не совсем привычно. Его верхняя поверхность закрыта никелированной медной пластиной, чего у чипов Phison ранее не наблюдалось. Объяснение простое: несмотря на то, что контроллер производится по 28-нм техпроцессу, его тепловыделение достигает под нагрузкой 6,7 Вт, и металлическая пластина может оказать содействие в теплоотводе.

 

На плате рассматриваемого SSD установлено четыре микросхемы флеш-памяти с маркировкой TABHG65AWV. Они нарезаны и упакованы на заводах тайваньской PTI из кремниевых полуфабрикатов Toshiba: такая память – вполне типичный вариант для накопителей на базе контроллеров Phison. Обычно использование таких «неродных» микросхем заставляет нас усомниться в качестве флеш-памяти, ведь за её отбор и сортировку в этом случае несёт ответственность не сама Toshiba, а некий посредник. Но накопители с контроллером Phison PS5016-E16, которые сейчас представлены на рынке, имеют высокий задекларированный ресурс, который для 2-Тбайт версии достигает 3,6 Пбайт. По всей видимости, для флагманского продукта Phison целенаправленно выбирает флеш-память наивысших градаций.

В дополнение к флеш-памяти и контроллеру на обеих сторонах накопителя расположено по чипу DDR4-1600 SDRAM. Используются гигабайтные микросхемы производства SK Hynix, то есть в сумме объём оперативной памяти, необходимой контроллеру для эффективной работы с таблицей трансляции адресов, на Gigabyte Aorus NVMe Gen4 SSD 2 Тбайт составляет типичные 2 Гбайт.

⇡#Антагонист – Samsung 970 EVO Plus

Так как продукты на базе контроллера Phison PS5016-E16 целятся занять верхнюю ступеньку в иерархии потребительских NVMe SSD, сравнивать с Gigabyte Aorus NVMe Gen4 SSD логично лучшие и быстрейшие модели, использующие для общения с системой привычную шину PCI Express 3.0. Поэтому нам показалось справедливым противопоставить накопителю Gigabyte самый популярный NVMe SSD компании Samsung – 970 EVO Plus, благо его 2-Тбайт модификация не так давно появилась в продаже.

Подробно рассказывать про внутреннее устройство Samsung 970 EVO Plus нет особого смысла – мы делали это уже несколько раз. Поэтому лишь коротко напомним принципиальные детали. В основе Samsung 970 EVO Plus лежит проприетарный контроллер Samsung Phoenix, который, как показала практика, отличается хорошим потенциалом производительности и феноменальной гибкостью. По первому пункту достаточно упомянуть, что в нём упрятан пятиядерный ARM-процессор, а по второму – напомнить, что этот контроллер фигурирует во всех современных NVMe SSD южнокорейского производителя, включая модели на MLC- и даже на SLC-памяти.

Вторая после контроллера составляющая, которая делает из Samsung 970 EVO Plus быстродействующую модель, это – особая флеш-память. В нём нашла применение фирменная TLC 3D V-NAND, относящаяся к пятому поколению. Кристаллы такой памяти получили монолитную 90-слойную конструкцию и значительно улучшенные характеристики производительности и энергопотребления. В результате Samsung 970 EVO Plus давно и уверенно удерживал звание самого быстрого массового NVMe SSD с TLC-памятью.

 

Интересно, что внешне Samsung 970 EVO Plus ёмкостью 2 Тбайт совершенно не отличается от накопителей этой же модели, но меньшей ёмкости. Это значит, что никаких мудрёных устройств охлаждения тут не предусмотрено и производитель полагает, что для защиты от перегрева будет достаточно лишь этикетки с внутренним слоем медной фольги, наклеенной на оборотную сторону накопителя. Которая, кстати говоря, не несёт на себе никаких микросхем.

Уникальность 970 EVO Plus 2 Тбайт состоит в том, что Samsung удалось собрать такой ёмкий SSD на односторонней M.2 2280-плате, а весь его массив флеш-памяти помещается всего в двух микросхемах. «Набить» в одну микросхему целый терабайт флеш-памяти компании Samsung удалось благодаря использованию кристаллов размером 512 Гбит, которые штабелируются по 16 штук – так умеют делать лишь немногие производители. Ещё одна микросхема на 970 EVO Plus 2 Тбайт – чип LPDDR4 SDRAM объёмом 2 Гбайт, так что вся компонентная база накопителя – это четыре микросхемы (включая контроллер).

Что касается характеристик, то версия 970 EVO Plus 2 Тбайт формально даже немного быстрее модификаций младшего объёма. Но проявляется это только в производительности мелкоблочных операций, которая заявлена на уровне 620 и 560 тысяч IOPS при чтении и записи соответственно, что чуть ниже, чем обещают накопители на контроллере Phison PS5016-E16. Линейные же скорости, ясное дело, ограничиваются пропускной способностью интерфейса PCI Express 3.0 и составляют 3,5 и 3,3 Гбайт/с при чтении и записи. Иными словами, на бумаге всё выглядит так, будто бы Samsung 970 EVO Plus против Gigabyte Aorus NVMe Gen4 SSD не имеет никаких шансов. Однако мы не раз ловили Phison на завышении паспортных показателей, поэтому не удивимся, если на практике картина будет совсем не такой.

В чём же Samsung 970 EVO Plus совершенно точно проигрывает дерзким конкурентам с поддержкой PCI Express 4.0, так это в условиях гарантийного обслуживания: южнокорейский производитель не готов разрешить пользователям столь же жёстко нагружать свои накопители. Задекларированный ресурс 970 EVO Plus 2 Тбайт составляет лишь 1,2 Пбайт – втрое меньше, чем у SSD на базе контроллера Phison PS5016-E16.

⇡#Таблица спецификаций

Все обещания Phison и её партнёров относительно производительности нового поколения PCI Express 4.0-накопителей на базе контроллера PS5016-E16 мы обобщили в следующей таблице, где паспортные характеристики Gigabyte Aorus NVMe Gen4 SSD 2 Тбайт сопоставляются с характеристиками Samsung 970 EVO Plus аналогичного объёма. И пусть такие данные обычно плохо соотносятся с реальным быстродействием SSD, зато по ним хорошо видно то бахвальство, вооружившись которым производители накопителей на платформе Phison E16 пытаются убедить владельцев новых Socket AM4-систем в рациональности выбора для использования совместно с процессорами семейства Ryzen 3000 именно таких носителей информации.

Производитель Gigabyte Samsung
Серия Aorus NVMe Gen4 SSD 970 EVO Plus
Модельный номер GP-ASM2NE6200TTTD MZ-V7S2T0
Форм-фактор M.2 2280
Интерфейс PCI Express 4.0 x4 – NVMe 1.3 PCI Express 3.0 x4 – NVMe 1.3
Ёмкость, Гбайт 2000 2000
Конфигурация
Микросхемы памяти: тип, интерфейс, техпроцесс, производитель Toshiba 96-слойная 512-Гбит TLC 3D NAND (BiCS4) Samsung 90-слойная 512-Гбит TLC 3D V-NAND
Контроллер Phison PS5016-E16 Samsung Phoenix
Буфер: тип, объём DDR4-1600, 2 Гбайт LPDDR4, 2 Гбайт
Производительность
Макс. устойчивая скорость последовательного чтения, Мбайт/с 5000 3500
Макс. устойчивая скорость последовательной записи, Мбайт/с 4400 3300
Макс. скорость произвольного чтения (блоки по 4 Кбайт), IOPS 750 000 620 000
Макс. скорость произвольной записи (блоки по 4 Кбайт), IOPS 700 000 560 000
Физические характеристики
Потребляемая мощность: бездействие/чтение-запись, Вт 0,02/6,6 0,03/6,0
MTBF (среднее время наработки на отказ), млн ч 1,77 1,5
Ресурс записи, Тбайт 3600 1200
Габаритные размеры: Д × В × Г, мм 23,5 × 80,5 × 11,4 22,15 × 80,15 × 2,38
Масса, г 95 8
Гарантийный срок, лет 5 5

⇡#Особенности SLC-кеширования

Каждый раз, когда мы говорим о показателях быстродействия, заявляемых производителями, нам приходится делать оговорку о том, что они относятся к работе SSD с SLC-кешем, в рамках которого все обращения к флеш-памяти происходят в однобитовом режиме. В ряде случаев это вполне уместно, поскольку многие твердотельные накопители предлагают SLC-кеш вполне достаточного объёма для весьма продолжительных операций, но это всё-таки верно не для любых потребительских NVMe SSD. Например, накопители, основанные на контроллерах Phison, всегда сильно страдали от того, что SLC-кеш в них работал по статическому алгоритму и имел очень небольшой размер, в результате чего пользователям приходилось часто сталкиваться с крутым падением скорости при копировании или записи крупных файлов.

К счастью, в микропрограмме для контроллера PS5016-E16 разработчики Phison наконец-то смогли исправить застаревшую проблему и впервые реализовали прогрессивный динамический алгоритм SLC-кеширования. Это значит, что информация записывается на накопитель в SLC-режиме до тех пор, пока это позволяет свободное место, а перевод ячеек TLC 3D NAND в штатный трёхбитовый режим происходит в моменты простоя. Иными словами, о высокой скорости записи на Gigabyte Aorus NVMe Gen4 SSD можно не беспокоиться – она действительно может быть обеспечена для очень больших объёмов данных.

В этом отношении накопителю на базе платформы Phison E16 может позавидовать даже Samsung 970 EVO Plus, в котором применяется не столь эффективная комбинированная схема ускоренной записи Intellegent TurboWrite. Например, в двухтерабайтной версии 970 EVO Plus SLC-кеш состоит из 6-гигабайтной статической и изменяемой динамической части, но его максимальный объём даже на абсолютно чистом накопителе ограничен величиной 78 Гбайт. В то же время на Gigabyte Aorus NVMe Gen4 SSD аналогичного объёма в ускоренном режиме можно заполнить треть свободного места, то есть на пустом SSD вместимость SLC-кеша может достигать 667 Гбайт.

Проиллюстрировать всё это очень легко при помощи графика максимальной скорости непрерывной последовательной записи на чистые накопители Gigabyte Aorus NVMe Gen4 SSD 2 Тбайт и Samsung 970 EVO Plus 2 Тбайт.

Здесь очень хорошо видно, насколько больше информации может принять Gigabyte Aorus NVMe Gen4 SSD 2 Тбайт по сравнению с Samsung 970 EVO Plus 2 Тбайт на заявленной в спецификации скорости. Хотя справедливости ради стоит отметить, что и у 970 EVO Plus размер SLC-кеша таков, что выйти за его пределы в реальных условиях не получится в 99,9 % случаев. Но даже если вести речь о производительности линейной записи в SLC-режиме, то накопитель на платформе Phison E16 выглядит привлекательнее благодаря поддержке PCI Express 4.0. Здесь её уместность неоспорима: скоростной интерфейс позволяет записывать информацию на накопитель быстрее, так как восьмиканальный массив флеш-памяти в SLC-режиме имеет большую пропускную способность, нежели четыре линии PCI Express 3.0.

Однако в «родном» TLC-режиме массив флеш-памяти в Samsung 970 EVO Plus оказывается гораздо производительнее. В накопителе ёмкостью 2 Тбайт он обеспечивает скорость записи на уровне 1,3 Гбайт/с, в то время как в Gigabyte Aorus NVMe Gen4 SSD 2 Тбайт скорость записи после заполнения SLC-кеша падает до 530 Мбайт/с. Впрочем, данный результат вряд ли имеет какую-то практическую ценность: мы ведь говорим о накопителях для десктопов, а в таких системах не бывает задач, которые требуют непрерывно сохранять на носитель информации сотни гигабайт с максимально возможной скоростью.

Другое дело – операции чтения. Phison относится к числу производителей, которые освоили оптимизацию своих продуктов под бенчмарки. Она заключается в том, что файлы, записанные на накопитель, остаются в SLC-кеше ещё на некоторое время для того, чтобы обращения к ним, выполняемые после записи, обслуживались быстрее. Этот нехитрый приём не приносит никакой пользы при реальной работе, но сильно влияет на результаты тестов, потому что измерение скорости чтения из файла сразу после создания такого файла – это типичный сценарий, по которому действуют почти все бенчмарки.

Проиллюстрировать, как работает такой фокус, очень несложно. На следующем графике показана скорость случайного мелкоблочного чтения данных из файла на Gigabyte Aorus NVMe Gen4 SSD 2 Тбайт и Samsung 970 EVO Plus 2 Тбайт как сразу после его создания, так и после того, как на SSD вслед за тестовым файлом записано ещё некоторое количество информации.

Наглядно видно, что в Samsung 970 EVO Plus свежий файл сразу же отправляется из SLC-кеша в основной массив TLC-памяти, после чего накопитель обеспечивает для него скорость мелкоблочного чтения без очереди запросов на уровне 46,5 Мбайт/с. Накопитель же на базе платформы Phison E16 сохраняет свежий файл в SLC-кеше ещё на некоторое время, и при этом скорость чтения случайными блоками оказывается феноменально высокой – около 56 Мбайт/с. Но ненадолго. Если следом после тестового файла на накопитель сохранить ещё какое-то количество информации, то он переедет в основной массив TLC-памяти и скорость мелкоблочного доступа снизится до 40 Мбайт/с – именно с таким уровнем производительности и будут иметь дело реальные пользователи.

Всё это значит буквально следующее: не надо верить популярным бенчмаркам вроде CrystalDiskMark. Они для NVMe SSD с контроллером Phison PS5016-E16 будут показывать впечатляющие числа, но эти числа в действительности не описывают реальную производительность, а просто служат иллюстрацией к тому комплексу оптимизаций, который есть в накопителях вроде Gigabyte Aorus NVMe Gen4 SSD. Собственно, посмотрите сами (слева – результат Gigabyte Aorus NVMe Gen4 SSD 2 Тбайт; справа – Samsung 970 EVO Plus 2 Тбайт).

Gigabyte Aorus NVMe Gen4 SSD 2 Тбайт

Gigabyte Aorus NVMe Gen4 SSD 2 Тбайт

  Samsung 970 EVO Plus 2 Тбайт

Samsung 970 EVO Plus 2 Тбайт

Кажется, что Gigabyte Aorus NVMe Gen4 SSD одержал над Samsung 970 EVO Plus 2 Тбайт безоговорочную победу, разгромив его по всем оцениваемым в CrystalDiskMark показателям производительности. Но не надо спешить с выводами: дальше мы покажем, что в реальных условиях накопитель на базе Phison PS5016-E16 не так хорош, как кажется поначалу, и уж точно не может похвастать неоспоримым превосходством над Samsung 970 EVO Plus.

Если Вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.

Включаем поддержку NVMe на старых материнках на примере Asus P9X79 WS / Habr

Привет Хабр! В голову мне закралась мысль, и я ее думаю. И придумал. Все дело в жуткой несправедливости производителя, которому абсолютно ничего не стоило добавить модули в UEFI Bios для поддержки загрузки с NVMe через переходники на материнках без слота m.2 (что, к стати, без вопросов реализовано китайцами на материнках HuananZhi). Неужели не возможно — подумал я и стал копать. Нарыл кучу нерабочих советов, пару раз окирпичил материнку, но я добился своего. В этой статье я почерпнул львиную долю полезной информации. Но и тут достаточно много подводных камней. Например совершенно не ясно в какой индекс записывать модули. Итак, начнем модифицировать наш биос. Внимание! Данный материал применим ТОЛЬКО к AMI Aptio Bios и ни к одному другому, так что если у вас не оно — смело проходите мимо.

Для начала скачаем инструменты. Распаковав в удобную папку скачаем биос от ближайшей модели с поддержкой NVMe (Для P9X79 это Sabertooth X99) и оригинальный биос для нашей материнки. Кладем скаченные биос в папку с инструментами, запускаем MMTool и открываем биос с поддержкой NVMe:

Затем идем на вкладку Extract, находим и извлекаем нужные нам модули (NvmeInt13, Nvme, NvmeSmm), имена набираем идентичные с расширением .ffs и жмем Extract, опции оставляем «As is»:

Когда все модули извлечены, открываетм командную строку от администратора и идем в папку с инструментами\AFUWINx64

Там снимаем дамп:

afuwinx64.exe Extracted.rom /O

Переходим к MMtool и открываем наш дамп.


Переходим на вкладку Insert и ОБЯЗАТЕЛЬНО кликаем в поле на индекс 02 (для разных материнок индексы могут отличаться, смотрите на индекс, в котором изначально лежали модули NVMe и сравнивайте содержимое с целевым Bios).

Далее жмем Browse и находим наши извлеченные модули:

Нажимаем Insert (опция «As is») и повторяем действие для остальных модулей, соблюдая порядок, как в биос с поддержкой NVMe (У меня NvmeInt13, Nvme, NvmeSmm). Затем находим наши новые модули в списке дабы убедится что все они на месте и в правильном порядке:

Жмем Save Image As и сохраняем модифицированный биос в папку AFUWINx64. В ту же папку помещаем оригинальный биос нашей материнки и приступаем к прошивке. Сначала шьем оригинальный биос, дабы обойти защиту:

afuwinx64.exe P9X79-WS-ASUS-4901.CAP

Затем шьем наш модифицированный:

afuwinx64.exe P9X79-WS-ASUS-4901-NVME.rom /GAN

Соответственно имена файлов подставляем свои. После перезагрузки наш биос будет уметь загружаться с NVMe.
После обновления биос вы обнаружите кучу устройств с восклицательным знаком в диспетчере. Лечится это просто: скачайте драйвер чипсета от материнской платы-донора модулей и установите их на целевой машине.

ВСЕ ДЕЙСТВИЯ ВЫ ПРОДЕЛЫВАЕТЕ НА СВОЙ СТРАХ И РИСК, АВТОР МАТЕРИАЛА НИКАКОЙ

ОТВЕТСТВЕННОСТИ НЕ НЕСЕТ!

ТУТ можно скачать собранный мной рабочий биос для Asus P9X79 WS версии 4901 с поддержкой NVMe.

Форм-фактор U.2 — неизбежное будущее / Kingston Technology corporate blog / Habr

Привет, Гиктаймс! Логический интерфейс и форм-фактор. Два понятия столько тесно переплетенных, что путаница возникает с пугающей регулярностью. Подброшу дров в костер инквизиции и расскажу о «условно-новом» форм-факторе U.2 — почти все, что вы хотели знать, но боялись спросить.


Во-первых, U.2 — это физический форм-фактор, и непосредственно на скорость передачи данных он не влияет. Во-вторых, внимательный и опытный айтишник наверняка отметит сходство с SAS дисками — те же 2.5 дюйма, та же толщина — 15 мм. Да и разъем подозрительно похожий, пусть и с другими цифрами — SFF-8639 вместо SFF-8482.

Каждый разъем U.2 может использовать четыре линии PCI-E 3.0, то есть максимальная скорость передачи может достигать 4 ГБ/с.

Внимание, вопрос. А зачем придумывать что-то новое, когда все это уже существует и называется SAS? Тут в силу вступают иные буквы — NVMe (Non-Volatile Memory Host Controller Interface Specification) — логический интерфейс, намного более быстрый чем SATA и специально разработанный для доступа к твердотельным накопителям.

Сила линий PCI-E не давала покоя производителям накопителей, однако количество PCI-E слотов на материнских платах (серверных и десктопных) конечно, и занимать все слоты, что есть в 1U корпусе только накопителями просто преступно. Форм-фактор U.2 не занимает слоты расширения, а устанавливается на место обычных накопителей.

Все накопители U.2 поддерживают горячую замену, что также крайне сложно осуществить с PCI-E диском.

Возможности построения СХД просто заоблачной скорости восхищают — представьте себе — компания SuperMicro изготовила шасси 2U для 48 NVMe дисков форм-фактора U.2.

А зачем же все это обычным людям? И какая разница — M.2 или U.2?

Напомню, что SATA (самый обычный и привычный) имеет максимальную пропускную способность — 600 МБ/с. С учетом всяких погрешностей и передачи служебных данных — остается около 550-560 МБ/с, а это и есть предел по скорости для современных потребительских накопителей. Поскольку SATA не использует линии PCI-E скорость работы существенно ниже, чем у NVMe.

Зажиточные энтузиасты скажут, а линии-то нерезиновые, у нас Титаны все скушали! И будут правы, но отчасти. Линии для графических карт и линии для устройств хранения разделены и поэтому даже самая многоядерная графическая конфигурация не пострадает от подключения U.2 SSD диска.

Многие производители материнских плат даже в комплект к топовым продуктам стали складывать переходники с M.2 на U.2 — чтобы можно было подключить супербыстрые новые диски даже, если на плате нет разъема.

Кстати, помните SATA-Express? C ним скорее всего придется расстаться. Вдвое меньшая пропускная способность, полное отсутствие накопителей с таким интерфейсом на рынке. Выбор производителей сделан в пользу M.2 и U.2, именно за таким форм-факторами будущее твердотельных накопителей.

Спасибо за внимание и оставайтесь с Kingston на Гиктаймс!

Отправляем лучи добра и всяческий респект читателям и вновь подкрепляем его раздачей зверски крутого железа Kingston! В конце октября мы вручим подписчикам нашего блога 3 крутых комплекта оперативной памяти:

— DDR4 Fury — HX426C15FBK2/16

— DDR4 Savage — HX428C14SBK2/16

— Новоиспеченный DDR4 Predator — HX433C16PB3K2/16

Подписывайтесь, возможно, именно вам улыбнется удача 😉

А чтобы никто не ушёл обиженным, мы дарим скидку в размере 12% на все доступные модели DDR4 Predator в сети Юлмарт. Вооружайтесь промо кодом GEEKPR16 и успейте купить высокоскоростную память до 31 декабря 2016 года.

Для получения дополнительной информации о продукции Kingston и HyperX обращайтесь на официальный сайт компании. В выборе своего комплекта HyperX поможет страничка с наглядным пособием.

Оставьте комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *