Pascal архитектура: Архитектура GPU Pascal | NVIDIA – Pascal (microarchitecture) — Wikipedia

Pascal (микроархитектура) — Pascal (microarchitecture)

Nvidia Pascal
NVIDIA GTX-1070-FoundersEdition-fl.jpg-

GTX 1070, второй в продаже карты использовать архитектуру Pascal

Дата выхода 5 апреля 2016
Транзисторы 14 нм и 16 нм
история
предок максвелл
правопреемник Вольта (рабочая станция / центр обработки данных)
Тьюринг (общая)

Паскаль является Кодовым для GPU микроархитектуры , разработанной Nvidia , как преемник Максвелла архитектуры. Архитектура была впервые введена в апреле 2016 года с выпуском Тесла P100 (gp100) 5 апреля 2016 года, и в основном используется в серии GeForce 10 , начиная с GeForce GTX 1080 и GTX 1070 (оба с использованием GP104 GPU) , которые были выпущены на 17 мая 2016 года и 10 июня 2016 года соответственно. Pascal производится с использованием 16nm FinFET процесса.

Архитектура названа в честь французского математика и физика 17 — го века, Блез Паскаль .

подробности

В марте 2014 года Nvidia объявила , что преемник Максвелл будет Паскаль микроархитектурой; объявил 6 мая 2016 года и выпущен 27 мая 2016 года Тесла P100 (GP100 чип) имеет другой вариант архитектуры Паскаля по сравнению с графическими процессорами GTX (GP104 чип). В шейдерных блоках в GP104 имеет Maxwell -like дизайн.

Архитектурные усовершенствования архитектуры GP100 включают в себя следующее:

  • В Pascal, СМ (потоковое многопроцессорных) состоит из 128 ядер CUDA. Максвелл упакованы 128, 192 Kepler, Ферми 32 и Тесла всего 8 ядер CUDA в СМ; GP100 СМ разделена на два блока обработки, каждый из которых имеет 32 одинарной точностью ядер CUDA, буфер команд, перекос планировщик, 2 текстуры отображение единиц и 2 единицы отправки.
  • CUDA Compute Capability 6,0.
  • Высокая пропускная способность памяти 2 — некоторые карты имеют 16 GIB HBM2 в четырех стопок в общей сложности 4096-битной шиной с пропускной способностью памяти 720 Гбайт / с.
  • Унифицированная память — архитектура памяти, где процессор и GPU может получить доступ как основной системной памяти и памяти на видеокарте с помощью технологии, называемой «Page Migration Engine».
  • NVLink — шина с высокой пропускной способностью между CPU и GPU, и между несколькими графическими процессорами. Позволяет значительно более высокую скорость передачи данных, чем те , достижимо при использовании PCI Express; По оценкам , чтобы обеспечить между 80 и 200 Гбит / с.
  • 16-битный ( FP16 ) операций с плавающей запятой (просторечии «половина точности») может быть выполнена в два раза быстрее операций с плавающей точкой 32-разрядных ( «одинарной точности») и 64-разрядных операций с плавающей запятой (просторечии «двойной точность «) выполнена на половине скорости операций с плавающей точкой 32-битных.
  • Другие регистры — в два раза больше регистров на ядро ​​CUDA по сравнению с Максвеллом.
  • Более общая память.
  • Динамическая нагрузка системы планирования балансировки. Это позволяет планировщик динамически регулировать количество GPU, назначенное для выполнения нескольких задач, гарантируя, что ГПУ остается насыщает кроме работы, когда нет больше работы, которые могут быть безопасно распределены распространять. Nvidia поэтому благополучно включен асинхронный Compute в драйвере Паскаля.
  • Инструкция уровень и упреждение нити уровня.

Архитектурные усовершенствования архитектуры GP104 включают в себя следующее:

  • Возможность CUDA Вычислительный 6.1.
  • GDDR5X — новый стандарт памяти поддерживает скорость передачи данных 10 Гбит / с, обновлением контроллера памяти.
  • Одновременная Multi-проекция — генерировать множество проекций единого потока геометрии, так как она входит в двигателе от SMP вверх по течению стадии шейдеров.
  • DisplayPort 1.4, HDMI 2.0b.
  • Четвертое поколение Delta компрессия цвета.
  • Усовершенствованный интерфейс SLI — интерфейс SLI с более высокой пропускной способностью по сравнению с предыдущими версиями.
  • PureVideo набор функций Н аппаратного декодирования видео HEVC Main10 (10bit), Main12 (12bit) и аппаратное декодирование VP9.
  • HDCP Поддержка 2,2 для 4K DRM защищенный авторским воспроизведения и потоковой передачи (Maxwell GM200 и GM204 отсутствует Поддержка HDCP 2.2, GM206 поддерживает HDCP 2,2).
  • NVENC HEVC Main10 10bit аппаратного кодирования.
  • GPU Boost 3.0.
  • Инструкция уровня упреждение. В графических задачах, драйвер ограничивает это пиксельное упреждение, поскольку задачи пиксельных обычно закончить быстро и накладные расходы делать на уровень пикселей упреждения значительно ниже, чем выполнение на уровень инструкций упреждения. Compute задачи получить поток на уровне или на уровне команд упреждение. Инструкция уровень упреждение полезно, только потому, что вычислительные задачи могут занять долгие времена, чтобы закончить, и нет никаких гарантий относительно того, когда заканчивается задача вычисления, поэтому драйвер позволяет очень дорогой уровне инструкций упреждению для выполнения этих задач.

обзор

Графический процессор кластера

Чип разделен на графический процессор кластеры (ГЦП). Для GP104 чипов, ГЦП охватывает 5 SMS.

Streaming многопроцессорной «Паскаль»

А «Streaming многопроцессорной» соответствует AMD в Compute Unit . СМП охватывает 128 с одинарной точностью АЛУ ( «CUDA ядер») на GP104 чипов и 64 с одинарной точностью АЛУ на gp100 чипов.

Что AMD называет CU (вычислительный блок) можно сравнить с тем, что Nvidia называет SM (потоковое многопроцессорных). В то время как все версии CU состоят из 64 шейдерных процессоров (т.е. 4 SIMD Вектора единиц (каждая 16-полосной шириной) = 64), Nvidia (регулярно вызывая шейдерные процессоры «ядра CUDA») экспериментировал с самым разными номерами:

  • На Тесла 1 SM объединяет 8 с одинарной точностью (FP32) шейдерных процессоров
  • На Fermi 1 SM объединяет 32 с одинарной точностью (FP32) шейдерных процессоров
  • На Kepler 1 СМ объединяет 192 с одинарной точностью (FP32) шейдерных процессоров , а также 64 двойной точности единиц (по крайней мере GK110 GPU)
  • На Maxwell 1 SM объединяет 128 с одинарной точностью (FP32) шейдерных процессоров
  • На Паскале это зависит:
    • На gp100 1 СМ объединяет 64 с одинарной точностью (FP32) шейдерных процессоров , а также 32 с двойной точностью (FP64) , обеспечивающие отношение 2: 1 из одно- к двойной точности пропускной способности . GP100 использует более гибкие ядра FP32, которые способны обрабатывать один с одинарной точностью или две половины точности чисел в векторе два элемента. Nvidia намерена обратиться расчет алгоритмов , связанных с углубленным изучением с ними.
    • На GP104 1 СМ объединяет 128 с одинарной точностью АЛУ, 4 с двойной точностью ALUS обеспечивая 32 A: 1 соотношение, и одну половину точности ALU, который содержит вектор двух половинной точности поплавками, которые могут выполнять ту же самую инструкцию на обоих поплавков обеспечивая соотношение 1, если та же команда используется на обоих элементах: 64.

Полиморфный-Engine 4.0

Polymorph Engine версии 4.0 является подразделением , ответственным за тесселяции . Это соответствует функционально с AMD в геометрическом процессоре . Он был перемещен из модуля шейдера к TPC , чтобы один полиморфной двигатель кормить несколько ПМП в ТРС.

чипсы

  • GP100: ускоритель Nvidia Tesla GPU P100 ориентирован на GPGPU приложений , таких как FP64 двойной точности вычислений и глубокой подготовки обучения , который использует FP16. Он использует память HBM2 . Quadro GP100 также использует GP100 GPU.
  • GP102: Этот GPU используется в TITAN Xp, Titan X и GeForce GTX 1080 Ti. Он также используется в P40 Quadro P6000 и Tesla.
  • GP104: Этот GPU используется в GeForce GTX 1070, GTX 1070 Ti и GTX 1080. GTX 1070 имеет 15/20 и GTX 1070 Ti имеет 19/20 его оМ включен. Оба подключены к памяти GDDR5, в то время как GTX 1080 является полным чипом и подключен к памяти GDDR5X. Он также используется в Quadro P5000, P4000 Quadro и Tesla P4.
  • GP106: Этот GPU используется в GeForce GTX 1060 с памятью GDDR5 / GDDR5X. Он также используется в Quadro P2000.
  • GP107: Этот GPU используется в GeForce GTX 1050 Ti и GeForce GTX 1050. Он также используется в Quadro P1000, P600 Quadro и Quadro P400.
  • GP108: Этот GPU используется в GeForce GT 1030.

На чипе GP104 СМ состоит из 128 одинарной точности АЛУ ( «CUDA ядер»), на gp100 64 одинарной точности АЛУ. В связи с различной организацией чипов, как числа двойной точности АЛУ, теоретическая производительность двойной точности в gp100 составляет половину от теоретического для одинарной точности; соотношение составляет 1/32 для чипа GP104.

Сравнительная таблица некоторых Кеплер, Максвелл, и сколы Pascal
GK104 GK110 GM204 (GTX 970) GM204 (GTX 980) GM200 GP104 GP100
Выделенный кэш текстур на СМ 48 KiB N / A N / A N / A N / A N / A N / A
Texture (график или вычислить) или данные только для чтения (только вычисление) кэш на СМ N / A 48 KiB N / A N / A N / A N / A N / A
Программист-селективные разделов совместно используемой памяти / L1 на СМ 48 KiB разделяемой памяти + 16 кэш L1 KiB (по умолчанию) 48 KiB разделяемой памяти + 16 кэш L1 KiB (по умолчанию) N / A N / A N / A N / A N / A
32 КБ общей кэш-памяти + 32 КБ L1 32 КБ общей кэш-памяти + 32 КБ L1
16 КБ общей кэш-памяти + 48 КБ L1 16 КБ общей кэш-памяти + 48 КБ L1
Унифицированная кэш L1 / кэш текстур на СМ N / A N / A 48 KiB 48 KiB 48 KiB 48 KiB 24 KiB
Выделенный совместно используемой памяти в SM N / A N / A 96 KiB 96 KiB 96 KiB 96 KiB 64 КБ
Кэш L2 на чипе 512 КБ 1536 KiB 1792 KiB 2048 KiB 3072 KiB 2048 KiB 4096 KiB

Спектакль

Теоретическая одинарной точность вычислительной мощности Паскаль GPU в GFLOPS вычисляются как 2 X (операции на инструкцию ФМЫ на CUDA ядра за один цикл) × количества ядер CUDA × ядра тактовой частоты (в ГГц).

Теоретической двойной точности обработки мощность Pascal GPU составляет 1/2 от одной производительности точности на Nvidia gp100 и 1/32 Nvidia GP102, GP104, GP106, GP107 & GP108.

Теоретическая половина точности обработки мощность Pascal GPU составляет 2 × одиночной точности исполнения на gp100 и 1/64 на GP102, GP104, GP106, GP107 & GP108.

правопреемник

После того, как Паскаль, следующая архитектура будет предварительно под кодовым названием Volta . Nvidia объявила , что Вольта GPU будет функция высокой пропускной способностью памяти , Unified Memory , полная поддержка FP16 (два раза его FP32) и NVLink . До сих пор не известно , если Вольта будет часть потребительской линейки, и может быть заменена Ампер микроархитектура или Тьюринга.

Смотрите также

Рекомендации

<img src=»https://en.wikipedia.org//en.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1×1″ alt=»» title=»»>

NVIDIA представила новую архитектуру Pascal, ориентированную на искусственный интеллект

Прямо сейчас в Кремниевой долине проходит GPU Technology Conference. Это важнейшее событие для всех тех, кто занимается технологиями параллельных вычислений, нейронными сетями и искусственным интеллектом. Текущий 2016 год особенный для этой конференции. То к чему готовились и шли долгое время именно сейчас приобретает законченные формы. Причем, как и предопределено развитием технологий, прорыв происходит сразу по всем направлениям:

  • нейронные сети, построенные на обучении с подкреплением, берут следующую высоту после шахмат и побеждают человека в го, игру, которая превосходит шахматы по своей комбинаторной сложности;
  • беспилотные автомобили проходят проверку на дорогах и доказывают свою состоятельность;
  • платформы искусственного интеллекта от IBM, Amazon, Google и Microsoft готовы для интеграции в реальный мир;
  • виртуальная и дополненная реальность уже реализованы и готовы к масштабному внедрению от Oculus, HTC, Sony и Samsung;
  • решения на базе HPC (High Performance Computing) интегрируются практически повсеместно.

Пожалуй, главный из участников прорыва — это компания NVIDIA. Именно на ее железе работает большая часть всех революционных чудес.

Вчера NVIDIA провела презентацию, показала оборудование и озвучила идеи, которые будут определять ход компьютерной революции как минимум ближайший год. Наверняка об этом будет много новостей и обзоров. Мне довелось присутствовать на этом мероприятии, пересказывать его полностью я не буду, но попробую отметить те детали, которые особенно отложились в памяти.


Есть у компании NVIDIA со-основатель и в одном лице ее президент Дженсен Хуанг. Он и вел презентацию. Насколько это хороший оратор и яркий рассказчик вы можете судить по тому, что к концу презентации, я стал искренне переживать, что в моем любимом iMac стоит видеокарта от AMD. Вот она сила слова!

Вообще же, я еще раз убедился в том, что компьютеры стали иными. Центральный процессор, еще недавно сердце компьютера, сейчас отошел на второй план. Навигация в интернете или работа с текстом — практически не требуют системных ресурсов. Даже самый слабый из современных процессоров с легкостью справляется с этим. А вот для всего действительно современного и интересного даже самый мощный процессор оказывается совершенно не пригоден. Создание графики в играх, моделирование виртуальной или дополнительной реальности, обработка изображений в реальном времени — все это возможно только на системах с параллельными вычислениями, когда счет количества параллельных потоков идет не на единицы, а на тысячи.

Почти в самом начале выступления прозвучала фраза, которая сразу запомнилась: “уже никому не нужна реалистичность, нужна реальность”. Чтобы это продемонстрировать NVIDIA применила два козыря: интригующую тему и несомненного авторитета. Они смоделировали с абсолютной достоверностью восемь квадратных миль поверхности Марса с базой NASA и разной техникой поблизости. Опробовать это по прямой видеосвязи пригласили Стива Возняка. Было трогательно и забавно, когда Дженсен поблагодарил Стива за первый компьютер, за SSD и предложил, что дескать если тот и дальше хочет быть впереди, то компания NVIDIA готова устроить ему право быть первым космонавтом в полете на Марс в 2030 году. Стив радостно согласился. Дженсен, правда заметил, что NVIDIA готова оплатить билет только в один конец. Возняк не смутился и сказал, что Марс — это мечта и в один, так в один. Короче, сошлись на том, что ждать 2030 года не стоит и лучше, не откладывая, прямо сейчас опробовать Марс в исполнении NVIDIA, тем более, что обещана была “не реалистичность, а реальность”. Судя по реакции, реальность Марса Возняку понравилась. Он бодро гонял в шлеме Окулус на марсохроде и было видно, как ему хочет попробовать протаранить здания базы, видимо, чтобы проверить обещанную реальность ну уж совсем по полной.

Оправдывая лозунг “не реалистичность, а реальность”, NVIDIA презентовала главного виновника торжества новую архитектуру Pascal. 15 миллиардов транзисторов на одном кристалле — это больше чем у любого другого чипа, созданного людьми ранее. Потрясающие характеристики можно посмотреть по ссылке.

Когда была озвучена сумма, затраченная за три года разработок этой архитектуры, мне почему-то подумалось, что «Роснано» как-раз могло потянуть, но почему-то не потянуло, стало как-то грустно.

Игровые видеокарты на Pascal появятся уже в этом году. Похоже, что их высокая производительность понадобится в первую очередь второму поколению систем виртуальной реальности. Сейчас для всех систем VR разрешение еще достаточно далеко от ретины. И Oculus, и HTC в своем первом релизе при выборе разрешения исходили из производительности существующих на сегодня видеокарт. Возможно Pascal исправит эту ситуацию.

Показали модуль Tesla P100. Это первый продукт на базе новой архитектуры. P100 — ускоритель на базе которого можно строить различные вычислительные системы. Обещали, что в начале следующего года появятся сервера от всех крупных игроков.

Сама NVIDIA показала, то чем заслуженно можно гордиться — суперкомпьютер DGX-1.

Назначение этого чуда — глубокое обучение нейронных сетей. Суперкомпьютер состоит из восьми модулей P100 и имеет производительность 170 терафлопс. Цифра огромная, но большее впечатление производит не ее астрономическая величина, а сравнение с производительностью аналога предыдущего поколения. Удалось добиться, не предусмотренного никаким законом Мура, рекордного ускорения в 12 раз.

DGX-1 позволяет тренировать нейронные сети, соответственно, в 12 раз быстрее, там где раньше требовалось несколько суток, теперь нужны часы.

Стоит это чудо 129 000 долларов, но есть ощущение, что оно того стоит. На стенде NVIDIA, где можно было рассмотреть DGX-1 живьем (фото со стенда на КДПВ), вместе со мной был инженер из JP Morgan, который хорошо знает толк в таких вещах, я видел как искренне у него горели глаза.

Но железо — это только пол-дела. Глубокое обучение в сочетании со сверточными сетями начали давать удивительные результаты. Уже сейчас можно говорить не об эволюции, а революции в машинном обучении. Но да я с этого начинал. Однако качественный скачок к сильному искусственному интеллекту еще только предстоит сделать. Что для этого надо и какое изменение вычислительной парадигмы нам предстоит я попробую описать несколько позже.

Архитектура Pascal и новые техпроцессы удивят, но сейчас время Maxwell

Дженсен Хуанг (Jen-Hsun Huang), исполнительный директор NVIDIA, на этой неделе заявил, что он доволен как архитектурой графических процессоров следующего поколения Pascal, так и будущими технологическими процессами, которые будут использованы для производства GPU. Тем не менее, глава NVIDIA подчеркнул, что текущее поколение процессоров Maxwell только начинает свой путь на рынке.

«У нас есть много отличных сюрпризов для вас, ребята, и я в восторге от следующего поколения наших графических процессоров», — сказал Дженсен Хуанг во время ежеквартальной телефонной конференции с инвесторами и финансовыми аналитиками.  «Но сейчас время развивать линейку Maxwell, мы находимся в начале нового продуктового цикла».

NVIDIA GeForce GTX 980

NVIDIA GeForce GTX 980 «Maxwell»

Графические процессоры на базе архитектуры Maxwell в настоящее время используются на потребительских графических картах GeForce GTX 750, 750 Ti, 970 и 980. NVIDIA планирует представить профессиональные графические адаптеры Quadro, а также ускорители для суперкомпьютеров Tesla на базе чипов поколения Maxwell в следующем году.

В настоящее время на рынке существуют только два графических процессора на базе архитектуры Maxwell — GM107 и GM204. Как ожидается, NVIDIA представит ещё два чипа на основе данной архитектуры в ближайшие кварталы. Считается, что самым мощным графическим процессором линейки Maxwell станет чип, известный под кодовым названием GM200. Именно этот GPU будет использован для наиболее производительных решений для игрового (GeForce), профессионального (Quadro) и специализированного (Tesla) применения.

Перспективный план NVIDIA

Перспективный план NVIDIA

Графические процессоры NVIDIA следующего поколения известны под кодовым именем Pascal и, согласно перспективному плану обнародованному в марте этого года, появятся на рынке где-то в 2016 году. Чипы на базе архитектуры Pascal будут поддерживать многослойную память с высокой пропускной способностью (stacked DRAM по классификации NVIDIA, конкретный тип — SK Hynix high-bandwidth memory (HBM) или Micron hybrid memory cube (HMC) — неизвестен), унифицированное адресное пространство памяти для CPU и GPU, шину NVLink для связи с CPU и GPU в системах для суперкомпьютерных вычислений, а также целый ряд новых графических, вычислительных и мультимедийных функций, которые будут поддерживаться DirectX 12, OpenGL 5 и другими будущими программными интерфейсами (application programming interface, API).

Прототип процессорного модуля на базе GPU c архитектурой Pascal с многослойной памятью

Прототип процессорного модуля на базе GPU архитектуры Pascal с многослойной памятью

Принимая во внимание совокупность сообщений об архитектуре Pascal, новое поколение GPU NVIDIA станет следующим по-настоящему важным шагом в эволюции графических процессоров, поскольку будет не только увеличивать энергоэффективность и производительность, но также поддерживать совершенно новый тип памяти и ряд новых функций. В 2016 году мониторы со разрешениями 4K (3840х2160, 4096х2160) и 5K (5120х2160) получат существенное распространение среди любителей игр. Как следствие, увеличенная вычислительная производительность GPU Pascal, а также экстремальная пропускная способность памяти типа HBM или HMC (мы говорим здесь о величинах вроде 1 Тбайт/с или даже 2 Тбайт/с для одного GPU) придутся как нельзя кстати.

Преимущества многослойной памяти с высокой пропускной способностью

Преимущества многослойной памяти с высокой пропускной способностью

Учитывая сроки появления процессоров Pascal на рынке, логично предположить, что они будут производиться по улучшенной технологии 16 нм с транзисторами с вертикально расположенным затвором (16nm FinFET+) на мощностях Taiwan Semiconductor Manufacturing Co. (TSMC). Хотя Дженсен Хуанг не подтвердил каких-либо данных о GPU поколения Pascal, он сказал, что доволен будущими техпроцессами своих производственных партнёров.

«Мы в восторге от [технологического процесса] следующего поколения с FinFET транзисторами», — сказал господин Хуанг. «Я доволен следующими двумя поколениями технологий производства полупроводников, я уверен в них».

Хотя графические процессоры Pascal, память типа HBM и HMC, а также 16-нм техпроцесс с транзисторами с вертикально расположенным затвором явно указывают на революционные изменения на рынке графических адаптеров в 2016 году, с точки зрения пользователя-практика гораздо интереснее узнать о ближайшем чипе NVIDIA, GM200. Последний станет сердцем новых графических карт линейки GeForce GTX Titan. К сожалению, подробностями о ближайшем поколении решений с экстремальной производительностью и ценой глава NVIDIA не поделился. Даже несмотря на то, что сейчас — время Maxwell.

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.

Новые подробности об архитектуре NVIDIA Pascal

На сессии с разработчиками в ходе GPU Technology Conference были раскрыты некоторые детали об архитектуре Pascal, которая последует за Maxwell в 2016 году. Название Volta, которое ранее было зарезервировано за преемником Maxwell, отошло более поздней архитектуре.

Напомним, что две отличительные черты Pascal, о которых было сказано на выступлении Дженсена Хуанга ранее, — это многослойная упаковка чипов памяти (3DRAM, или же Stacked DRAM) и NVLINK — высокоскоростной интерфейс коммуникации между несколькими GPU, а также между GPU и CPU. Кроме того, была продемонстрирована плата странного форм-фактора без каких-либо видимых разъемов.

Пообщавшись лично с сотрудниками NVIDIA, нашему корреспонденту удалось получить довольно много дополнительной информации по поводу этих особенностей Pascal.

Во-первых, было сказано, что GPU Pascal использует исключительно 3DRAM и никаких обычных, однослойных, чипов памяти. Одна из причин это в том, что, согласно заявлению NVIDIA, Stacked DRAM обладает в четыре раза меньшим энергопотреблением по сравнению с обычной памятью. Вся память размещается на одной подложке (interposer) с GPU, что облегчает разводку сложнейшей шины, разрядность которой выражается четырехзначным числом. NVIDIA, по всей видимости, будет поставлять партнерам interposer с заранее установленным GPU и видеопамятью.

В таком случае 18 чипов, окружающих подложку GPU, которые мы ранее приняли за обычные микросхемы DRAM, представляют собой компоненты системы питания.

3DRAM будет применяться во всем диапазоне продуктов на базе архитектуры Pascal, включая мобильные GPU.

Отсутствие видимых разъемов на плате прототипа объясняется тем, что он соединяется с материнской платой при помощи riser card. Разумеется, это означает, что форм-фактор прототипа отличается от существующих карт расширения для шины PCI-E. NVIDIA будет выпускать компактные модули Pascal для установки в серверные корпуса, для чего нужно будет заручиться поддержкой производителей такого оборудования.

Компактный модуль Pascal предназначен для работы с шиной NVLINK, которая в данном случае заменяет PCI-Express и сулит увеличение пропускной способности в 5-12 раз по сравнению с PCI-E 3.0 и одновременно – троекратное увеличение энергоэффективности. Топология NVLINK строится на базе блока из восьми линий двусторонней направленности. Отдельно взятый GPU Pascal имеет несколько таких Point-to-Point-соединений, которые можно сгруппировать вместе, образовав высокоскоростной канал связи с CPU, а можно использовать часть их для коммуникации между графическими процессорами.

Связь GPU и CPU одновременно осуществляется по интерфейсу PCI-E, дабы сохранить существующую модель программирования. Посредством PCI-Express осуществляются транзакции, инициированные на стороне CPU, посредством NVLINK — напротив, транзакции, инициированные GPU. Сам протокол NVLINK, как было сказано нам, не совместим с протоколом PCI-Express. В случае отсутствия поддержки NVLINK со стороны CPU Pascal может работать исключительно на PCI-Express. Планируется выпуск плат для профессионального рынка не только в представленном компактном форм-факторе, но и в привычном форм-факторе плат расширения PCI-E.

NVIDIA уже заручилась поддержкой IBM, которая внедрит NVLINK в будущих поколениях процессоров Power. С другими производителями CPU ведутся переговоры по этому поводу.

Отметим, что NVIDIA пока не раскрывает никаких подробностей о потребительских продуктах на базе GPU Pascal. Будет ли в десктопных видеоадаптерах применяться шина NVLINK, остается неизвестным, как и любые подробности касательно архитектуры самого графического процессора.

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.

💣pascal architecture ✔️

pascal architecture .

GTX 1080 Pascal Architecture Explained
Нажми для просмотра

GTX 1080 Pascal
Architecture
Explained by Nvidia.
What does new Pascal
bring after the
Maxwell? New
technologies, new
 
 
 
Тэги:
 

NVidia Pascal Architecture Deep Dive w/ GP100
Нажми для просмотра

This architecture
deep-dive looks at
the technical
details and
specifications of
nVidia’s new
Pascal architecture
as it pertains
to …
 
 
 
Тэги:
 

Коротко о новых технологиях в NVIDIA Pascal
Нажми для просмотра

— группа
«Этот
компьютер&q
uot; — свежие
и
актуальные
новости IT
мира Все
ключевые
новые
технологии
,…
 
 
 
Тэги:
 

Устройство ядра Turing / GeForce RTX и новые технологии для геймеров и разработчиков
Нажми для просмотра

Подбор
комплектую
щих для ПК
с
проверкой
совместимо
сти
Архитектур
а Nvidia Turing
содержит
множество
 
 
 
Тэги:
 

Процессорозависимость видеокарт. Polaris vs Pascal.
Нажми для просмотра

Есть ли
разница в
нагрузке
на
процессор,
с
видеокарта
ми Radeon и
Geforce, при
одинаковой
производит
ельности?Г
уп…
 
 
 
Тэги:
 

Pascal Architecture with Pascal - Nvidia GTX 1060 Unboxing!
Нажми для просмотра

Please feel free to
leave and like and
make sure you
subscribe for more
awesome content!
Social Media links:
—Twitter— …
 
 
 
Тэги:
 

Vega v Turing v Pascal architecure deep dive
Нажми для просмотра

In this video we
will look at the
architectural
differences and
similarities between
AMDs GCN, Pascal and
Turing architecture
 
 
 
Тэги:
 

Nvidia Pascal: Worth the Wait?
Нажми для просмотра

Here’s the
second section of my
«Up-and-Coming
CPUs and GPUs»
series (completely
made that up on the
spot like a true
boss).
 
 
 
Тэги:
 

Nvidia GPU Architecture
Нажми для просмотра

This video is about
Nvidia GPU
architecture. This
is my final project
for my computer
architecture class
at community
college.
 
 
 
Тэги:
 

Graphics Card Specs: The Basics
Нажми для просмотра

TL;DR — Reviews and
benchmarks are the
most important thing
to look at when
buying a new
graphics card. But
if you ARE …
 
 
 
Тэги:
 

What is NVIDIA Pascal PlayReady 3.0 and HDR?
Нажми для просмотра

What is NVIDIA
Pascal PlayReady 3.0
and HDR? In NVIDIA
Pascal event, Nvidia
engineers and
executives explains
the details of …
 
 
 
Тэги:
 

GTC 2015: Pascal, the Next Generation of NVIDIA’s GPU Roadmap (part 7)
Нажми для просмотра

GTC: NVIDIA CEO and
co-founder Jen-Hsun
Huang summarizes
three key features
of Pascal, the
company’s
next-generation …
 
 
 
Тэги:
 

NVIDIA Pascal, GeForce GTX 10-series Announced
Нажми для просмотра

Tom Petersen gives a
quick run down of
the amazing new
technologies we just
introduced with
NVIDIA Pascal and
the GeForce …
 
 
 
Тэги:
 

Galax GTX 1060 EXOC Graphics Card Review - NVIDIA Pascal Architecture Based GPU
Нажми для просмотра

Finally we tested
the most awaited GPU
architecture, and
Galax Nvidia GTX
1060 impressed us
with its extremely
overclocked …
 
 
 
Тэги:
 

Introducing the GeForce GTX 1080. Gaming Perfected.
Нажми для просмотра

NVIDIA’s new
flagship GeForce GTX
1080 is the most
advanced gaming GPU
ever created, driven
by the
high-performance, .
..
 
 
 
Тэги:
 

The Last Pascal? GeForce GTX 1050 3GB Review: The Best Budget GPU?
Нажми для просмотра

Is this the end of
the line for
Nvidia’s Pascal
technology?
Recently, a new
three gig version of
the GTX 1050 snuck
out — likely
the …
 
 
 
Тэги:
 

NVIDIA Ansel Architecture Explained
Нажми для просмотра

NVIDIA Ansel
Architecture
Explained by Nvidia.
This new in game
capture tool enables
high quality images
and different view
 
 
 
Тэги:
 

Why GTX 1080 Is A Better GPU Than The Current Benchmarks - (Pascal Architecture )
Нажми для просмотра

GTX 1080 benchmarks
have been released
and the GTX 1080 is
performing really
well and beats out
Titan X gaming
performance by …
 
 
 
Тэги:
 

Chill Your Sh*t About Pascal! [NVIDIA
Нажми для просмотра

Nvidia announced
their new
architecture and
people are going
nuts, and this is
why you should stop
#BlameTheMedia 😛
Super …
 
 
 
Тэги:
 

Time to upgrade your Nvidia Graphics Card? Turing vs. Pascal
Нажми для просмотра

Thinking of
upgrading your
Nvidia graphics card
to the new RTX 20
Series? Check out
this video first.
With the recent …
 
 
 
Тэги:
 

Object Pascal functions. | Linux | Pascal | Архитектура ПО | Рабочий стол Windows

techlinesols6

«Hi, Hope you are doing well! Thanks for sharing your project requirement with us. It will be our great pleasure to work on your project. I have checked your requirement, yes we can do it, because we already work on si
Больше

$34 USD за 7 дней(-я)

Free Pascal — Википедия. Что такое Free Pascal

Free Pascal
FPClogogif.gif
Free Pascal, запущенный в командной строке
Тип компилятор
Автор Free Pascal team
Разработчики Флориан Клэмпфль и другие участники проекта
Написана на Object Pascal и язык ассемблера
Операционная система Linux, Mac OS X и др. UNIX-подобные, Windows, DOS, OS/2, Novell Netware, Android
Первый выпуск 1997
Аппаратная платформа x86/64, SPARC, PowerPC/64, ARM
Последняя версия
Состояние активное
Лицензия GNU GPL 2[2]
Сайт freepascal.org
Commons-logo.svg Free Pascal на Викискладе

Commons-logo.svg

Free Pascal (полное название Free Pascal Compiler, часто используется сокращение FPC) — свободно распространяемый компилятор языка программирования Object Pascal.

Платформы

Компилятор существует для различных аппаратных и программных платформ, ветвь 2.4.x поддерживает следующие:

Более ранние версии также поддерживали архитектуру m68k (операционные системы NetBSD, Linux и AmigaOS), а также операционные системы Solaris, QNX и BeOS для x86.

В разработке — поддержка создания кода для Java Virtual Machine[3].

Библиотеки и оболочки

В настоящее время в рамках проекта также разрабатывается Lazarus — свободный аналог среды разработки Delphi и Lazarus Components Library (LCL) — свободная библиотека виджетов, аналогичная VCL в Delphi.

Существуют и альтернативные проекты визуального программирования на базе Free Pascal, наиболее зрелым из которых является MSEide, использующий собственную, несовместимую с VCL библиотеку компонентов MSEgui.

Другая альтернатива Lazarus’u fpGUI, простая библиотека виджетов, не содержащая дополнительных библиотек вроде работы с БД, XML и т. п. В её состав включён визуальный редактор форм, генерирующий исходный код создания формы на паскале.

Кроме того, в настоящее время для создания Windows-приложений можно использовать известную невизуальную библиотеку KOL.

Режимы совместимости

Важной особенностью данного компилятора, в отличие, например, от GNU Pascal, является ориентация на распространённые коммерческие диалекты языка: Object Pascal и Delphi.

Free Pascal поддерживает компиляцию в нескольких режимах, обеспечивающих совместимость с различными диалектами и реализациями языка.

  • Режим FPC — собственный диалект: соответствует предыдущему, расширенному дополнительными возможностями, такими как, например, перегрузка операций.
  • Режим ObjFPC — совмещает объектно-ориентированные возможности Delphi и собственные расширения языка.
  • Режим Delphi — данный режим предоставлен для совместимости с компилятором Delphi от компании Embarcadero с целью упрощения портирования существующих исходных файлов на Free Pascal. Для этого вам необходимо включить этот режим директивой ${mode Delphi} в исходном файле или с помощью опции -Mdelphi в командной строке компилятора.
  • Режим TP/BP — Этот режим обеспечивает максимальную совместимость с компиляторами Turbo Pascal / Borland Pascal , чтобы упростить перенос существующего кода на FPC. Он использует возможности, которые не рассматриваются в качестве рекомендуемых, несколько изменяя правила синтаксиса. В случае необходимости, он вносит изменения в стандартный режим ассемблера $ASMMODE INTEL и т.п. Для этого вам необходимо включить этот режим директивой ${mode TP} в исходном файле или с помощью опции -Mtp в командной строке компилятора.
  • Режим MacPas — режим совместимости с Mac Pascal.
  • Режим ISO 7185
  • Режим ExPas
  • Режим GPas — был режимом компилятора, с помощью которого Free Pascal пытался компилировать только допустимый код GNU Pascal. Данный режим удален из компилятора Free Pascal начиная с версии 2.2.

Особенности

  • Поддержка перегрузки арифметических операторов (+, -, *, **, /, div, mod), операторов сравнения (<, >, =, >=, <=) и оператора присваивания :=.
  • Поддержка операторов присваивания с выполнением арифметической операции в стиле Си (+=, -=, *=, /=).
  • Наличие собственной системы сборки (fpcmake) и генератора документации (fpcdoc).
  • Встроенный ассемблер по умолчанию использует синтаксис AT&T, синтаксис Intel включается отдельной директивой.

Краткая история

  • 1993 год — начало работы над проектом.
  • 1995 год — компилятор успешно компилирует сам себя.
  • 1996 год — проект опубликован в интернете под лицензией GNU GPL.
  • 12 июля 2000 года — выход версии 1.0.
  • 2003 год — выход версии 1.0.10, завершение работы над ветвью 1.0.x.
  • 15 мая 2005 года — выход версии 2.0.
  • 10 сентября 2007 года — выход версии 2.2.
  • 30 декабря 2009 года — выход версии 2.4.
  • 12 ноября 2010 года — выход версии 2.4.2.
  • 20 мая 2011 года — выход версии 2.4.4
  • 1 января 2012 года — выход версии 2.6.0
  • 23 февраля 2013 года — выход версии 2.6.2
  • 11 марта 2014 года — выход версии 2.6.4
  • 25 ноября 2015 года — выход версии 3.0.0
  • 15 февраля 2017 года — выход версии 3.0.2[4]
  • 28 ноября 2017 года — выход версии 3.0.4[5]

Лицензия

Компилятор распространяется на условиях GNU General Public License, а значительная часть библиотек, в том числе ядро RTL — на условиях более мягкой GNU Lesser General Public License.

См. также

Примечания

Литература

Ссылки

Оставьте комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *