Сегодня, в рамках пекинской выставки GTC 2016, компания Nvidia представила несколько своих новинок. В первую очередь это видеокарты (или точнее выражаясь, ускорители) Tesla P40 и Tesla P4, преемники прошлогодних Tesla M40 и M4. Если Tesla P100 предназначена в основном для тренировки систем искусственного интеллекта (training), то 40-я и 4-я серии больше подходят для конечного принятия решений уже обученными системами (inference) — например, распознавания конкретного изображения или конкретной голосовой команды.
Как видно из литеры «P», архитектура Maxwell в ГПУ этих моделей сменилась на Pascal, и соответственно вместо 28нм техпроцесса используется 16нм. Заметно выросла частота., а объем памяти увеличился в два раза. Все это способствовало 1.7-2.5-кратному росту производительности при прежнем энергопотреблении. Еще одним существенным нововведением стало оснащение вычислительных ядер возможностью производить целочисленные 8-разрядные вычисления — у Tesla M40 и M4 её не было. В Tesla P40 используется ГПУ GP102 (им же оснащены TITAN X с Quadro P6000), а в Tesla P4 — GP104 (GTX 1080, GTX 1070 и Quadro P5000). Предлагаем вашему вниманию полные характеристики новинок и их предшественников:
Tesla M4
Tesla P4
Tesla M40
Tesla P40
TDP
50/75 Вт
75 Вт (50 Вт опционально)
250 Вт
250 Вт
Техпроцесс
28-нм
16-нм
28-нм
16-нм
Кол-во транзисторов
2.9 млрд
7.2 млрд
8 млрд
12 млрд
ГПУ
GM206
GP104
GM200
GP102
Площадь ГПУ
227 мм²
314 мм²
601 мм²
471 мм²
Кол-во SM
8
20
24
30
Кол-во ядер FP32
1,024
2,560
3,072
3,840
Частота базовая
872 МГц
810 МГц
948 МГц
1303 МГц
Частота ускоренная
1072 МГц
1063 МГц
1114 МГц
1531 МГц
Производительность INT8 (TOPS)
—
21.8
—
47.0
Производительность FP32 (терафлопс)
2.2
5.4
6.8
11.8
Производительность FP64 (гигафлопс)
69
170
213
367
Кол-во TMU (текстурных блоков)
64
160
192
240
Память
GDDR5
128-бит
GDDR5
256-бит
GDDR5
384-бит
GDDR5
384-бит
Пропускная способность памяти
88 Гб/с
192 Гб/с
288 Гб/с
346 Гб/с
Объем памяти
4 Гб
8 Гб
12/24 Гб
24 Гб
Объем кэш L2
2048 Кб
2048 Кб
3072 Кб
3072 Кб
Объем файла-регистра
2048 Кб
5120 Кб
6144 Кб
7680 Кб
Объем распределенной памяти на SM
96 Кб
128 Кб
96 Кб
128 Кб
В продажу Tesla P40 и Tesla P4 поступят в октябре и ноябре соответственно, цены не называются.
Другой новинкой сегодняшней презентации стала одночиповая версия компьютера DRIVE PX 2. Напомню, что в стандартной комплектации он оснащен двумя дискретными видеокартами (предположительно уровня GTX 1060) и двумя мобильными процессорами Tegra, каждый из которых содержит 6-ядерное ЦПУ (4 x Cortex-A57 + 2 x Denver 2) и 256-ядерное ГПУ. Такое же количество ядер в ГПУ самого производительного мобильного процессора Nvidia, анонсированного в январе 2015 Tegra X1 с архитектурой Maxwell. Поэтому фактически речь, судя по всему, идет о его преемнике с архитектурой Pascal. Официально Nvidia его в качестве мобильного процессора не анонсировала — с недавних пор компания утратила интерес к мобильным устройствам. Однако с учетом вполне умеренного, по сравнению с изначальным DRIVE PX 2 (250 Вт), энергопотребления одночиповой версии (10 Вт), не исключено появление процессора Tegra Pascal в будущих версиях игровых консолей Shield Tablet (2014) и Shield Android TV (2015).
Nvidia позиционирует облегченную версию DRIVE PX 2 для автопилота на загородных магистралях, тогда как полная версия позволит ездит на автопилоте «от точки до точки». Одночиповый DRIVE PX 2 в распоряжение партнеров Nvidia будет предоставлен в IV квартале этого года.
Ну и конец третьей главной новостью стал анонс Jetpack 2.3 — очередной версии программного пакета для программирования аппаратной платформы Jetson TX1. Согласно Nvidia, обновление позволит повысить скорость принятия решений (inference) в два раза.
Nvidia (1), (2), (3)
—
Источник