Новые карты зеленых должны быть своего рода дополнением платформы машинного обучения подготовленной компанией из Санта-Клары. Там, где возникает необходимость в высокой точности и большой мощности для вычислений, должны быть использованы графические процессоры Tesla P100. Если же расчеты не должны быть настолько точны, или точность может быть меньшей, должны применяться модели Tesle P40 и P4.
Ниже вы можете просмотреть техническую спецификацию новых чипов, по сравнению с их предшественниками:
| Tesla P40 | Tesla P4 | Tesla M40 | Tesla M4 |
Ядра CUDA | 3840 | 2560 | 3072 | 1024 |
Ядро | GP102 | GP104 | GM200 | GM206 |
Тактовая частота ядра | 1303 Мгц (1531 Мгц в Boost) | 810 Мгц (1063 Мгц в Boost) | 948 Мгц (1114 Мгц в Boost) | 872 Мгц (1072 Мгц в Boost) |
Тактовая частота памяти | 7,2 Ггц | 6 Ггц | 6 Ггц | 5,5 Ггц |
Ширина шины | 384 бит | 256 бит | 384 бит | 128 бит |
Объем памяти | 24 ГБ | 8 ГБ | 12 ГБ/24 ГБ | 4 ГБ |
Производительность (FP32) | 12 TFLOPS | 5,5 ТЕРАФЛОПС | 7 ТЕРАФЛОПС | 2,2 TFLOPS |
Производительность (INT8), Tera-Operations Per Second | 47 TOPS | 22 TOPS | n/d | n/d |
Число транзисторов | 12 млрд | 7,2 млрд. | 8 млрд. | 2,94 млрд |
Производственный процесс | TSMC 16 нм | TSMC 16 нм | TSMC 28 нм | TSMC 28 нм |
TDP | 250 В | 50, В – 75 В | 250 В | 50, В – 75 В |
Nvidia утверждает, что благодаря использованию библиотек TensorRT можно использовать в полной мере возможности архитектуры Pascal. Разработчики смогут легко конвертировать расчеты для своих нейронных сетей, подготовленных под точностью FP16/FP32 на INT8, благодаря чему скорость вычисления значительно увеличится. Связано это конечно же с получением более низкого качества результатов, но, как утверждают зеленые, при расчетах, связанных с выводами, это не имеет столь большого значения, как при стандартном обучении в машиностроении.
Компания из Санта-Клара показала также новую библиотеку обработки видео DeepStream SDK. С ее помощью и при сотрудничестве с TensorRT, возможно полное декодирование видео и анализ материала на картах Tesla. Именно в этом последнем элементе, Nvidia видит большой потенциал, если речь идет о применении нейронных сетей, а спрос на соответствующее программное обеспечение должен быть чрезвычайно большой. Из раскрытых данных мы знаем, что Tesla P40 будет доступна для партнеров компании с октября этого года, а в ноябре дебютирует Tesla P4. Цены на оборудование не разглашаются.