75% от нового лидера игровой 3D-графики на ПК
Содержание
Представляем базовый детальный материал с исследованием Nvidia GeForce GTX 1070.
Справочные материалы
Объект исследования: Ускоритель трехмерной графики (видеокарта) Nvidia GeForce GTX 1070 8 ГБ 256-битной GDDR5X PCI-E
Сведения о разработчике: Компания Nvidia Corporation (торговая марка Nvidia) основана в 1993 году в США. Штаб-квартира в Санта-Кларе (Калифорния). Разрабатывает графические процессоры, технологии. До 1999 года основной маркой была Riva (Riva 128/TNT/TNT2), с 1999 года и по настоящее время — GeForce. В 2000 году были приобретены активы 3dfx Interactive, после чего торговые марки 3dfx/Voodoo перешли к Nvidia. Своего производства нет. Общая численность сотрудников (включая региональные офисы) около 5000 человек.
Часть 1: Теория и архитектура
Совсем недавно мы рассматривали видеокарту GeForce GTX 1080 — новейшее решение компании Nvidia, основанное на первом графическом процессоре архитектуры Pascal, вышедшее после длительного перерыва из-за застоя в разработке техпроцессов и ставшее наиболее производительным на рынке. Оно еще даже не успело появиться в магазинах нашей страны, как настало время для анонса еще одной модификации на этом же GPU — менее дорогого варианта на основе урезанного по производительности графического процессора той же модели.
Модель GeForce GTX 1070 стала второй видеокартой на базе первого графического процессора архитектуры Nvidia Pascal — GP104. Новинка поддерживает абсолютно все возможности архитектуры Pascal, описанные нами в базовом обзоре топовой версии, включая мультипроецирование — одновременную отрисовку в нескольких разных проекциях, позволяющую улучшить изображение на многомониторных конфигурациях и повысить производительность в среде виртуальной реальности. Из других интересных технологий можно отметить VRWorks Audio, служащую для точного расчета распространения звуковых волн при помощи GPU.
Графический процессор GP104 отличается от предыдущих чипов семейства Maxwell по большей части применением нового технологического процесса 16 нм, который позволил сделать более сложный чип, имеющий большее количество исполнительных блоков и работающий на высокой тактовой частоте. Как и в старшей модификации, графический процессор GeForce GTX 1070 работает на частотах выше 1,6 ГГц, но урезание по количеству функциональных блоков (а возможно также и использование менее скоростной GDDR5-памяти) привело к снижению типичного энергопотребления до 150 Вт. Это стало возможным в основном благодаря применению продвинутого технологического процесса 16 нм FinFET на фабриках TSMC при изготовлении видеочипа GP104, получившего большее количество транзисторов, по сравнению с аналогичными решениями архитектуры Maxwell.
Видеочип в составе видеокарты GeForce GTX 1070 имеет слегка сниженные характеристики производительности, он работает на высокой частоте, содержит 1920 потоковых вычислительных ядер и 120 блоков TMU при неизменных 64 блоках ROP. Это хоть и меньше, чем у GTX 1080, но привело к приличному росту общей производительности 3D-рендеринга, по сравнению с GPU предыдущего поколения. Сочетание архитектурных преимуществ Pascal, нового более «тонкого» техпроцесса, а также весьма быстрой GDDR5-памяти вылилось в преимущество в скорости над GeForce GTX 970 на величину порядка 50–70% (в среднем около 60%) по данным самой Nvidia. Возможно, цифра производителя GPU слишком оптимистична, реальный прирост скорости рендеринга в играх мы самостоятельно определим далее в нашем материале. Но в том, что GeForce GTX 1070 получилась очень быстрой, нет никаких сомнений.
Обычно между выпуском двух топовых моделей видеокарт, отличающихся производительностью и ценой, проходит больше времени, но в этот раз у Nvidia получился совсем короткий промежуток между днями их анонса и выпуска в продажу. И в непростых экономических условиях нашей страны это очень неплохо, ведь отдать более 50 тысяч рублей за видеокарту готовы далеко не все, а младшая модификация на основе графического процессора GP104, пусть и слегка урезанного по количеству функциональных блоков, будет стоить гораздо меньше, не так уж много уступая старшему решения по производительности, и полностью аналогичного по своим возможностям. Так что еще до появления новинки в рознице, можно с уверенностью утверждать, что GeForce GTX 1070 получит большую популярность среди покупателей. Благодаря меньшей розничной цене по сравнению с GTX 1080, новая модель сразу же занимает в своем ценовом диапазоне сильную позицию, и сегодня мы в этом убедимся.
Так как рассматриваемая сегодня новая модель видеокарты компании Nvidia основана на графическом процессоре архитектуры «Pascal», имеющей много общего с предыдущей архитектурой «Maxwell», то перед прочтением данного материала советуем ознакомиться с нашими статьями о ранних видеокартах компании Nvidia:
- [17.05.16] Nvidia GeForce GTX 1080 — новый лидер игровой 3D-графики на ПК
- [01.06.15] Nvidia GeForce GTX 980 Ti — самый производительный однопроцессорный ускоритель игрового класса
- [22.04.15] Nvidia GeForce GTX Titan X — самый мощный однопроцессорный ускоритель
- [19.09.14] Nvidia GeForce GTX 980 — последователь GeForce GTX 680, обгоняющий даже GTX 780 Ti
- [12.03.14] Nvidia GeForce GTX 750 Ti — Maxwell начинает с малого… несмотря на Maxwell
Для начала мы рассмотрим подробные характеристики видеоплаты GeForce GTX 1070, основанной на урезанном графическом процессоре, уже известном нам под кодовым именем GP104.
Графический ускоритель GeForce GTX 1070
Параметр
Значение
Кодовое имя чипа
GP104
Технология производства
16 нм FinFET
Количество транзисторов
7,2 млрд.
Площадь ядра
314 мм²
Архитектура
Унифицированная, с массивом общих процессоров для потоковой обработки многочисленных видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX
DirectX 12, с поддержкой уровня возможностей Feature Level 12_1
Шина памяти
256-битная: восемь независимых 32-битных контроллеров памяти с поддержкой GDDR5 и GDDR5X памяти
Частота графического процессора
1506 (1683) МГц
Вычислительные блоки
15 активных (из 20 в чипе) потоковых мультипроцессоров, включающих 1920 (из 2560) скалярных ALU для расчетов с плавающей запятой в рамках стандарта IEEE 754–2008;
Блоки текстурирования
120 активных (из 160 в чипе) блоков текстурной адресации и фильтрации с поддержкой FP16- и FP32-компонент в текстурах и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растровых операций (ROP)
8 широких блоков ROP (64 пикселя) с поддержкой различных режимов сглаживания, в том числе программируемых и при FP16- или FP32-формате буфера кадра. Блоки состоят из массива конфигурируемых ALU и отвечают за генерацию и сравнение глубины, мультисэмплинг и блендинг
Поддержка мониторов
Интегрированная поддержка до четырех мониторов, подключенных по интерфейсам Dual Link DVI, HDMI 2.0b и DisplayPort 1.2 (1.3/1.4 Ready)
Спецификации референсной видеокарты GeForce GTX 1070
Параметр
Значение
Частота ядра
1506 (1683) МГц
Количество универсальных процессоров
1920
Количество текстурных блоков
120
Количество блоков блендинга
64
Эффективная частота памяти
8000 (4×2000) МГц
Тип памяти
GDDR5
Шина памяти
256-бит
Объем памяти
8 ГБ
Пропускная способность памяти
256 ГБ/с
Вычислительная производительность (FP32)
около 6,5 терафлопс
Теоретическая максимальная скорость закраски
96 гигапикселей/с
Теоретическая скорость выборки текстур
181 гигатекселей/с
Шина
PCI Express 3.0
Разъемы
Один разъем Dual Link DVI, один HDMI и три DisplayPort
Энергопотребление
до 150 Вт
Дополнительное питание
Один 8-контактный разъем
Число слотов, занимаемых в системном корпусе
2
Рекомендуемая цена
$379—449 (США), 34 990 (Россия)
Выпущенная сегодня модель видеокарты GeForce GTX 1070 получила вполне логичное наименование, аналогичное такому же решению из предыдущей серий GeForce. Оно отличается от своего прямого предшественника GeForce GTX 970 только измененной цифрой поколения. Новинка становится в текущей линейке компании на шаг ниже нынешнего топового решения GeForce GTX 1080, ставшего флагманом новой серии до выпуска решений на GPU еще большей мощности.
Рекомендованные цены на новую топовую видеоплату Nvidia составляют $379 и $449 для обычных версий партнеров Nvidia и специального издания Founders Edition, соответственно. По сравнению с топовой моделью, это очень хорошая цена с учетом того, что GTX 1070 уступает ей около 25% в худшем случае. И на момент анонса и выхода сегодняшняя новинка становится лучшим по производительности решением в своем классе. Российская рекомендованная цена менее привлекательна, так как в нашу цену вложены дополнительные расходы: налоги, транспортные и другие накладные расходы.
Анонсом второй модели видеокарты на основе чипа GP104 компания Nvidia бьет по защитным укреплениям конкурирующей компании AMD, которая пока что планирует скорый выпуск только меньших по мощности моделей. Судя по имеющейся официальной и неофициальной информации, у компании AMD на лето запланирован выпуск разве что менее мощных решений в рамках будущего поколения, с индексами до 480 и не более этого. Так что пока что у GeForce GTX 1070 и GTX 1080 прямых конкурентов просто не будет, а сравнивать младшую новинку пока что можно разве что с Radeon R9 390X и Fury.
У графического процессора GP104 в модификации GeForce GTX 1070 решили оставить полную 256-битную шину памяти, хотя применили не новый тип памяти GDDR5X, а очень быструю GDDR5, которая работает на высокой эффективной частоте в 8 ГГц. Объем установленной на видеокарту памяти с такой шиной может быть равен 4 или 8 ГБ, и, чтобы обеспечить максимальную производительность нового решения в условиях высоких настроек и разрешениях рендеринга, модель видеокарты GeForce GTX 1070 была также оснащена 8 ГБ видеопамяти, как и ее старшая сестра. Этого объема хватит для запуска любых 3D-приложений с максимальными настройками качества на несколько лет.
Специальное издание GeForce GTX 1070 Founders Edition
При анонсе GeForce GTX 1080 в начале мая было объявлено специальное издание видеокарты под названием Founders Edition, имеющее более высокую цену, по сравнению с обычными видеокартами партнеров компании. То же самое относится и к новинке. В этом материале мы снова расскажем о специальном издании видеокарты GeForce GTX 1070 под названием Founders Edition. Как и в случае старшей модели, Nvidia решила выпустить такой вариант референсной видеокарты производителя по более высокой цене. Они утверждают, что многие игроки и энтузиасты, покупающие дорогие видеокарты топового уровня, хотят продукт с соответствующим «премиальным» видом и ощущением от него.
Соответственно, именно для таких пользователей на рынок будет выпущена видеокарта GeForce GTX 1070 Founders Edition, которая спроектирована и выполнена инженерами Nvidia из премиальных материалов и компонентов, вроде алюминиевой крышки GeForce GTX 1070 Founders Edition, а также низкопрофильной задней пластины, прикрывающей оборотную сторону печатной платы и достаточно популярной среди энтузиастов.
Как вы можете видеть по фотографиям платы, GeForce GTX 1070 Founders Edition унаследовала ровно тот же индустриальный дизайн, присущий референсному варианту GeForce GTX 1080 Founders Edition. В обеих моделях применяется радиальный вентилятор, выбрасывающий нагретый воздух наружу, что очень полезно как в маленьких корпусах, так и многочиповых SLI-конфигурациях с ограниченным физически пространством. Выдув нагретого воздуха наружу вместо его циркуляции внутри корпуса позволяет снизить температурную нагрузку, повысить результаты разгона и продлить время жизни компонентам системы.
Под крышкой референсной системы охлаждения GeForce GTX 1070 скрывается алюминиевый радиатор специальной формы с тремя встроенными тепловыми трубками из меди, отводящими тепло от самого графического процессора. Тепло, отведенное тепловыми трубками, затем рассеивается при помощи алюминиевого радиатора. Ну и низкопрофильная металлическая пластина на оборотной стороне платы также предназначена для обеспечения лучших температурных характеристик. Она также имеет убираемую секцию для лучшего движения воздуха между несколькими видеокартами в SLI-конфигурациях.
Что касается системы питания платы, то GeForce GTX 1070 Founders Edition имеет четырехфазную систему питания, оптимизированную для стабильного снабжения энергией. Компания Nvidia уверяет, что использование специальных компонентов в GTX 1070 Founders Edition позволило повысить эффективность электроснабжения, стабильность и надежность по сравнению с GeForce GTX 970, обеспечив лучшие показатели при разгоне. В собственных тестах компании графические процессоры плат GeForce GTX 1070 легко превосходили значение в 1,9 ГГц, что близко к результатам старшей модели GTX 1080.
Видеокарта Nvidia GeForce GTX 1070 будет доступна в розничных магазинах начиная с 10 июня. Рекомендуемые цены на GeForce GTX 1070 Founders Edition и решения партнеров отличаются, и в этом заключается самый главный вопрос к этому специальному изданию. Если партнеры Nvidia будут продавать свои видеокарты GeForce GTX 1070 по цене, начиная от $379 (на рынке США), то Founders Edition референсного дизайна Nvidia будет стоить уже $449. Много ли найдется энтузиастов, готовых переплачивать за, скажем прямо, сомнительные преимущества референсного варианта? Время покажет, но мы считаем, что референсная плата интересна скорее как вариант, доступный к покупке в самом начале продаж, а позднее смысл его приобретения (да еще за большую цену!) уже сводится к нулю.
Остается добавить, что печатная плата референсной GeForce GTX 1070 схожа с таковой у старшей видеокарты и обе они отличаются от устройства предыдущих плат компании. Значение типичного энергопотребления для новинки составляет 150 Вт, что меньше значения для GTX 1080 почти на 20% и близко к потреблению энергии видеокартой предыдущего поколения GeForce GTX 970. Референсная плата Nvidia имеет уже привычный набор разъемов для присоединения устройств вывода изображения: один Dual-Link DVI, один HDMI и три DisplayPort. Причем, появилась поддержка новых версий HDMI и DisplayPort, о которой мы написали в обзоре модели GTX 1080.
Архитектурные изменения
Видеокарта модели GeForce GTX 1070 основана на чипе GP104, первенце нового поколения графической архитектуры Nvidia — Pascal. Эта архитектура взяла в основу решения, отработанные еще в Maxwell, но в ней есть и некоторые функциональные отличия, о которых мы подробно писали в обзоре топовой видеокарты GeForce GTX 1080.
Главным изменением новой архитектуры стал технологический процесс, по которому будут выполнены все новые графические процессоры. Применение техпроцесса 16 нм FinFET при производстве GP104 позволило значительно повысить сложность чипа при сохранении сравнительно невысокой площади и себестоимости, и первый же чип архитектуры Pascal имеет заметно большее количество исполнительных блоков, в том числе обеспечивающих новую функциональность, по сравнению с чипами Maxwell похожего позиционирования.
Видеочип GP104 по своему устройству схож с аналогичными решениями архитектуры Maxwell, и подробные данные об устройстве современных GPU вы можете найти в наших обзорах предыдущих решений компании Nvidia. Как и предыдущие графические процессоры, чипы новой архитектуры будут иметь разную конфигурацию вычислительных кластеров Graphics Processing Cluster (GPC), потоковых мультипроцессоров Streaming Multiprocessor (SM) и контроллеров памяти, и в GeForce GTX 1070 уже произошли некоторые изменения — часть чипа была заблокирована и неактивна (выделено серым):
Хотя в состав графического процессора GP104 входит четыре кластера GPC и 20 мультипроцессоров SM, в версии для GeForce GTX 1070 он получил урезанную модификацию с аппаратно отключенным одним кластером GPC. Так как каждый кластер GPC имеет выделенный движок растеризации и включает в себя пять мультипроцессоров SM, а каждый мультипроцессор состоит из 128 CUDA-ядер и восьми текстурных блоков TMU, то в этой версии GP104 активны 1920 CUDA-ядер и 120 блоков TMU из 2560 потоковых процессоров и 160 текстурных блоков, имеющихся физически.
Графический процессор, на котором основана видеокарта GeForce GTX 1070, содержит восемь 32-битных контроллеров памяти, дающих итоговую 256-битную шину памяти — ровно как в случае старшей модели GTX 1080. Подсистема памяти не была урезана для того, чтобы обеспечить достаточно высокую пропускную способность памяти с условием применения GDDR5-памяти в GeForce GTX 1070. К каждому из контроллеров памяти привязано по восемь блоков ROP и 256 КБ кэш-памяти второго уровня, поэтому чип GP104 и в этой модификации также содержит 64 блоков ROP и 2048 КБ кэш-памяти второго уровня.
Благодаря архитектурным оптимизациям и новому техпроцессу, графический процессор GP104 стал самым энергоэффективным графическим процессором на данный момент. Инженеры компании Nvidia смогли повысить тактовую частоту больше, чем они рассчитывали при переходе на новый техпроцесс, для чего им пришлось хорошо поработать, тщательно проверив и оптимизировав все узкие места предыдущих решений, не позволяющие им работать на более высокой частоте. Соответственно, GeForce GTX 1070 также работает на очень высокой частоте, более чем на 40% выше референсного значения для GeForce GTX 970.
Так как модель GeForce GTX 1070 является, по своей сути, просто чуть менее производительной GTX 1080 с GDDR5-памятью, то она поддерживает абсолютно все технологии, описанные нами в обзоре первенца новой линейки компании Nvidia. Чтобы получить больше деталей об архитектуре Pascal, равно как и поддерживаемых ей технологиях, вроде улучшенных блоков вывода и обработки видеоданных, поддержки асинхронных вычислений Async Compute, технологии мультипроецирования Simultaneous Multi-Projection, изменениях в многочиповом рендеринге SLI и новом типе синхронизации Fast Sync, стоит ознакомиться с этим материалом.
Высокопроизводительная GDDR5-память и ее эффективное использование
Мы уже писали об изменениях в подсистеме памяти у графического процессора GP104, на котором основаны модели GeForce GTX 1080 и GTX 1070 — контроллеры памяти, имеющиеся в составе этого GPU, поддерживают как новый тип видеопамяти GDDR5X, о котором подробно написано в обзоре GTX 1080, так и старую добрую GDDR5-память, известную нам вот уже несколько лет.
Чтобы не слишком много потерять в пропускной способности памяти в младшей модели GTX 1070 по сравнению со старшей GTX 1080, в ней оставили активными все восемь 32-битных контроллеров памяти, получив полноценный 256-битный общий интерфейс видеопамяти. Кроме этого, видеокарту оснастили самой высокоскоростной GDDR5-памятью, которая только была доступна на рынке — с эффективной частотой работы в 8 ГГц. Все это обеспечило ПСП в 256 ГБ/с, в отличие от 320 ГБ/с у старшего решения — примерно на столько же были урезаны и вычислительные возможности, так что баланс был соблюден.
Не забываем, что хотя пиковая теоретическая пропускная способность важна для производительности графических процессоров, нужно обращать внимание и на эффективность ее использования. В процессе рендеринга, множество разных узких мест может ограничивать общую производите