Первое знакомство с платформой Apollo Lake и ее сравнение с предшествующими разработками
Столкнувшись в свое время с проблемами одновременного освоения нового техпроцесса и внедрения новой же микроархитектуры, компания Intel решила разделить эти два события. О подходе «тик-так» мы как раз недавно вспоминали в связи с его отменой в рамках «взрослого» семейства Core: там добавилась еще одна стадия, «оптимизация». Официально она была введена лишь сейчас (пресловутый Kaby Lake), фактически — еще в 2014-м (Haswell Refresh), но главное не даты, а то, что от «третьего шага» этого цикла ждать, в общем-то, особо нечего. Ни в прошлом, ни в настоящем, да и в будущем, скорее всего, ничего не изменится: немного улучшенные степпинги кристаллов и отлаженное производство позволяют немного улучшать потребительские характеристики (например, предлагая новым покупателям немного больше производительности «за те же деньги»), но не радикально менять картину мира.
Однако… Однако у Intel давно уже в работе не одна архитектура процессоров, а несколько — благо ресурсы позволяют. Иногда это оказывается полезным: к примеру, наличие с 2000 года «бегущих по соседним дорожкам» P6 и NetBurst очень помогло компании, когда архитектура NetBurst забежала в своеобразный тупик. Тупик не был полный, многие наработки NetBurst были позднее использованы в первых Core, но это случилось позднее. А в 2006 году универсальной х86-архитектурой компания сделала дальнейшее развитие Pentium Pro (сильно эволюционировавшее за прошедшие годы, конечно). Но и тогда эта архитектура не осталась единственной: оказалось, что в «загашнике» Intel есть уже разработки, превосходящие даже ноутбучные процессоры по экономичности, но уступающие (опять же — даже им) по производительности. Так на рынке появились первые Atom. Эти процессоры поначалу находились в тени своих более именитых родственников, что, впрочем, полностью отвечало их позиционированию. В частности, компания регулярно объясняла, что «нетбуки» — это вовсе не «маленькие дешевые ноутбуки» (а «неттопы» — не просто компактные десктопы), а специализированные устройства, предназначенные исключительно для потребления контента, а не созидательного труда. Положение дел усугублялось тем, что первые «атомные» платформы слабовато подходили даже для «потребления», умудряясь «тормозить» на несложных сайтах или отказываясь воспроизводить видеоролики во многих форматах, а их эволюция в основном заключалась лишь в увеличении степени интеграции компонентов, но не их функциональности. Немаловажным фактором являлись и задержки с освоением «тонких» норм производства. Впрочем, обо всем этом мы писали еще пять лет назад, тестируя уже третье (и последнее на тот момент) поколение Atom, так что повторяться не имеет смысла.
Последующие две итерации прогресса мы тоже уже изучали, так что остановимся на них вкратце. Bay Trail — первое существенное изменение микроархитектуры процессорных ядер, совпавшее с увеличением их количества до четырех или даже (в серверных моделях) до восьми, интеграцией GPU HD Graphics Gen7 (аналогичной «взрослым» Ivy Bridge), а также периферийных контроллеров в одну микросхему, выпускаемую по нормам 22 нм. В общем, ничего общего с предыдущими линейками по основным параметрам. Braswell — простой шринк получившегося на 14 нм. «Подросло» графическое ядро — до 12/16 (против четырех) EU Gen8 (как у младших Broadwell), стало больше USB-портов, появилась поддержка интерфейса SATA600 — благодаря более тонким нормам производства периферийная составляющая новых SoC улучшилась. А вот процессорные ядра остались практически такими же, что приводило к примерно равной производительности Bay Trail и Braswell на одинаковой частоте. Да и с частотами первое время, надо заметить, не все было гладко, а увеличившаяся производительность GPU оказалась в основном невостребованной из-за слабой процессорной части — в итоге казуальные игры как работали, так и продолжали работать, а что-то более серьезное на таких системах все равно «не взлетало». Словом, платформа Braswell в какой-то степени нас даже немного разочаровала. И не только нас: до сих пор в продаже встречаются разнообразные планшеты и ноутбуки на базе Bay Trail, благо ими можно было под конец жизни семейства закупиться очень дешево, а обновление почти ничего практически значимого не принесло. Даже энергоэффективность Braswell в общем-то оказалась той же (хотя переход с 22 нм на 14 нм позволял надеяться на ее улучшение) — при том, что в процессорах линейки Core этот параметр продолжал улучшаться. Результатом этого стала фактическая смерть Atom на серверном рынке: SoC линейки Xeon D стали куда более привлекательными для компактных систем.
Однако в конце прошлого года на смену Braswell пришел Apollo Lake. Пришел он тихо и незаметно — вообще, шуметь любят т. н. компьютерные энтузиасты, а они обычно на продукты этого класса внимания не обращают. Да и характеристики новых SoC были слишком уж похожи на уже привычные: 14 нм, два или четыре процессорных ядра, 12 или 18 графических конвееров, 2 SATA, 8 USB и т. п. Но мы недаром выше упомянули «тик-так» 😉 Данный подход к линейке Atom до Bay Trail не применялся, зато Braswell, по сути, оказался типичным «тиком»: улучшенный техпроцесс без архитектурных изменений. Теперь же настала пора «така», т. е. смены архитектуры. В первую очередь изменились процессорные ядра: Goldmont вместо Airmont. Кроется ли за сменой названия какое-нибудь существенное улучшение, нам как раз и надо проверить, потому что переход с Silvermont на Airmont как-то не вдохновил 🙂 Этим мы и займемся, упомянув лишь о том, что и GPU тоже изменился качественно, хотя и остался прежним количественно — теперь это Gen9 (как в Skylake), включая новый блок видеодекодирования: с поддержкой HEVC, VP9 и прочего. Собственно, последнее, пожалуй, наиболее важно с практической точки зрения: рассчитывать на прорывы в игровой производительности все равно не приходится (хотя бы потому, что эти чипы слишком уж «зажаты» по энергопотреблению, а приличные видеокарты сами по себе «жрут» на порядок больше как минимум), а вот смотреть онлайн-видео желающих достаточно — использование «атомных» платформ для создания медиаплееров началось далеко не вчера. Впрочем, исследование возможностей новых устройств применительно к сценарию HTPC — отдельная благодатная тема. Сегодня же мы займемся «классическими» задачами.
Конфигурация тестовых стендов
Процессор
Intel Celeron J3455
Intel Celeron N3150
Intel Pentium J2900
Название ядра
Apollo Lake
Braswell
Bay Trail
Технология пр-ва
14 нм
14 нм
22 нм
Частота ядра std/max, ГГц
1,5/2,3
1,6/2,08
2,41/2,66
Кол-во ядер/потоков вычисления
4/4
4/4
4/4
Кэш L1 (сумм.), I/D, КБ
128/96
128/96
128/96
Кэш L2, КБ
2048
2048
2048
Кэш L3 (L4), МиБ
—
—
—
Оперативная память
2×DDR3L-1866
2×DDR3L-1600
2×DDR3L-1333
TDP, Вт
10
6
10
Графика
HDG 500 (Gen 9)
HDG (Gen 8)
HDG (Gen 7)
Кол-во EU
12
12
4
Частота std/max, МГц
250/750
320/640
688/896
Стоит отметить, что, в отличие от Braswell, но как и в Bay Trail, в новом семействе сразу появились и ноутбучные (TDP 6 Вт), и «настольные» (TDP 10 Вт) чипы. В предыдущем поколении вторые вышли лишь в рамках обновления платформы и нам в руки не попадались. Что же касается нового семейства, то старший в нем Pentium J4205 нам тоже пока не достался, поэтому список участников тестирования будет немного перекошенным с точки зрения пуристов: J2900 — это самый быстрый представитель линейки Bay Trail, аналогами которого в новых семействах следует считать как раз J4205 или J3710 (тем более что у них и частоты примерно одинаковые). Но на практике это не слишком важно: Celeron N3150 был одним из самых продаваемых представителей Braswell и на настольных платах (к моменту появления обновленных моделей все, кто хотели приобрести нечто подобное, это уже сделали), так что как раз его и будет заменять в магазинах J3455. А что J2900 был когда-то самым быстрым и относительно редким (лучше продавались более дешевые Celeron J1900) — так это даже хорошо: если средний процессор новой линейки обгоняет только аналогичных по рангу предшественников, в этом большой заслуги нет, а вот если более дорогие модели — это уже интереснее.
Процессор
Intel Pentium G2130
AMD A6–7470K
Название ядра
Ivy Bridge
Godavari
Технология пр-ва
22 нм
28 нм
Частота ядра std/max, ГГц
3,2
3,7/4,0
Кол-во ядер/потоков вычисления
2/2
½
Кэш L1 (сумм.), I/D, КБ
64/64
96/32
Кэш L2, КБ
2×256
1024
Кэш L3, МиБ
3
—
Оперативная память
2×DDR3–1600
2×DDR3–2133
TDP, Вт
55
65
Графика
HDG
Radeon R5
Кол-во EU/ГП
6
256
Частота std/max, МГц
650/1050
800
Цена
T-8525969
T-13582496
Без сравнения с настольными процессорами обойтись сложно, но не менее сложно и подобрать подходящие ориентиры. В рамках продукции «с одного завода» продаваемые одновременно решения обязаны быть разными, а что может «оправдать» процессор с большим энергопотреблением и выделением? Только высокая производительность. Следовательно, любой Celeron линейки G просто обязан быть быстрее, чем Celeron же, но J-семейства — это аксиома, не нуждающаяся в проверке. А вот сравнение с процессорами пятилетней давности уже может быть куда более интересным, причем и с практической точки зрения: например, если у кого-то вышла из строя плата с LGA1155 или просто захотелось поменять большой и пыльный серый ящик начального уровня на что-нибудь компактное. Сравнить «всех со всеми» можно будет (как обычно) в наших итогах тестирования по единой методике, а сегодня мы будем ориентироваться на Pentium G2130.
Если же говорить о междуфирменной конкуренции, то в данном случае все обстоит еще забавнее: на данный момент пути-дорожки AMD и Intel разошлись уже настолько далеко, что сравнивать непосредственно имеет смысл лишь считанные модели. Конечно, никто пока не отменял Socket AM1 и/или BGA-модификации тех же Kabini/Beema, но они занимают промежуточное положение между линейками Celeron J и Celeron G, нуждаясь (как правило), подобно последним, в активном охлаждении, но имея производительность и функциональность на уровне первых (Athlon 5350 в свое время выступал как раз на уровне Pentium J2900, а его замена на Athlon 5370 — это еще +5% тактовой частоты, и всё). Их GPU при этом получше выглядит в игровых приложениях, но и его мало для серьезного геймера, а уж про декодирование видео лучше вовсе не вспоминать. В общем, с ними сравнивать неинтересно. А вот с недавно протестированным младшим одномодульным (и весьма недорогим) А6–7470К — напротив: очевидно, что у этого процессора не лучшим образом обстоят дела с энергоэффективностью, зато на нем действительно можно играть в какие-то игры. А как при этом обстоят дела с общесистемной производительностью — мы и посмотрим.
Методика тестирования
Методика подробно описана в отдельной статье. Здесь же вкратце напомним, что базируется она на следующих четырех китах:
Подробные результаты всех тестов доступны в виде полной таблицы с результатами (в формате Microsoft Excel 97–2003). Непосредственно же в статьях мы используем уже обработанные данные. В особенности это относится к тестам приложений, где все нормируется относительно референсной системы (как и в прошлом году — ноутбука на базе Core i5–3317U с 4 ГБ памяти и SSD емкостью 128 ГБ) и группируется по сферам применения компьютера.
iXBT Application Benchmark 2016
Задача на чистые вычисления, где, тем не менее, четыре «атомных» ядра все еще не могут полноценно конкурировать с двумя «взрослой» архитектуры — даже пятилетней давности. Да и всего один «двухполуядерный» модуль настольных моделей AMD не так уж плох. Во всяком случае, верно это было при его сравнении с Bay Trail и Braswell — новая суррогатная платформа Intel по меньшей мере не медленнее. С поправкой на количество поддерживаемых потоков вычисления, разумеется, но и требования по охлаждению у этих SoC совсем иные, нежели у «настоящих» настольных процессоров. И полуторакратное превосходство над J2900, который когда-то был лучшим в своем классе, у J3455, который уже не самый быстрый, но сравнимый с упомянутой моделью и по частотам, и по количеству ядер, говорит само за себя.
Эти приложения еще хуже относятся к представителям «атомных» платформ, да и хорошей утилизацией многопоточности не все из них похвастаться могут — соответственно, «настольные» процессоры (даже бюджетные и/или устаревшие) выглядят еще лучше, чем в предыдущем случае. Однако прирост производительности в своей нише тоже хорошо заметен: треть сравнительно с J2900 или полтора раза на фоне N3150. Тестируя топовые решения Intel мы такого давно не видели —, но там и «расти» сложно. А вот «атомы», как видим, ускорять еще есть куда.
Относительный прирост производительности «в группе» сравним с приложениями обработки растровой графики, «пропасть» между суррогатами и «взрослыми» процессорами, еще более заметна, но тут уж ничего не поделаешь — как не раз уже было сказано, эта программа, фактически, наилучшим образом оптимизирована еще под Core 2 Duo. «Стройтехника» это в какой-то степени может скомпенсировать высокими частотами модулей, Pentium на базе Core и компенсировать нечего, а «атомные» модели как отставали, так и будут это делать. Впрочем, сегодня нам важнее то, что и их производительность растет, причем хорошо заметными темпами.
Которые иногда позволяют уже догнать и самый быстрый А6 для FM2+. К быстрым процессорам никак не относящийся, конечно, но вот решения компании для АМ1, например, были еще медленнее. Причем развитием данной платформы в AMD заниматься не стали — видимо, слишком уж неперспективно это было. В Intel же за цикл «тик-так» сумели вывести Atom на более высокий уровень — то, чего несколько не хватало Braswell.
Старый код, как не раз уже было сказано, плохо относится к интенсивным методам повышения производительности, но неплохо реагирует на экстенсивные: количество ядер, их частоту и т. п. Несмотря на это J3455 сумел хоть на 15%, но обогнать J2900, а ведь ему это было и не обязательно: все-таки (если сравнить две платформы) позиционируется он на уровне J1900, который был еще медленнее.
А вот и самая страшная часть нашей истории — несмотря на поддержку более быстрой памяти (частота 1866 МГц против всего 1333), Celeron J3455 «продул» Pentium J2900. Что, впрочем, может быть связано как раз с самой памятью — некоторые задержки могли и увеличиться, а к ним архиваторы более требовательны, чем к ПСП. Поэтому поставим галочку «и такое бывает», и перейдем к другим тестам.
Например, очень интересны результаты файловых операций, где производительность зависит во многом от накопителя, но вот интегрированные SATA-контроллеры Braswell и Bay Trail (где вообще поддерживался еще только SATA300) заставить «выложиться на полную» стандартно используемый нами шустрый SSD еще не могли. Apollo Lake тоже не может как видно, но пытается это сделать более успешно 🙂
Нецелевое использование всех наших испытуемых, зато хорошо видно — кто как с расчетами справляется. Впрочем, ничего нового — старенький Pentium лидирует, а J3455 почти догоняет хотя бы одномодульные настольные процессоры AMD, существенно превосходя предшественников.
Как уже было сказано выше, при тестировании старших моделей настольных процессоров, такого прироста производительности мы не видели…, а вот как бы ни с момента появления Sandy Bridge шесть лет назад. Абсолютный уровень производительности, тем не менее, по-прежнему слишком низкий, так что если таковая на первом месте, Apollo Lake все столь же «не нужен», как и Bay Trail с Braswell. Однако не стоит забывать, что у этих платформ и требования к энергии и теплоотводу совсем другие, нежели у «полноценных» настольных решений. Если же последние начать «зажимать» по теплопакету, оказывается, что общий уровень производительности Celeron J3455 вполне сравним с Pentium 3805U, а старые суррогатные платформы ни Intel, ни AMD на такие подвиги были неспособны. Собственно, неудивительно, что 3805U — последний Pentium без поддержки Hyper-Threading в CULV-сегменте, да и настольные модели этой линейки недавно тоже обрели поддержку дополнительных потоков вычисления: производительность остается их основным преимуществом, так что если «растут» Celeron и Pentium J-семейства, нужно «подтягивать» и Y/U/G. Закономерный процесс.
Энергопотребление и энергоэффективность
Что касается собственно энергопотребления, то оно, как видим, у Apollo Lake заметно уменьшилось по сравнению с Bay Trail и даже Braswell (Braswell в этом плане нас несколько разочаровал, но Apollo Lake первое впечатление от 14 нм исправил), которые на фоне настольных процессоров и без того смотрелись неплохо. Теперь стало еще лучше: полная связка из SoC, платы и памяти уже укладывается в среднем в 9 Вт, да и минимальное энергопотребление (не в простое, а в ходе выполнения вполне осмысленных задач) сократилось еще радикальнее. В общем, в плане «абсолютной экономичности» тоже прогресс. И производительность выше. А как это сказывается на «энергоэффективности»?
Мы решили добавить к G2130 еще пару настольных Pentium — для наглядности. Как видим, именно над энергоэффективностью в Intel и работали последние годы: прогресс в области производительности невелик, но на выполнение одинаковой работы процессоры тратят все меньше и меньше энергии. Дошло до того, что «атомные» платформы при всей своей абсолютной экономичности начали проигрывать по эффективности настольным — уж слишком медленно они работали. Их применение оставалось оправданным там, где нужно было хоть как-то укладываться в десяток ватт или менее. Но если такой необходимости не было, зато желание получить максимальную «отдачу на ватт» у покупателя присутствовало — выбор был очевиден. Теперь — не совсем: настольные платформы все равно быстрее, но уже нужно оценивать, насколько обязательной для вас является высокая чистая производительность (со всеми побочными эффектами в нагрузку).
iXBT Game Benchmark 2016
Чтобы сэкономить время и место, мы приведем ровно одну диаграмму — сводный игровой балл, введенный нами в этом году как раз для упрощения сравнений разных платформ, не претендующих на серьезное игровое применение. Сюда мы тоже добавили результаты более современных настольных Pentium.
Как видим, производительность интегрированной графики бюджетных процессоров Intel последние пять лет неуклонно увеличивалась — причем куда быстрее, чем у процессорных ядер. Правда (и это тоже не новость), модели под LGA1151 для игр подходят плохо — куда хуже, чем любой настольный APU AMD. Собственно, последние вообще уже имеет смысл рассматривать именно как видеокарту начального уровня, в которую просто встроены один-два процессорных модуля. Зачем? А чтобы обойтись без покупки дискретного процессора:) У Intel же подход обратный: на ведущих позициях все еще процессорные ядра. GPU улучшается, но в первую очередь он нужен для того, чтобы не покупать дискретную видеокарту — хотя бы иногда. Что, в общем-то, и делает предложения AMD и Intel по-хорошему несравнимыми и упрощает выбор.
Что же касается главных наших сегодняшних героев, то формально Celeron J3455 предшественников разгромил в пух и прах. А фактически — даже старички под LGA1155 и то справлялись с играми лучше. Точнее, в целом не справлялись никак, но «атомные» платформы до сих пор даже более никакие. Чуда не произошло, список доступных владельцу такой системы игр будет несколько более обширным, нежели ранее, но входить в него будут игровые проекты все тех же классов: либо совсем «без графики», либо десятилетней давности, либо и то, и другое сразу 🙂
Итого
Итак, что мы имеем в сухом остатке? Новые SoC Apollo Lake стали заметно быстрее и заметно же экономичнее. Поскольку произошло это одновременно, они стали и намного более энергоэффективными: кумулятивный эффект сравним как минимум с переходом с LGA1155 сразу на LGA1151. В общем, как уже было сказано выше, таких одномоментных «прорывов» в процессорной части не было со времен Sandy Bridge, даже если считать «полный тик-так» — с учетом фактического разочарования от Braswell.
Из этого, впрочем, не следует, что в ближайшее время можно будет заменить Core на Atom — так же, как в свое время вместо Pentium 4 внезапно на всем рынке «расцвели» разнообразные Core 2 Duo/Quad. Возможно, однако, сфера применения «атомных» ядер вновь немного расширится — вплоть до возобновления их использования в серверных процессорах (один из представителей линейки Denverton в январе уже даже анонсирован, но C3338 — лишь двухъядерная модель, а «старые» планы по данному семейству говорили о числ