Процессоры Intel Core i7 и Core i9 (Skylake-X) для LGA2066: не только новая платформа, но и «слишком» новая микроархитектура

написаноAdminGWP 07.09.2017

Нe тoлькo нoвaя плaтфoрмa, нo и «слишкoм» нoвaя микрoaрxитeктурa

Нe тaк дaвнo мы изучaли прoизвoдитeльнoсть нoвoй HEDT-плaтфoрмы AMD и убeдились в тoм, чтo нa дaнный мoмeнт прoцeссoры сeмeйствa Ryzen Threadripper являются сaмыми быстрыми из имeющиxся в прoдaжe. Впрoчeм, пoкa eщe тoчкa в этoм вoпрoсe нe пoстaвлeнa, прoцeссoры с бoлee чeм 10 aктивными ядрaми Intel oбeщaeт тoлькo oсeнью. В итоге и сравнение сейчас не совсем прямое: продукты AMD имеют преимущество в количестве ядер. С другой стороны, если привязываться к цене, то все корректно: 12 (и более) ядер у Intel все равно будут стоить дороже, чем даже 16 у AMD. Но некоторых читателей интересует прямое сравнение при паритете по количеству ядер, тем более что не так давно еще не было ни Ryzen Threadripper, ни Skylake-X, а максимумом для (условно) настольных процессоров было 10 ядер платформы LGA2011–3. И с учетом цены той 10-ядерной модели (единственной на рынке), наибольший интерес покупателей вызывали процессоры с 6 и 8 ядрами. Не говоря уже о том, что для первого поколения решений для этой платформы (Haswell-E) восемь ядер было максимальным количеством.

Что же касается новой платформы Intel, LGA2066, то ее нужно считать новым решением, а не развитием предыдущих разработок. Именно с этим и связаны многие особенности функционирования сегодняшних (да и завтрашних) процессоров семейства Core X-series — в том числе, и производительность с энергопотреблением. Ранее мы этот вопрос подробно не рассматривали, поскольку знакомились с платформой на примере процессора Core i7–7740X, который относится к семейству Kaby Lake-X, так что его все это в принципе не касается. Позднее, правда, мы протестировали и нынешнего флагмана Core i9–7900X, и вот тут уже сполна насладились новшествами 🙂 Сегодня же мы вкратце остановимся на том, чем Skylake-X отличаются ото всех предыдущих разработок Intel и чем это нам грозит.

Все решают связи

Как можно увеличить производительность процессора? С учетом того, что таковой давно уже умеет выполнять одновременно несколько потоков кода, есть два пути — интенсивный и экстенсивный. Первый — повышение производительности каждого потока. Прекрасный и универсальный способ (поскольку неважно — распараллеливается ли задача, как она распараллеливается и т. п.), но сложный и ограниченный технически. Экстенсивный — наращивать количество ядер в каждом процессоре, а если и это не помогает — количество самих процессоров в системе. Метод более затратный и менее универсальный, но иногда ничего другого и не остается.

Правда вот даже в идеальном случае масштабирование будет далеко не линейным, поскольку нужны и быстрые интерфейсы. В том числе, и с периферийными устройствами. Особенно относительно скоростными — оперативной памятью, например. Когда-то производительность центральных процессоров была такой, что контроллер памяти можно было располагать и «подальше» от ядер в отдельном кристалле (а то и в нескольких) — со временем пришлось его «приближать» для увеличения скорости обмена данными. Но и шину памяти тоже приходилось делать более быстрой и широкой, по мере увеличения количества ядер в процессорах. В первых Athlon 64 на каждое ядро приходился один канал памяти, позднее — даже два и это было огромным запасом. Однако давно уже массовые процессоры вынуждены обходиться одним каналом памяти на пару ядер, а в немассовых на каждый канал (несмотря на большее их количество) приходится уже четыре ядра и больше. Впрочем, с тех пор подросла и пропускная способность канала: начинали-то мы с DDR-400 (если говорить об ИКП), а сейчас уже речь идет о DDR4–2400+, что сильно ослабляет проблему. Но не решает ее полностью.

Тем более важны интерфейсы между ядрами, а также между ними и контроллером памяти. В первых двухъядерных настольных процессорах, типа Athlon 64×2 или Pentium D, об этом никто особо не заботился — фактически представляли они собой склейки из пары одноядерных, но тогда этого хватало. Зато Core Duo (и, позднее, Core 2 Duo) оказались очень эффективными двухъядерными процессорами из-за наличия единой кэш-памяти второго уровня, работающей синхронно с ядрами. На тот момент схема была идеальной, однако не масштабируемой — когда возникла необходимость выпускать четырех- и шестиядерные модели с использованием этой микроархитектуры, Intel пришлось вернуться к все тем же «склейкам» и обмену данными между двухъядерными модулями через контроллер шины FSB. Впрочем, массовому рынку тогда многоядерные процессоры еще не слишком и требовались (шесть ядер Core2, например, существовали только в виде Xeon под Socket 604), но уже очевидно было, что за ними будущее.

Первыми попытками решить проблему стали процессоры AMD Phenom и Intel Core первого поколения, в которых использовалась общая для всех ядер кэш-память третьего уровня. К сожалению, работала она на относительно низкой частоте, причем асинхронно с ядрами — в результате чего производительность оказывалась более низкой, чем могла бы. Core это мешало не слишком — в этих процессорах изменений сравнительно с предшественниками и без того оказалось достаточно, чтобы вытягивать производительность на «хороший» уровень: интегрированный контроллер памяти (впервые в процессорах Intel), Turbo Boost, Hyper-Threading и т. п. Но, все-таки мешало. Поэтому в лабораториях компании ковалось «оружие победы», собственно и определившее развитие платформ Intel на протяжении последних шести лет. Таковым стала основанная на протоколе QPI двунаправленная кольцевая шина. Точнее, физически речь шла о четырех отдельных шинах: данных (ширина 32 байта + ЕСС), запросов, мониторинга и подтверждения. Решение простое, но позволяющее быстро обмениваться данными между процессорными ядрами, GPU (при его наличии) и кэш-памятью L3, которую удалось синхронизировать с ядрами. Первыми процессорами, использующими кольцевую шину, стали серверные восьмиядерные Nehalem-EX под LGA1567, появившиеся в 2010 году, однако знакомство с ней массового пользователя началось в 2011 — с настольных Sandy Bridge для LGA1155. С этого момента она стала стандартом и для настольных, и для серверных (стало быть, и HEDT) процессоров всех последующих поколений. Более того — в настольных наследниках Skylake/Kaby Lake кольцевая шина тоже сохранится. Но не в Skylake-X и других многоядерных процессорах.

В принципе, проблемы с многоядерными решениями начались еще пару лет назад. Кольцевая шина, вообще говоря, идеальна для двухъядерных процессоров — недаром компании даже приходилось первое время искусственно сдерживать их развитие:) Хорошо подходит она и для четырех, шести или восьми ядер — в общем там, где число «потребителей» на шине невелико, так что каждый из них до того же общего L3 может быстро «дотянуться». В общем-то, восемь ядер максимум на момент создания кольцевой шины и было, однако быстро выяснилось, что такая конфигурация уже не может быть столь же быстрой, как в настольных «малоядерных» системах: нужно использовать более низкие частоты и шины, и кэш-памяти. Собственно, с чем и связано отставание четырехъядерных процессоров для LGA2011 от своих аналогов для LGA1155, несмотря на большую емкость L3 и формальное равенство по другим параметрам. Начиная с Haswell проблему решили волюнтаристски — совпадения по количеству ядер в «настольной» и HEDT-платформе просто исчезли 🙂 Теперь снова появились, но просто потому, что Kaby Lake-X на деле имеют такое же внутреннее устройство, как и «обычные» Kaby Lake, так что и ведут себя одинаково.

Но до 12 ядер в Ivy Bridge-EX дошли. Планировалась масштабируемость кольцевой шины и дальше — до 20 ядер. Выяснилось, что для одной шины — это перебор 🙂 В итоге многоядерные процессоры фактически разделились на две линейки. Кристаллы, включающие в себя до 8 ядер в Haswell или 10 в Broadwell, были построены на классических принципах — с единой кольцевой шиной. В принципе, только их и можно было официально встретить в условно-настольных системах. А в мультисокетных серверах использовались и процессоры на других версиях кристаллов, использующих две кольцевые шины и коммутаторы между ними. В Intel решили, что наилучшим образом кольцевая шина может работать при числе ядер до 12 — соответственно, старшие версии процессоров Broadwell-EX получили 24 процессорных ядра. И 60 МБ кэш-памяти L3, но также разбитой на два блока — т. е. доступ к памяти соседнего кластера осуществлялся с существенно-большими задержками, чем к собственной. На самом деле, версий было даже три — средняя тоже содержала две шины, но замкнутой была лишь одна из них, а вторая с точки зрения математики «кольцевой» быть перестала.

Фактически в итоге компания пришла к тому же, от чего уходила — только на более высоком уровне. Несложно заметить, что и AMD в Ryzen сделала нечто подобное — только кластеры меньше: четыре ядра плюс 8 МБ L3. На подложке таковых два, а дальше уже нужно объединять восьмиядерные «двухкластерные» кристаллы в сборки из двух (Ryzen Threadripper) или четырех (Epyc), причем последних в одной системе может быть две, что в сумме позволяет предоставить пользователю 64 ядра. У Intel же в Broadwell-EX каждый кластер содержит 12 ядер и 30 МБ L3, но точно также два таковых объединяются в одном кристалле. Подобных «сборок» в одной системе может быть уже не две, а до восьми, но это требует соответствующих габаритов для своего размещения, да и стоимость подобной «максимальной» системы со 192 процессорными ядрами оказывается слишком высокой. А чтобы увеличить производительность «на единицу объема» необходимо увеличивать количество ядер, приходящихся на каждый сокет. Причем делать это нужно не увеличением количества ядер на кластер (упираемся в кольцевую шину) и не увеличением их количества (что еще сильнее ухудшит связность), а коренным образом меняя структуру связей.

Собственно, еще при анонсе Broadwell-EX было озвучено, что следующее поколение многоядерных процессоров Intel будет первой существенной переделкой архитектуры со времен Nehalem. Именно это мы и получили — причем, как всегда, одним достанутся «пироги и пышки», а другим «синяки и шишки». Серверным системам — скорее, первое. Новые процессоры используют mesh-архитектуру, хорошо зарекомендовавшую себя в Xeon Phi (Knights Landing) с их десятками ядер. В первом приближении можно считать, что одномерная топология превратилась в двумерную — с увеличением количества связей и сокращением длины маршрута передачи данных. И с увеличением количества возможных маршрутов тоже, что позволяет избегать появления узких мест. Да и размеры структуры можно увеличивать без существенного роста задержек. Казалось бы, есть повод для радости… Если не вспоминать, что для HEDT-платформы Intel пока отгружает лишь процессоры с 10-ю ядрами, для чего, в общем-то, хватало и кольцевой шины. Да и для 12 ядер тоже. Теоретически, конечно, и в этих моделях можно что-то ускорить в части задач, но ведь и «младшие» Core i7 для LGA2066 тоже получили идентичную архитектуру связей — на свои-то 6–8 ядер. К тому же, на данный момент частота синхронизации сети составляет 2,4 ГГц — против 2,8 ГГц в Broadwell-E: на старших моделях возможно ускорение межпроцессорного обмена данными за счет сокращения длины маршрутов, но вот в младших ему взяться неоткуда.

А само по себе количество пересылок данных по сети должно даже увеличиться, поскольку радикально изменилась архитектура кэш-памяти. В Broadwell она была инклюзивной, благо 2,5 МБ L3 на ядро было более чем достаточно и для хранения его 256К L2, и того, что туда «не влезло». В Skylake-X разработчики решили увеличить общую эффективность кэширования, для чего резко изменили емкость кэш-памяти L2, имеющей более низкие задержки. В итоге вместо 256К с четырехканальной ассоциативностью каждое ядро получило 1024К с 16-канальной. Это серьезное усовершенствование (впервые с момента создания первых Core на основе Nehalem фактически — уж по размеру точно), однако не позволившее сохранить старую схему с полной инклюзивностью: иначе бы пришлось и пропорционально увеличить емкость L3, а на кэши и без того требуется много транзисторов. В итоге емкость кэш-памяти третьего уровня вообще уменьшилась, а данные теперь могут находиться в L2 одного ядра и отсутствовать при этом в L3. Ассоциативность последнего тоже уменьшилась, да еще и работает он теперь не на 2,8 ГГц, а на частоте mesh, т. е. 2,4 ГГц. Отметим, что и старого значения было маловато (на фоне «малоядерных» решений), а теперь о быстром обмене данными через L3 вообще можно забыть. С другой стороны, производительность на поток может и вырасти, а еще неплохое ускорение даже при прочих равных могут получить и задачи, разбивающиеся на большое количество независимых фрагментов, но среди настольных приложений их не так уж и много. Хотя из тех, которым может пригодиться много ядер — немало.

В общем, подытоживая, новая микроархитектура изначально ориентирована на выпуск процессоров, где ядер будет много или очень много. Собственно, в уже поставляемых Xeon для LGA3647 их бывает до 28 (что по некоторым данным не предел, причем не только в отдаленном будущем), а упаковано все это в монолитный кристалл с шестиканальным контроллером памяти. А HEDT Skylake-X под LGA2066 оказались своеобразными заложниками ситуации — пока в них всего 10 ядер, с чем нормально справлялась и кольцевая шина. В какой-то степени «подсластить пилюлю» могут обещанные на осень модели с 12–18 ядрами, но только тем, кто готов за них платить. В любом случае речь идет о новой микроархитектуре, заметно отличающейся от всех знакомых нам ранее — на протяжении шести-семи лет, когда каждое поколение было просто эволюционным развитием предыдущего. Где-то она, безусловно, будет вести себя лучше, где-то хуже (и то, и другое мы на примере Core i9–7900X и Core i7–6950X уже видели), но главное — по-другому. И это необходимо учитывать и при оптимизации программного обеспечения, что несколько лет не требовалось: Core оно и есть Core; просто в каждом поколении чуть лучше. Skylake-X — новые процессоры, от представителей массового сегмента отличающиеся не только количеством ядер. И не только связями между ними, но и самими ядрами. И даже системой команд — если поддержка AVX и AVX2 внедрялись во все процессоры Core и Xeon (и даже в серверные Pentium, в отличие от настольных и мобильных), то к AVX-512 это не относится. Это расширение, предназначенное для работы с векторами длиной 512 бит (в отличие от 256 бит предыдущих версий) в виде дополнительных команд и соответствующих регистров, впервые дебютировало в Xeon Phi, но и сейчас, и в ближайшем будущем так и останется «визитной карточкой» этого семейства процессоров и, как раз, Skylake-X. Соответственно, ожидать активной работы с ним в массовом ПО не стоит. В общем-то, и использование AVX/AVX2 его разработчиками оставляет желать много лучшего (хотя в некоторых программах формально используются, но, в основном «для галочки» — чтоб добавить красивую строчку в описание новых версий, а не на практике), но тут и такого не будет: слишком мала инсталляционная база. И такой и останется, так что рассматривать AVX-512 как преимущество новых процессоров могут разве что пользователи, способные непосредственно повлиять на софт, с которым они работают. В предельном случае — если они сами себе его пишут 🙂 Для НРС-систем — нормальное и распространенное явление, но не для абстрактных «персональных компьютеров». Пусть даже и High-End.

Конфигурация тестовых стендов
Процессор
Intel Core i7–7800X
Intel Core i7–7820X
Intel Core i9–7900X
Название ядра
Skylake-X
Skylake-X
Skylake-X
Технология пр-ва
14 нм
14 нм
14 нм
Частота ядра, ГГц
3,5/4,0
3,6/4,3
3,¾,3
Кол-во ядер/потоков
6/12
8/16
10/20
Кэш L1 (сумм.), I/D, КБ
192/192
256/256
320/320
Кэш L2, КБ
6×1024
8×1024
10×1024
Кэш L3, МиБ
8,25
11
13,75
Оперативная память
4×DDR4–2666
4×DDR4–2666
4×DDR4–2666
TDP, Вт
140
140
140
Количество линий PCIe 3.0
28
28
44
Цена
T-1729322998
T-1729322808
T-1729323741

C другой стороны, простому покупателю это знание дает не слишком много — для него в первом приближении это просто самые быстрые и дорогие процессоры Intel, все еще продающиеся как «настольные» (хотя в их случае такое позиционирование становится как никогда нечетким: в «настоящих» настольных и мобильных уже и ядра несколько другие, а не только их обвязка). При равном количестве ядер — чуть менее дорогие, чем ранее, хотя благодарить за это, скорее всего, стоит внешние факторы. Может, и не только их — добавление пары ядер на планке $999 наблюдалось и при переходе от LGA2011 к LGA2011–3, а чем внедрение LGA2066 хуже-то? 🙂 Вот чем не лучше — видно по количеству линий PCIe в паре младших решений: их снова меньше. Во времена 2011–3 определенная логика в этом была, ибо оба процессора были шестиядерными (а разные тактовые частоты при всех разблокированных множителях аргумент не слишком убедительный), но подобной хирургической операции подлежал только младший из них. Теперь же оба, хотя они отличаются уже и количеством ядер. Поэтому оставим цены в покое — какие они сейчас мы точно знаем, а какими могли бы быть можно только гадать.

Процессор
Intel Core i7–5960X
Intel Core i7–6800K
Intel Core i7–6900K
Intel Core i7–6950X
Название ядра
Haswell-E
Broadwell-E
Broadwell-E
Broadwell-E
Технология пр-ва
22 нм
14 нм
14 нм
14 нм
Частота ядра, ГГц
3,0/3,5
3,4/3,6
3,2/3,7
3,0/3,5
Кол-во ядер/потоков
8/16
6/12
8/16
10/20
Кэш L1 (сумм.), I/D, КБ
256/256
192/192
256/256
320/320
Кэш L2, КБ
8×256
6×256
8×256
10×256
Кэш L3, МиБ
20
15
20
25
Оперативная память
4×DDR4–2133
4×DDR4–2400
4×DDR4–2400
4×DDR4–2400
TDP, Вт
140
140
140
140
Количество линий PCIe 3.0
44
28
44
44
Цена
T-11008382
T-13974485
T-13974488
T-13974634

Поэтому можно спокойно провести сравнение с решениями для предыдущей платформы, воспользовавшись формальным равенством по количеству ядер: две тройки процессоров у нас и получаются. Ко второй мы решили добавить в качестве ориентира еще и Core i7–5960X — в первом поколении LGA2011–3 он был самым быстрым. А также и первым «настольным» восьмиядерным процессором по совместительству тоже. Причем на тот момент альтернатив платформам Intel в рамках х86-архитектуры совсем не было, так что все вышеприведенные эпитеты относятся и к рынку в целом — еще один повод в обязательном порядке протестировать «старичка» (которому, понятно, еще жить да жить, если уж был куплен).

Процессор
AMD Ryzen 5 1600Х
AMD Ryzen 7 1800Х
Название ядра
Ryzen
Ryzen
Технология пр-ва
14 нм
14 нм
Частота ядра, ГГц
3,6/4,0
3,6/4,0
Кол-во ядер/потоков
6/12
8/16
Кэш L1 (сумм.), I/D, КБ
384/192
512/256
Кэш L2, КБ
6×512
8×512
Кэш L3, МиБ
16
16
Оперативная память
2×DDR4–2667
2×DDR4–2667
TDP, Вт
95
95
Количество линий PCIe 3.0
20
20
Цена
T-1723154074
T-1720383938

С конкурентами из ассортимента AMD тоже все просто: Threadripper нам не нужен, поскольку уже убедились в том, что и 1920Х (не самый быстрый в семействе) вполне соответствует и старшему на данный момент Core i9–7900X. Впрочем, у него и ядер больше, при этом моделей с 10-ю у AMD нет и не предвидится в скором будущем (понятно почему), а 6 и 8 доступны и в рамках массовой и недорогой платформы АМ4. Формально несколько ограниченной по периферийной составляющей, но… Вспоминаем про 28 линий PCIe 3.0 Core i7–7800X/7820X: на пару видеокарт по схеме х16+х16 этого не хватит, а одну плюс NVMe-накопитель (что будет наиболее массовым вариантом) «тянет» и обычный Ryzen. В общем, если и не совсем паритет, то близко к тому с точки зрения обычного пользователя. А для сугубых эстетов, напомним, в скором времени AMD обещает начать отгрузки «бюджетного» Ryzen Threadripper 1900Х, который по производительности будет практически полным аналогом Ryzen 7 1800X, так что в отдельном тестировании не слишком нуждается (да и нет его у нас пока на руках), но с точки зрения подключения памяти и периферии идентичен старшим моделям для TR4.

Объем памяти только у разных систем немного разный, поскольку мы устанавливаем 8 ГБ на канал, а количество каналов у платформ разное. Однако проведенные на данный момент внутренние экспресс-тесты показали, что для Ryzen 7 1800X и задач из тестового набора суммарные 16 ГБ вполне достаточны, так что необходимости в смене концепции нет. Впрочем, работа этих процессоров с памятью, а также ее влияние на другие компоненты системы — отдельный вопрос, до которого мы надеемся (наконец-то!) подробно «докопаться» в ближайшее время. Пока лишь отметим, что для процессоров под АМ4 мы (как и в предыдущих тестированиях) используем DDR4–2933, что немного выше штатного значения, но проблем не составляет. Для процессоров Intel — штатные частоты памяти. Что для них, в общем-то, большого значения не имеет — при желании увеличить производительность, разгонять надо в первую очередь не память и даже не ядра (тем более, как видим, в решениях под LGA2066 Intel и без того частоты ядер заметно подняла), а шины и кэш.

Методика тестирования

Методика подробно описана в отдельной статье. Здесь же вкратце напомним, что базируется она на следующих четырех китах:

Подробные результаты всех тестов доступны в виде полной таблицы с результатами (в формате Microsoft Excel 97—2003). Непосредственно же в статьях мы используем уже обработанные данные. В особенности это относится к тестам приложений, где все нормируется относительно референсной системы (AMD FX-8350 с 16 ГБ памяти, видеокартой GeForce GTX 1070 и SSD Corsair Force LE 960 ГБ) и группируется по сферам применения компьютера.

iXBT Application Benchmark 2017

Задача хорошо масштабируется путем разбиения на небольшие независимые фрагменты, что хорошо «ложится» как на Ryzen, так и на новые Core X-Series. Впрочем, для LGA2011–3 прирост производительности при переходе от шести ядер к восьми тоже квазилинейный, а вот от восьми до десяти — намного меньший, чем можно было ожидать. Вполне возможно, что это как раз связано со снижением эффективности работы кольцевой шины при увеличении количества ядер (напомним, что де-факто в Intel ограничили их количество в кластере 12-ю, что не на много больше 10). Зато Skylake-X масштабируются отлично «по всему фронту» — в результате чего уже Core i7–7820X обгоняет былого флагмана компании. Да и Core i7–7800X может сделать это же, но с предыдущим лидером для 2011–3. Тоже немало. Это делает оба упомянутых процессора самыми быстрыми при сравнении «ядро к ядру»: Ryzen немного превосходил Broadwell-E, но не Skylake-X.

Аналогичные по логике работы приложения, так что и распределение результатов тоже аналогичное. Фактически не будь у AMD такого «туза в рукаве», как Ryzen Threadripper, LGA2066 с т. з. производительности могла бы считаться очень успешной платформой (цены и энергопотребление — вопросы отдельные и к ним мы вернемся позднее). Однако история, как известно, не терпит сослагательного наклонения.

В принципе, радикально ничего не изменилось — просто в этих программах степень утилизации многоядерности вообще оставляет желать лучшего, так что на роль метода для увеличения производительности она подходит слабо. Но подходит. Но выглядит все, конечно, куда менее впечатляюще, хотя и явным провалом не является.

Вот с обработкой фотографий — скорее всего, он. Восемь ядер еще «переварить» можно, хотя в паре «новых» платформ и переход с шести до восьми уже крайне невелик. Дальше можно и не дергаться. LGA2066 со своими самыми эффективными (без шуток) ядрами выглядит, конечно, победителем в таких условиях. Хотя понятно, что, сравнительно с массовыми решениями, прирост производительности явно непропорционален увеличению затрат.

Распознавание текста тоже хорошо разбивается на независимые задачи, что позволяет утилизировать практически все возможности современных процессоров (правда это, к сожалению, и по их энергопотреблению хорошо заметно, но об этом позже). Результат, правда, не столь впечатляющий, как в видеокодировании или рендеринге (в частности Core i7–7800X все же отстает от Core i7–5960X), но очень хороший. Впрочем, как мы уже знаем, это все равно не позволяет Core i9–7900X считаться «царем горы» (поскольку против лома нет приема, а этот самый «лом» в виде большого количества ядер в нужный момент времени оказался в руках AMD), но при паритете по ядрам процессоры для LGA2066 в очередной раз выигрывают. А для 2011–3 — вообще проигрывали.

Небольшая разница в производительности между Core i7–6900K и i7–6950X связана с тем, что уровень производительности обоих этих процессоров оказался достаточным, чтобы уже немного начал влиять и накопитель. Это хорошо заметно, если сравнить результаты выполнения обоих подтестов WinRAR (напомним, что второй мы вводили специально для тестов дисковой подсисстемы) — они уже достаточно близки, чего на массовых процессорах (и не только ультрабучных) даже в помине нет.

Но новых Skylake-X «былая роскошь» тоже никак не касается: они в этом тесте намного медленнее. Производительность с увеличением количества ядер растет, но очень медленно — очевидно, что «узкое место» где-то в «другом месте». И мы его уже знаем — в этих процессорах кэш L3, как уже было сказано, стал работать медленнее, да еще и не может считаться средством быстрого обмена данными между ядрами. Если сравнить производительность с процессорами семейства AMD Ryzen, то там, в общем-то, аналогичные проблемы в виде двухсегментного L3 присутствуют и итоговая производительность тоже существенно ниже, чем могла бы быть.

Можно ли обойти проблему оптимизациями программного обеспечения? Разумеется, можно. Но это нужно делать специально — и для Ryzen, и для Skylake-X тоже. А ведь ранее, как уже было сказано, на протяжении многих лет единая кольцевая шина и быстрый L3 были неотъемлемым компонентом всех процессоров Intel всех сегментов — начиная от Celeron (за исключением «атомного» семейства) и заканчивая HEDT-процессорами. Теперь последние превратились в нечто отдельное — плюс добавились альтернативные разработки, тоже претендующие на высокую производительность. И это обязательно нужно учитывать.

Ну, а в этих программах — в общем-то, необязательно. Впрочем, хорошо видно и то, что в них вообще масштабируемость относительно невысокая — высокий темп прироста производительности наблюдается лишь до восьми ядер Intel, а у процессоров AMD и вовсе до шести. Но последние тут и от Broadwell-E отставали, да и Skylake-X это семейство при прочих равных не то, чтоб сильно превосходят (в отличие от некоторых примеров выше, где новые шестиядерники могут тягаться и со старыми восьмиядерниками).

В принципе, сводный результат производительности к новой платформе Intel скорее благосклонен, чем нет. Новые процессоры стали быстрее старых, да и при сравнении с продуктами AMD уже паритета в ситуации «ядро к ядру» не наблюдается. Масштабируемость в линейке тоже улучшилась, что особенно важно в ожидании выхода в свет моделей с 12+ ядрами. Словом, с производительность все неплохо. Она ниже, конечно, чем у Ryzen Threadripper, но лишь до тех пор, пока последние имеют фору в количестве ядер — с «качеством»-то у Intel все лучше. Но это только если ограничиться производительностью.

Энергопотребление и энергоэффективность

Intel часто ругали за небольшое увеличение производительности процессоров от поколения к поколению, забывая при этом о том, что параллельно компании удавалось и снижать энергопотребление своих изделий. В рамках тренда на всеобщую мобилизацию, второе было как раз более актуальным — иначе бы компактных ноутбуков на четырехъядерных процессорах, способных часами работать в автономном режиме, мы бы не увидели, равно как и тонких моноблоков с «настольными» процессорами внутри. Да и в серверных платформах энергопотребление давно уже является главным сдерживающим фактором, так что там тоже приходилось работать над ним очень плотно. И мы уже отмечали ранее, что успехи AMD несколько скромнее — даже при последнем «большом рывке» по сути удалось достичь лишь уровня Haswell-E. Потом еще и выяснилось, что на Ryzen 7 1800X кристаллы явно отбираются специально — более дешевый процессор этого семейства с индексом 1700Х не только работает медленнее, но и «жрет» больше. Но в этом нет ничего особенного — с процессорами Intel та же история. Из-за чего, собственно, энергопотребление i7–6950X и i7–6800K различалось на какие-то 10%, а вовсе не в полтора раза, как можно было предположить по числу ядер.

Но сравнение единиц Ватт разницы потеряло всякий смысл после выхода Skylake-X — потребление энергии ими резко увеличилось. Особенно если обратить внимание на чисто «процессорную» линию +12 В: i9–7900X первый попавший к нам в руки процессор, который и по ней в некоторых тестах «прокачивал» 200 Вт. Младшие модели более «экологичны», но все равно — в среднем шестиядерный i7–7800X, потребляет больше, чем восьмиядерный Ryzen 7 1800X или десятиядерный i7–6950X на максимуме.

В итоге имеем резкое падение энергоэффективности — даже ниже уровня Haswell-E, до которого, напомним, AMD подрасти удалось. Новая платформа Intel же отступила куда-то на рубежи старых Ivy Bridge-E. Понятно, что над решением этой проблемы компания будет работать, да и новые Skylake-X с большим количеством ядер скорее всего удастся «уложить» в те же рамки, что и имеющиеся при увеличении производительности, но факт остается фактом: новая платформа «очень горячая» в прямом смысле этого слова. Вполне возможно, что виновата в этом как раз новая архитектура межъядерных связей — которая будет эффективной (сравнительно со старыми) при большом их количестве, но вот для младших моделей радости от этого мало. Для них это шаг назад. И очень большой.

iXBT Game Benchmark 2017

В данном случае (как и в предыдущем тестировании) результаты игровых приложений мы дадим «одной строкой» и без подробных комментариев: понятно, что HEDT-платформы игровыми решениями считать сложно — как бы AMD и Intel не стремились убедить в обратном. Не потому, что они не подходят для игр — просто избыточны. Где-то даже могут и проиграть «обычным» настольным решениям, но лишь тогда, когда производительность не ограничена видеокартой — что в современных игровых проектах обычно редкость. Да и не в современных тоже с поправкой на время выпуска соответствующих видеокарт, т. е. не тогда, когда мы запускаем игру пятилетней давности на современном топе. Впрочем, мы в основной линейке тестов используем и «не топ» изначально, а карту уровня чуть выше среднего. И на практике это более массовый случай, разумеется, чем самые дорогие видеоускорители или несколько таких, однако ничего удивительного, что тут основные вопросы «хватит-не хватит» возникают у покупателей процессоров за сто долларов (или старых за 200, что в принципе сопоставимо), а не новейших многоядерных решений.

В принципе, все как и ожидалось. Хотя если докапываться до запятых, можно сказать, что кое-где процессоры для новой платформы отстают от старой. Однако в этом тоже нет ничего удивительного — в таких условиях если что и сказывается пока на результатах, так это емкость и скорость работы кэш-памяти, а в этом плане Skylake-X похвастаться особо нечем.

Итого

Если бы процессоры под LGA2066 появлялись «в нормальных условиях», но такими же, как сейчас, им бы наверняка простили и выросшее энергопотребление: все-таки производительность увеличилась, цены упали, рост количества ядер на горизонте замаячил… А что не все характеристики стали лучше — так на этапе внедрения технических нововведений часто возникают определенные шероховатости. В конце концов, если вспомнить историю, то, например, к LGA1366 серьезных претензий не было — разве что брюзжание части потенциальных (а не реальных) покупателей, но не более того. Дело в том, что альтернативы новой платформе Intel тогда, в общем-то, практически не было. Вот процессоры под LGA1156 были встречены чуть более прохладно, поскольку на рынке уже присутствовала LGA1366 по сравнимым ценам и с несколько более широкими перспективами. Ну, а с момента выхода Sandy Bridge в разных своих ипостасях конкуренция как таковая в сегменте высокой производительности стала внутрифирменной и легко предсказуемой. Благо все процессоры начали использовать сходные архитектурные принципы, плавно эволюционируя от поколения к поколению.

Теперь же альтернативные решения есть. И речь не только о Ryzen Threadripper, который спустя считанные месяцы после анонса LGA2066 занял место самого производительного решения на рынке, — альтернативой могут считаться и в некоторой степени претендующие на массовый рынок Ryzen под АМ4. Правда, в

AdminGWP

Предыдущая запись

Медиа-плеер Ritmix РФ-9300

Следующая запись

Процессоры Intel Core i7 и Core i9 (Skylake-X) для LGA2066: не только новая платформа, но и «слишком» новая микроархитектура

Медиа-плеер Ritmix РФ-9300

LG показала безрамочный смартфон с Hi-Fi звуком

Вам также может понравиться