Методика тестирования компьютерных систем образца 2017 года
Как мы недавно писали, долгое время процессоры для массовых платформ Intel были ограничены четырьмя вычислительными ядрами. Это вызвало недовольство некоторых требовательных пользователей и заставляло присматриваться к «немассовым» HEDT, где количество ядер постепенно увеличивалось. Правда механизм этого «увеличения» тоже вызывал вполне справедливые нарекания.
Точнее, сначала все было просто — в рамках LGA1366 появилась и торговая марка Core i7 сначала в четырех-, а потом и шестиядерном дизайне. Максимальном для данной платформы. Но вот кристаллы Sandy Bridge-Е для LGA2011 содержали восемь ядер, а в версиях для HEDT было доступно лишь шесть из них. Позднее платформа была обновлена до Ivy Bridge-Е —, но с сохранением все тех же шести ядер в Core i7. При этом в Xeon с тем же исполнением LGA2011 встречался и десятиядерный «средний» кристалл, а старшие модели Ivy Bridge-ЕХ вообще насчитывали 15 ядер —, но High-End Desktop ограничивался младшим шестиядерным.
Ничего не изменилось и при переходе на LGA2011–3 — только «младший» стал сначала восьми-, а затем и десятиядерным. Формально это рост, фактически же в Xeon попадались и 18 или даже 24 ядра соответственно. Т. е. по сути темпы увеличения количества ядер в настольном (хотя бы условно-настольном) сегменте заметно отставали от серверного: если в последнем со времен первых Nehalem для LGA1366 количество ядер увеличилось в шесть раз, то в первом — лишь в два с половиной. Да и то не совсем, поскольку Core i7–6950X получил рекомендованную цену, от которой все уже успели за 10 лет отвыкнуть — $1569 вместо привычных «круглых» $999. На последней же «планке» так и осталась «жить» восьмиядерная модель, пусть и немного обновленная, так что чуть более быстрая и энергоэффективная.
В общем, радоваться было особо нечему. Да, конечно, стоимость ядер «для народа» немного снижалась, а их количество росло —, но очень медленно и ограниченно. Но тут наступил 2017 год, буквально из пепла восстала AMD с очень удачным семейством Ryzen 7 (способном изначально конкурировать и с более дорогими HEDT-процессорами Intel), начались разговоры о многочиповых версиях Ryzen не только для серверного рынка, и… Анонс платформы Intel LGA2066 на Computex 2017 оказался достаточно интересным двумя моментами. Во-первых, компания наконец-то снизила стоимость десятиядерного процессора семейства Skylake-X до «положенного уровня» в $999. Во-вторых, анонсированы были модели на базе не только младшего (по-прежнему десятиядерного) кристалла, но и среднего (старший доступен только в варианте под LGA3647) — содержащего 18 процессорных ядер. По цене $1999, правда, но хоть в таком виде. Заодно в обиход была запущена торговая марка Core i9, т. е. ассортимент названий процессоров Intel Core изменился впервые с 2010 года — когда в рамках LGA1156 появились Core i3.
Первые тесты Skylake-X, впрочем, показали не слишком оптимистичные результаты: существенная перетряска архитектуры (впервые за много лет) требует отдельной оптимизации программного обеспечения. Кроме того, у решений для новой платформы слишком выросло энергопотребление. Впрочем, обо всем этом мы уже писали, так что повторяться нет смысла. А вот модели семейства AMD Ryzen Threadripper, напротив, превзошли все ожидания. Хоть без шероховатостей запуск новой платформы не обошелся, да и решения для нее тоже нельзя назвать слишком экономичными или дешевыми, но… Уже 12-ядерный 1920Х продемонстрировал примерный паритет с Core i9–7900X, а ведь одинаковую с последним рекомендованную цену имеет Ryzen Threadripper 1950Х, снабженный уже 16-ю ядрами. Понятно, что далеко не все программы способны использовать внезапно открывшиеся возможности, да и вообще оптимизация ПО требуется постоянно (и под «основную» линейку Ryzen тоже), однако с точки зрения рынка высокопроизводительных многоядерных настольных процессоров это оказалось прорывом.
На этом анонсы от AMD временно прекратились, а Intel по осени провела давно ожидаемое многими обновление массовой платформы LGA1151… которая в итоге, правда, стала несовместимой с предыдущей платформой с тем же названием. То есть сокеты-то, конечно, механически совместимы, но не более того. Соответственно, новая модификация пока «страдает» от недостатка чипсетов (как бюджетных, так и наоборот), да и процессоры для нее надо (пере)запускать заново. Типичные детские болезни, решением которых компания занимается, но полностью все проблемы будут решены лишь в следующем году. Но на фоне этого переполоха большинство пользователей как-то и забыло об обещанных многоядерных моделях для LGA2066. Да и чего о них вспоминать — если базовые частоты (на которые многие до сих пор зачем-то обращают внимание) стали существенно более низкими, а уровень TDP (которое опять-таки многие с завидным упорством путают с энергопотреблением) повысился, значит на первый взгляд ничего хорошего ожидать не стоит. Даже если будут быстрее старых — все равно цена далеко выбивается за привычные на массовом рынке рамки. Собственно, и 1000 долларов за процессор-то далеко уже за ними — со времен «ценовых войн» десятилетней давности.
В итоге, и более старые экстремальные решения были чаще поводом устроить теоретическое обсуждение на базе результатов тестов, нежели реальным кандидатом на покупку массовым «физическим лицом». Однако даже теоретический интерес — тоже интерес, а любопытство стоит удовлетворять при возможности 🙂 У нас появилась возможность протестировать старший Core i9–7980XE Extreme Edition — и мы ей воспользовались. Хотя бы для того, чтобы понять — чего от моделей старшей линейки можно ожидать. Да и почему в Intel столь неохотно «подпускали» подобные решения к настольным компьютерам — тоже, возможно, станет понятно.
Конфигурация тестовых стендов
Процессор
AMD Ryzen Threadripper 1950X
Intel Core i9–7900X
Intel Core i9–7980XE
Название ядра
Ryzen
Skylake-X
Skylake-X
Технология производства
14 нм
14 нм
14 нм
Частота ядра, ГГц
3,4/4,0
3,¾,3
2,6/4,2
Количество ядер/потоков
16/32
10/20
18/36
Кэш L1 (сумм.), I/D, КБ
1024/512
320/320
576/576
Кэш L2, КБ
16×512
10×1024
18×1024
Кэш L3, МиБ
32
13,75
24,75
Оперативная память
4×DDR4–2666
4×DDR4–2666
4×DDR4–2666
TDP, Вт
180
140
165
Количество линий PCIe 3.0
60
44
44
Цена
виджет Яндекс.Маркет
виджет Яндекс.Маркет
виджет Яндекс.Маркет
Главными героями сегодняшнего тестирования будут, естественно, две модели Core i9 и старший AMD Ryzen Threadripper 1950X. С последним все понятно — это сборка из двух Ryzen на одной подложке, позволяющая удвоить все количественные характеристики последних. Intel же предпочитает монолитные кристаллы для разных сегментов рынка. Оба подхода имеют свои плюсы и минусы, на чем мы сегодня останавливаться не будем. Отметим только, что, несмотря на физические отличия, 7980ХЕ тоже выглядит похожим на 7900Х — просто добавили ядер и соответствующим образом увеличили кэши. Неудивительно — масштабируемая архитектура. Причем после отказа (в этом семействе) от кольцевой шины и перехода к сетевой топологии — масштабируемая относительно легко. Максимальные тактовые частоты, достигаемые, как обычно, при нагрузке на одно-два ядра, тоже сопоставимы — они от полного количества ядер не зависят. Требования к охлаждению немного подросли, что выводит за рамки почти все воздушные кулеры, но и с Threadripper та же история. Тем более, что теплопакет, вообще говоря, задекларирован для штатного режима работы, а все процессоры для LGA2066 можно свободно разгонять. Соответственно, в этом случае и тепловыделение растет, да и для снабжения процессора энергией, возможно, пригодятся дополнительные разъемы питания на плате. Но сегодня мы такими экспериментами заниматься не будем, а просто протестируем производительность и энергопотребление в штатном режиме.
Процессор
AMD Ryzen 7 1800Х
Intel Core i7–8700K
Название ядра
Ryzen
Coffee Lake
Технология производства
14 нм
14 нм
Частота ядра, ГГц
3,6/4,0
3,7/4,7
Количество ядер/потоков
8/16
6/12
Кэш L1 (сумм.), I/D, КБ
512/256
192/192
Кэш L2, КБ
8×512
6×256
Кэш L3, МиБ
16
12
Оперативная память
2×DDR4–2666
2×DDR4–2666
TDP, Вт
95
95
Количество линий PCIe 3.0
20
16
Цена
виджет Яндекс.Маркет
виджет Яндекс.Маркет
И сравним их с процессорами, более-менее приближенными к массовому сегменту — лучшими решениями для АМ4 и LGA1151 соответственно. Первый подороже (официально — с розницей бывает всякое; особенно пока самые нетерпеливые покупатели не успокоятся), но это не так уж важно — в ассортименте AMD есть и Ryzen 7 1700, сопоставимый по цене с Core i7–8700K, а при помощи разгона его производительность можно увеличить и до уровня, более высокого, чем штатный для 1800Х. Энергопотребление, правда, при этом (да и на одинаковых частотах тоже) будет более высоким, но иногда этим можно и пренебречь. Равно как и ограничениями массовых платформ на объем памяти или количество подключаемых к шине PCIe устройств — на практике оно все равно очень часто будет достаточным. В противном же случае придется обратиться к HEDT-платформе одного из производителей, но вовсе не обязательно при этом приобретать топовый процессор: в ассортименте AMD и Intel есть и более «гуманные» по цене модели.
Методика тестирования
Методика подробно описана в отдельной статье. Здесь же вкратце напомним, что базируется она на следующих четырех китах:
Подробные результаты всех тестов доступны в виде полной таблицы с результатами (в формате Microsoft Excel 97—2003). Непосредственно же в статьях мы используем уже обработанные данные. В особенности это относится к тестам приложений, где все нормируется относительно референсной системы (AMD FX-8350 с 16 ГБ памяти, видеокартой GeForce GTX 1070 и SSD Corsair Force LE 960 ГБ) и группируется по сферам применения компьютера.
А игровые тесты мы сегодня использовать не стали, поскольку считаем, что применение процессоров ценой в $999 и выше в игровом компьютере за гранью добра и зла — как бы их не позиционировали производители. Понятно, что с такой нагрузкой они справятся, но это могут и более дешевые модели. Лучше уж «вложиться» в видеосистему, да и прочую обвязку.
iXBT Application Benchmark 2017
Программы нагружают работой все ядра, но всему есть предел — эффективность их использования выше определенной точки быстро снижается. Где-то до десяти ядер прирост можно считать близким к линейному, но не далее — хотя бы из-за того, что результирующая частота работы будет более низкой. При этом даже преимущество в количестве ядер не позволяет i9–7980XE оказаться лидером.
А вот в этих приложениях — позволяет, причем и преимущество в скорости можно уже считать заметным. Понятно, что в цене оно намного более весомо, но оценивать процессоры с этой точки зрения вообще не слишком оправдано — модели для массовых платформ мгновенно победят. Причем даже не факт, что это будут именно Ryzen 7 / Core i7:) А Threadripper или Core i9 вообще нужны лишь тогда, когда в приоритете именно максимальная производительность одиночного процессора. Что, прямо скажем, бывает не так уж и часто.
Тем более, что иногда и о «максимальной производительности» говорить не приходится. Даже если постараться максимально задействовать пакетный режим работы, полностью исключив интерактивную составляющую (что плохо распараллеливается) и задержки со стороны оператора (у которого есть все шансы оказаться самым слабым звеном и в менее производительной системе), очевидно, что «сверхмногоядерные» процессоры для обработки видео и фото просто… не нужны. Шесть-восемь ядер есть уже и в действительно настольных платформах — вот ими можно и ограничиться.
Кстати, благодаря появлению в наших руках Core i9–7980XE, удалось выяснить и некоторые подробности «внутренней кухни» Photodex ProShow Producer: программа умеет распределять нагрузку максимум на 32 логических процессора. Даже если их 36 (как в нашем случае) или больше — не важно. Но она, по крайней мере, об этом прямо сообщает при работе, а сколько приложений, традиционно относящихся к многопоточным (по массовому опыту их использования на старых настольных Core i7, например, где и было-то всего восемь потоков), поступают аналогичным образом молча? То-то и оно.
А вот опять пример идеально распараллеливаемой пакетной обработки данных — и квазилинейное масштабирование. Собственно, как и предполагалось: такие задачи с успехом воспользуется и не одним многоядерным процессором. Вопрос только в том, насколько подобные ситуации часты. И насколько критично время их обработки, поскольку ускориться с 20 часов до 10 — это одно, а с 20 минут до 10 — совсем другое. Хотя и там, и там разница в два раза.
Как уже было сказано выше, подходы AMD и Intel к HEDT-системам различаются — и каждый имеет свои плюсы и минусы. Это касается даже такой бытовой задачи, как сжатие данных. Ryzen Threadripper — это два Ryzen, каждый из которых снабжен своим двухканальным контроллером памяти, причем частоты работы от такой операции практически не пострадали. В итоге какой-никакой прирост производительности получился — пусть и скромный. Да и разница между 1950Х и 1920Х тоже была за счет разного количества ядер, но примерно на одной частоте — пусть и еще более скромная.
В случае же процессоров Intel мы имеем две совершенно разных микроархитектуры. А два представителя Skylake-X различаются количеством ядер и их частотами, но имеют одинаковый контроллер памяти и одинаковую же mesh-сеть (с одинаковой частотой синхронизации 2,4 ГГц). Вот примерно на одном уровне и топчутся, причем уровень этот не слишком отличим от Core i7–8700K.
Если посмотреть подробные результаты входящих в группу программ, то легко заметить, что 7980ХЕ заметно обгоняет 7900Х там, где нужно что-то посчитать «в фоне», но не может ничем похвастаться в интерактивных приложениях. В SolidWorks так и вовсе он проигрывает даже Core i7–7800X, т. е. младшему Skylake-X для LGA2066 (впрочем, оба Ryzen Threadripper в этом приложении проигрывают своим «половинкам», что, однако, на утешение никак не тянет). В конечном итоге он стал самым быстрым из протестированных, но правильнее считать его равным 1950Х. Вдвое более дешевому. И в большей степени обгоняющему своего партнера по ценовому спаррингу.
Конечный итог выглядит достаточно забавным — фактически «осенними продуктами» Intel отыграла прорыв AMD в области повышения производительности процессоров. Во всяком случае, с точностью до миллилитра топовые процессоры для LGA1151 и LGA2066 работают чуть быстрее, чем для АМ4 и TR4 соответственно. Правда с практической точки зрения какой-то смысл в этом есть лишь применительно к первой платформе, поскольку в ее случае и с ценами все нормально, и другие преимущества есть. Вот у Skylake-X паритет в производительности наблюдается только при разной цене решений и наоборот 🙂 Но объясняется это просто — на самом деле, не так уж и много в нашей тестовой методике задач что для Ryzen Threadripper, что для Core i9. Даже несмотря на то, что, по просьбам трудящихся мы сильно обогатили ее многопоточным ПО, вырезая (буквально по живому) разнообразный интерактив.
Энергопотребление и энергоэффективность
Однако стоит отметить, что в таких условиях Core i9–7980XE оказывается более экономичным, нежели i9–7900X. Это не какое-то ограничение системы питания плат и/или охлаждения — в этом случае результат был бы одинаковым. Так что просто частоты в разных режимах загрузки подобраны достаточно грамотно для того, чтобы новый экстремал мог не только работать быстрее (что ему как мы видели, как раз не всегда удается), но и потреблять меньше энергии.
В итоге по совокупности факторов платформа в старших своих версиях стала и более «энергоэффективной». Что логично — при многопоточной загрузке большее количество низкочастотных ядер способно работать более эффективно, чем меньшее с более высокой тактовой частотой. Возможный ответ и на то, почему в смартфонных SoC все производители уже потянулись за многоядерностью. Правда при всей привлекательности такого подхода стоит понимать, что большее количество ядер — это и большая площадь кристалла, а значит и его стоимость. И неприятные побочные эффекты в случаях, когда этой самой «многопоточной загрузки» не обнаружится. Скомпенсировать последнее можно гибким управлением тактовой частотой, а вот первое — нечем.
Итого
В принципе, с точки зрения абстрактного технического прогресса, появление на свет старшей подлинейки процессоров для LGA2066 можно оценивать только положительно. Не потому, что ранее такое количество ядер было вообще недоступно — в серверных процессорах оно встречается, как уже было сказано выше, со времен LGA2011–3. Вот только всего пару лет назад за 18-ядерный Xeon более низкой частоты «просили» порядка семи тысяч долларов, а сейчас можно уложиться в две (во всяком случае, если смотреть на рекомендованные цены). А 14 ядер в новом семействе вообще обойдется дешевле, чем 10 всего лишь год назад. Кого за это благодарить — каждый пусть решает сам. Но, в общем, и AMD тоже нынче «играет» на этом поле (чего тоже не было ни год, ни два… ни пять лет назад), и играет неплохо — по крайней мере, с учетом конечных цен продуктов.
Основная же проблема в том, что такие решения нужны слишком уж малому количеству пользователей — не так-то просто загрузить их работой. В домашнем персональном компьютере — так и вовсе практически невозможно (в лучшем случае — лишь иногда и на очень короткое время). А вот их разработка и даже простое производство обходится дорого, независимо от того, делается ли специальный кристалл или сборка из заранее отобранных «удачных». Собственно, поэтому и цены таких решений заметно отличаются от привычных для массового рынка — выводить их на массовый рынок все равно не представляется возможным. Да и нужны ли они там? Времена, когда каждый шаг увеличения производительности центрального процессора персонального компьютера существенно увеличивал возможности последнего, осталось в прошлом. Но все же такие «шаги», как видим, делаются (и неважно, по каким причинам), чем те, кому такие процессоры все-таки нужны, могут распорядиться с пользой.