Кому могут быть полезны процессоры AMD Bulldozer?

Кому могут быть полезны процессоры AMD Bulldozer?

В конце 2011 года компания AMD наконец-то соизволила представить процессоры Bulldozer. Эти процессоры разрабатывались на протяжении нескольких лет и AMD давно грозилась представить «убийц» Intel. Но перехвалила свое детище…

Сначала давайте разберемся, что из себя представляет микроархитектура, а затем перейдем к анализу, кому этот трактор нужен?

Модуль процессора Bulldozer

Во-первых, новые процессоры выпущены по новому техпроцессу – 32 нм. На рисунке выше представлена диаграмма работы модуля Bulldozer. Да, AMD представила принципиально новую микроархитектуру. Но лучше ли она старой – это большой вопрос. Отдел маркетинга AMD решил продвигать новые процессоры четырех-, шести- и восьмиядерные с двумя, тремя и четырьмя модулями соответственно. В таблице можно видеть основные модели новой серии, которые можно встретить в продаже в Украине.

Модель Кол-во ядер Частота, ГГц Turbo Core, ГГц Max Turbo Core, ГГц Кэш L1, Кб Кэш L2, Мб Кэш L3, Мб
FX-8150 8 3,6 3,9 4,2 384 8 8
FX-8120 8 3,1 3,4 4,0 384 8 8
FX-6100 6 3,3 3,6 3,9 288 6 8
FX-4100 4 3,6 3,7 3,8 192 4 8

Итак, из чего состоит модуль Bulldozer? Блок выборки и декодирования команд общий для двух «ядер», находящихся в модуле. Ядро состоит из блока целочисленных вычислений с кэшем L1. Блок вычислений с плавающей точкой, а также кэш L2 общий для обоих ядер. Т.е. ядра выходят неполноценные. По сути это улучшенный аналог Hyper Threading (рассматривался в этой статье). Только в процессорах Intel в каждом ядре по одному блоку целочисленных вычислений и с плавающей точкой. В Bulldozer 2 блока целочисленных вычислений и у каждого свой кэш L1. Поэтому, если Hyper Threading позволяет достичь 10-30% прироста, то в процессорах Bulldozer, по словам представителей AMD, можно рассчитывать на прирост около 80%.

С учетом выше сказанного логичнее каждый модуль считать ядром. Я понимаю, что 8 ядер – это круто и куча людей на этом словится, но производительностью это не подтверждено.

Ассоциативность кэша L1 осталась 2-way. Причем каждый блок ALU будет забивать по одной зоне ассоциативности и работа с вызовом инструкций будет простаивать, даже если это будет позволять объем.

Объем кэша данных L1 уменьшен до 16 Кб, что очень плохо, т.к. мы помним золотое правило:

Ничто не решает проблемы производительности кэша так хорошо, как увеличение его объема. И в разумных пределах увеличенный объем критически влиять на латентность не будет.

Кэш L3 остался все с той же ассоциативностью 16-way. Причем еще и медленный, т.к. работает на частоте 2-2.2 ГГц.

Скорость работы предекодера в 2 раза меньше таковой у прошлой архитектуры Intel Nehalem, а ведь это важнейший блок в процессоре. Как тут можно говорить о высоком IPC?

Обращаю внимание на параметры со словами Turbo Core в спецификации процессоров. Эта опция (аналог Turbo Boost в Intel) впервые появилась в процессорах семейства Phenom II X6 на ядре Thuban. Здесь ее работу несколько улучшили. Turbo Core – это технология, которая позволяет процессору повышать частоту на одном или нескольких ядрах в условиях интенсивной нагрузки при укладывании в TDP (тепловой пакет). Если есть запас по TDP, то все 8 ядер перейдут на частоту Turbo Core, указанную в таблице. Частоту Max Turbo Core можно получить только в том случае, если простаивают как минимум 4 ядра.

В Bulldozer появилась поддержка 32 линий PCI Express 2.0, что позволяет организовать Crossfire или Quad Crossfire, где 2 или 4 видеокарты соответственно работают вместе. Здесь речь идет о топовом чипсете AMD 990FX. Для Crossfire конфигурация будет х16+х16, для Quad Crossfire — х8+х8+х8+х8. Цифры – это количество линий, выделяемых на одну видеокарту. Поэтому в режиме Crossfire пропускная способность будет в 2 раза выше. Но в реальности при подключении видеокарты на х8 порт падения в производительности не будут превышать 5%, если они вообще будут. Пока нет таких видеокарт, которым не хватало бы пропускной способности х8. С выходом PCI Express 3.0 проблема исчезнет вообще, т.к. в каждом новом поколении PCI Express пропускная способность каждого соединения удваивается. На данный момент единственные видеокарты, поддерживающие PCI Express 3.0 – AMD 79xx серия. Также потребуется процессор серии Intel Sandy Bridge-E. Они единственные, поддерживающие эту технологию. Повторюсь – на практике это не имеет особого значения.

Еще одна особенность процессоров Bulldozer – нативная поддержка оперативной памяти DDR3-1866. На практике более высокочастотные модули зачастую будут работать корректно. Да и память с частотой выше 1600 МГц обычно выбирают оверклокеры, чтобы не упираться в нее при разгоне. В Intel Sandy Bridge — DDR3-1333, Intel Sandy Bridge-E – DDR3-1600. Особой роли это также не играет, т.к. процессор использует ОП только 1% времени.

Пока что разблокировки ядер в младших моделях Bulldozer нет и думаю, вряд ли появится. Хотя физически четырехъядерная модель (состоящая из 2-х модулей) представляет собой 4-х модульный кристалл с отключенными двумя модулями. У FX-6100 отключен один модуль по аналогии. AMD заявляет, что залатывает всеми силами способы, которые позволяют разблокировать ядра. Естественно, эти способы программные, поэтому, будет лотерея или нет, зависит от производителей материнских плат.

После выката новой микроархитектуры AMD поняла, что того, что хотелось, не вышло. И в итоге начала пропагандировать идею того, что не все ресурсы принципиально новой микроархитектуры корректно используются современными ОС. Через некоторое время вышли заплатки (патчи) для Windows 7. Их смысл заключается в следующем: при нагрузке на 4 ядра могут быть активны 2 модуля в восьмиядерном процессоре, а 2 других простаивать. Учитывая, что ядра в процессоре не совсем полноценные, эффективнее загрузить 4 ядра в разных модулях (во всех четырех), что и делает данный патч. 2-х, 3-х, 4-х ядерная нагрузка у обычных пользователей более всего характерна для игр. В итоге игры больше всего и выиграли от патча. Но всего лишь   на 0,1-3%. Так что AMD’шная информация о появлении более оптимизированного софта не более чем сказки (сейчас AMD расхваливает свои процессоры в свете Windows 8). Но что из этого получится, мы знаем и так, а процессоры нам нужны здесь и сейчас.

Итак, давайте выделим основных конкурентов и посмотрим, на что способен новоиспеченный экскаватор в реальных приложениях. Конкурентов будем отбирать по цене, т.к. выбор процессора начинается с проверки толщины кошелька. Цена будет браться усредненная по Украине за февраль 2012 года.

Процессор Цена, грн
Intel Core i7-3930K 5000
Intel Core i7-2600K 2700
Intel Core i7-950 2200
AMD FX-8150 2100
Intel Core i5-2500K 1900
AMD Phenom II X6 1100T BE 1700
AMD Phenom II x4 980 BE 1400

Как вы видите, основные конкуренты отсортированы в порядке убывания цены. Intel Core i7-3930K здесь указан как ориентир – последняя модель, которую можно брать по соотношению цена/производительность. Точнее, если денег навалом и софт хорошо распараллелен, а так – 2500-3000 грн – предел. При дальнейшем повышении цены производительность будет увеличиваться незначительно. В соответствии с этим определением Intel Core i7-2600K – верхушка того, что можно рекомендовать. Core i7-950 приведен для сравнения производительности со старой архитектурой Intel. AMD FX-8150 собственно наш объект исследований. Intel Core i5-2500K, по моему мнению, самая оптимальная модель по соотношению цена/производительность. Модели i5-2500 и i7-2600 (без К) рассматривать не будем, потому что разница в цене между их старшими собратьями незначительна, а возможность такого простого разгона, да еще и гарантированного производителем, дает прибавку в производительности очень даже заметную. AMD Phenom II X6 1100T BE – шестиядерная топовая модель AMD предыдущего поколения. AMD Phenom II x4 980 BE – четырехъядерная топовая модель AMD предыдущего поколения. Последние две модели хоть и не попадают в наш ценовой диапазон, но указаны для сравнения того, насколько прогрессирует AMD – все топовые модели и все находятся в продаже.

В реальности конкуренты AMD FX-8150: Intel Core i7-2600K, Intel Core i5-2500K, AMD Phenom II X6 1100T BE.

Результаты представим в относительных единицах, где за 1 возьмем производительность AMD FX-8150 (Bulldozer). Все, что больше 1, то производительнее и наоборот.

Тесты процессоров Bulldozer

Photoshop использует многопоточные фильтры и сама программа распараллелена неплохо, поэтому здесь FX-8150 вне конкуренции, не считая, конечно, процессор, который в 2.5 раза дороже.

Тесты процессоров Bulldozer

Кодирование – великолепно распараллеливаемая задача. Как результат – Bulldozer на высоте и здесь.

Тесты процессоров Bulldozer

Здесь почему-то Phenom II X6 1100T BE обогнал исследуемую модель. Скорее всего, данная программа интенсивно использует блоки вычислений с плавающей точкой, а также кэш. Все-таки у модели на базе ядра Thuban 6 полноценных ядер. Модель Intel предыдущего поколения на одном уровне с Bulldozer, хотя у нее всего 4 ядра. 3DS Max, наверное, одно из немногих приложений, где по-настоящему раскрывается потенциал 6-ядерного интеловского гиганта. Если вы активно работаете с 3D Max, то данный процессор можно рекомендовать.

Тесты процессоров Bulldozer

Еще одно отлично масштабирующееся приложение.

Тесты процессоров Bulldozer

iTunes – приложение однопоточное, а однопоточные приложения – это гибель для процессоров на новой микроархитектуре AMD. Core i7-950, несмотря на меньшую тактовую частоту, без проблем обходит Bulldozer, не говоря уже о моделях Intel на Sandy Bridge. Кстати, здесь отлично видно, что Sandy Bridge-E не имеют каких-либо особых преимуществ по IPC в сравнении в Sandy Bridge. У старых флагманов AMD IPC также выше на 15-20%.

Тесты процессоров Bulldozer

WinZip также однопоточный. Поэтому картина аналогична.

Тесты процессоров Bulldozer

WinRar многопоточный и здесь наш испытуемый неплохо себя проявляет. Даже отрыв Core i7-3930K не критичен.

Вывод прост: в хорошо распараллеленных задачах Bulldozer чувствует себя достаточно уверенно для своей цены. Находится в диапазоне между Intel Core i7-2600K и Core i5-2500K, ближе ко второму как по цене, так и по производительности. Но в однопоточном окружении архитектура Intel проявляет себя во всей красе благодаря высокому IPC и отлично организованному кэшу и у Bulldozer не остается шансов.

AMD ставила целью сохранить IPC процессоров на ядре К10 (предыдущая микроархитектура) и оптимизировать производительность в многопоточном окружении. Со второй целью компания справилась неплохо, а первой не достигла. Более того, усугубила и без того плачевное состояние Phenom, понизив IPC. Все-таки в потребительском сегменте плохо распараллеливаемых задач больше. В серверном сегменте проведенные оптимизации может быть и сыграют значительную роль.

Негативные эмоции в свой адрес AMD вызвала не тем, что выпустила процессоры с неоптимальной производительностью, а тем, что обещала золотые горы под девизом: «Bulldozer – все, Core i7 — ничто». Даже процессоры назвали серией FX, как в далеком 2003 году Athlon FX, побывавший самым быстрым десктопным процессором на планете. И где это сейчас? Где процессоры для энтузиастов уровня 3930К? Потому Bulldozer и стал нишевым продуктом, а Core i5-2500K остался оптимальным за свою цену, обеспечивая отличный IPC и не пасуя перед многопоточностью.

Ах, да. Забыл добавить, что в одном из самых популярных сценариев использования домашнего компьютера – играх Bulldozer также выглядит очень тускло. В среднем на 20-40% медленнее конкурентов. Так что это точно не вариант для игрового ПК. Еще один жирный минус в копилку процессоров Bulldozer.

Революции не произошло. Данный продукт можно посоветовать разве что видеоредакторам, активным пользователям Photoshop, а также фанатам AMD, которые не играют в игры. С другой стороны более дешевый 2500К почти такой же в вышеназванных областях, но и хорош в остальных приложениях, т.е. универсален.

Комментарии. Добро пожаловать в обсуждение!

  1. Продажная статья, ни один intel не сравнится с amd за туже сумму.

Добавить комментарий для jl alice Отменить ответ

Ваш e-mail не будет опубликован.

*


*


Твитнуть