В ноябре 2008 года на рынке появились процессоры нового поколения архитектуры Core - процессоры с маркетинговым наименованием Intel Core i7.
Последний раз микроархитектура процессоров Intel менялась 2 года назад в соответствии с концепцией компании Intel: появление новой архитектуры один раз в два года. Так, эра Intel Core 2 началась в июле 2006-го с выпуском процессоров Conroe. Далее последовал переход на 45-нм технологическую норму (семейство Penryn) - смена техпроцесса также происходит раз в 2 года.
За прошедшие 2 года архитектура Core второго поколения практически уперлась в свой технологический предел, тем не менее она смогла "утереть нос" AMD Barcelona, который вышел с опазданием и большим тепловыделением.
Представленная новая архитектура носит название Nehalem, в рамках нее будет выпущено несколько кристаллов и как минимум 2 семейства процессоров - на 45 и 32-нм техпроцессе. В течение последующих 2-2,5 лет Intel примет на вооружение 32-нанометровый техпроцесс, связанный с приходом Westmere и Sandy Bridge.
Сегодняшние процессоры Core i7 – представителями архитектуры Nehalem на ядре Bloomfield.
Новая архитектура - новое тепловыделение
Архитектура "нахальных" была принципиально переработана - структура их предшественников – Core 2 Quad – представляла собой объединение пары кристаллов Core 2 Duo. Процессоры Bloomfield изначально проектировались с четырехядерным дизайном, что не могло не сказаться положительно на оптимизации архитектуры в целом и размерах кристалла в частности.
Первые процессоры Nehalem обладают 731 млн. транзисторов, что на 10,7% меньше, чем у Core 2 Quad Penryn Yorkfield. В то же время, площадь кристалла Core i7 увеличена с 214 до 263 мм2.
К числу основных особенностей кристалла Core i7 относится четыре физических ядра, разделяемый кэш третьего уровня, встроенный контроллер памяти DDR3 и шина QuickPath Interconnect (QPI).
Кэши L1 и L2 выделены индивидуально для каждого ядра, а вот кэш третьего уровня является общим для всех ядер. Впервые подобная концепция была применена в процессорах AMD Phenom X4 Agena.
Кэш первого уровня, как и у Penryn, составляет 64 КБ: по 32 килобайта для инструкций и данных. Уровнем выше размещено небольшое (256 КБ) количество унифицированного L2 кэша (на каждое ядро по 256 К), суммарный объем которого в 12 раз меньше, чем у топовых представителей Core 2 Extreme. Это позволило разработчикам уменьшить время выполнения одной операции с 15 до 11 тактов и обеспечить должную масштабируемость вычислений.
Основная ставка в Core i7 сделана на общую кэш-память третьего уровня объемом 8 МБ, которая является инклюзивной: он содержит все записи из L1 и L2, таким образом, снижая трафик запросов.
Что касается оптимизации самих ядер, то каждое ядро работает по принципу Simultaneous Multithreading (SMT, технология «одновременной мультипоточности»). Принцип ее работы заключается в распределении операций с данными между двумя виртуальными потоками одного физического ядра. В частности, четырехядерные модели Core i7 будут функционировать в 8 потоков. Можно сказать, это реинкарнация Intel Hyper-Threading (HT), забытой в Core 2.
Появление шины QPI обусловлено недостаточной пропускной способностью прежнего «мостика» между процессором и чипсетом – Front Side Bus (FSB). QPI действует в двунаправленном режиме, позволяя более гибко распределять системные ресурсы. Похожий по назначению интерфейс HyperTransport уже на протяжении нескольких лет используется в платформах AMD.
К тому же, QPI теперь разгружен от общения с оперативной памятью - контроллер памяти теперь находится не в материнской плате, а в кристалле процессора!
Связь процессора и чипсета организована очень интересно: 20 линий данных в одну сторону и 20 линий данных - в другую. Каждая линия представляет собой дифференциальную пару проводников (lane), аналогичную используемым в PCI Express и SATA. Используется 2 тактовых генератора: один синхронизирует передачу данных в одну сторону - другой - в обратную. Частота синхронизации в 2 раза ниже частоты передачи данных. В сумме получается 84 сигнала, которые и образуют связь (link). Так реализован дуплексный синхронный обмен.
Один блок QPI поддерживает 20 линий передачи данных в обоих направлениях со скоростью 6,4 ГТ/с. Суммарная пропускная способность шины – 25,6 гигабайт информации в секунду. В серверных процессорах используется несколько блоков QPI, что возможно позже будет реализовано и в настольных процессорах.
Последний важный элемент процессорного кристалла Bloomfield – Integrated Memory Controller (IMC). Напомним, что это первый опыт Intel в переносе управляющих структур памяти из северного моста в кристалл CPU, по аналогии с AMD.
IMC предлагает трехканальный (192-битный) режим работы оперативной памяти. Поэтому считается, что лучшими наборами модулей RAM для платформы Nehalem LGA1366 станут комплекты DDR3, состоящие из трех планок. Впрочем, предварительные тесты показывают лишь небольшой, 1-5-процентный, прирост производительности при переходе с двух- на трехканальную организацию подсистемы памяти.
Главные же прирост производительности дает перенос контроллера в кристалл за счет снижения латентности доступа к памяти. Однако, частоты 1600 МГц для памяти пока что не являются необходимыми - в большинстве приложений DDR3-1066 CL7 ничуть не уступает DDR3-1600 CL8, следовательно, потребность мощных систем в высокочастотных модулях памяти отходит на второй план.
К чему мы все это рассказывали?
Да все просто: в связи с полным редизайном чипов и архитектуры, сильно изменили подход к проектированию материнских плат.
В частности, с материнской платы ушел контроллер памяти и исчезла шина памяти и изменились требованию по проектированию VRM - модуля преобразования напряжения.
VRM обеспечивает стабильность питания процессоров.
Все новые процессоры имеют напряжение питания ядра - 1,18-1,20 В и мощность тепловыделения (TDP) аж 130 Вт!!!
Ну и изменилась архитектура шина и связь ядер между собой, а как следствие и Socket - теперь используется разъем LGA1366.
Socket 1366
В кристалле CPU размещен специальный микроконтроллер Power Control Unit (PCU). В функциональные обязанности последнего входит мониторинг и регуляция показателей напряжения, силы тока и температуры ядер. Среди прочего, PCU способен полностью отключать одно или несколько ядер от энергоснабжения. Соответственно, такая поддержка должна быть со стороны BIOS.
X58 - Чипсет для "Нахальных"
Жизнеспособность процессоров линейки Core i7 обеспечивают соответствующие материнские платы на базе чипсета Intel X58 Express (Tylersburg). Упомянутый набор логики, в свою очередь, состоит из северного моста X58 IOH и южного моста ICH10(R), знакомого по актуальным предложениям на 775-м сокете.
Структурная схема чипсета Intel X58
Официально Core i7 рекомендуется использовать с планками DDR3-1066 (8,5 Гбит/с), однако существуют достоверные сведения об успешной работе на платах Intel X58 модулей памяти номиналом 1600 МГц и выше. В расчете на трехканальные комплекты оперативной памяти предусматривается, как правило, 3 или 6 слотов RAM; максимальный объем устанавливаемой DDR3 – 4 ГБ на один слот. На всякий случай отметим, что материнские платы LGA1366 под DDR2 выпускаться не будут, т.к. поддержка второго поколения DDR не реализована на уровне контроллера.
Графическая подсистема включает в себя от 2 до 4 слотов PCI-Express 2.0 (всего 36 линий, с возможностью расширения), совместимых с конфигурацией ATI CrossFireX и опционально с NVIDIA SLI. Производители материнских плат могут выбирать между программным и аппаратным способом реализации SLI. Впрочем, оба пути сопряжены с существенными материальными затратами, поэтому тандем видеокарт GeForce мы, скорее всего, увидим только на флагманских изделиях.
Материнские платы в продаже
В декабре материнских плат под Socket 1366 почти не было, так что смысла делать обзор также не было.
Сейчас же на рынке Санкт-Петербурга имеется не менее 15 плат под Core i7.
Их цены варьируются от 8700 до 16500 руб.
Расположим их в порядке возрастания цен с их кратким описанием:
- Intel DX58SO Socket 1366, X58, DDR3-1333, PCI-E, LAN1000, ATX
- Gigabyte GA-EX58-UD4 Socket 1366, X58, DDR3-2100+, PCI-E, LAN1000, ATX
- Gigabyte GA-EX58-DS4 Socket 1366, X58, DDR3-2100+, PCI-E, LAN1000, ATX
- MSI X58 Platinum Socket 1366, X58, DDR3-1333, PCI-E, LAN1000, ATX
- Biostar TPower X58 Socket 1366, X58, DDR3-1600*, PCI-E, LAN1000, ATX
- ECS X58B-A Socket 1366, X58, DDR3-1333, PCI-E, IEEE1394, LAN1000, ATX
- Gigabyte GA-EX58-UD5 Socket 1366, X58, DDR3-2100+, PCI-E, LAN1000, ATX
- ASRock X58 SUPERCOMPUTER Socket 1366, X58, DDR3-2000*, PCI-E, LAN1000, ATX
- ASUS P6T DELUXE V2 Socket 1366, X58, DDR3-2000*, PCI-E, LAN1000, ATX
- Gigabyte GA-EX58-EXTREME Socket 1366, X58, DDR3-2100+, PCI-E, LAN1000, ATX
- ASUS P6T WS PRO Socket 1366, X58, DDR3-1600+, PCI-E, LAN1000, ATX
- ASUS P6T Deluxe/ OC PALM Socket 1366, X58, DDR3-2000*, PCI-E, LAN1000, ATX
- MSI Eclipse SLI Socket 1366, X58, DDR3-1333, PCI-E, LAN1000, ATX
- ASUS RAMPAGE II EXTREME Socket 1366, X58, DDR3-2000*, PCI-E, LAN1000, ATX
- ASUS P6T6 WS REVOLUTION Socket 1366, X58, DDR3-1600+, PCI-E, LAN1000, ATX
Intel DX58SO - самая простая по конфигурации, в BIOS отсутствуют практически все опции разгона.
ASRock X58 SUPERCOMPUTER - типичное решение среднего уровня сомнительного качества сборки.
Рекомендуем Gigabyte GA-EX58-UD4 как дешёвое решение и Gigabyte GA-EX58-EXTREME как топовое.
Подробный обзор этих МП будет в следующих статьях.
Александр Дудкин, сервис-инженер
Читать все статьи...