Современные процессоры AMD и Intel хоть и обеспечивают превосходное быстродействие, а также поддерживают огромное число современных технологий, все еще остаются сильно измененными разработками 10-летней давности. Но обе компании уже объявили о своих намерениях представить ЦП на основе принципиально новых архитектур. У AMD это Bulldozer, у Intel – Nehalem. В этом материале рассматриваются их основные возможности и нововведения, а также дальнейшие перспективы развития рынка микропроцессоров.
Хорошо было 10 лет назад. Компания Intel выпустила процессор Pentium II, в основе которого лежали все идеи, реализованные в Pentium и Pentium Pro, и это было единственное решение для компьютеров из middle-end и high-end сегментов. Для бюджетного сектора предназначались уже морально устаревшие Pentium, а также решения от других компаний, в частности от AMD. Вопроса "Что выбрать: Intel или AMD?" тогда не было. Все знали, что процессоры Intel лучшие и все их рекомендовали к приобретению.
Теперь вопрос выбора стоит немного более остро, хотя число производителей ЦП несколько поубавилось. С одной стороны Intel предлагает более скоростные чипы Core 2 Duo, а с другой каждое их обновление требует смены системной платы, да и их стоимость относительно решений AMD у них повыше. Последние, к слову, обещают быть совместимыми с Socket AM2 платами чуть ли не до 2009 года. Да и на следующей неделе будет представлена обновленная архитектура K8, в народе известная как K10 или K8L.
Тем не менее, все самые современные процессоры AMD и Intel имеют в своей основе наработки 8-10-летней давности. Чипы Core выросли из Pentium M, которые в свою очередь базируются на архитектуре P6, легшей в основу Pentium Pro и последующих разработок. AMD очень преуспела выпустив процессор Athlon, основанный на архитектуре K7. K8 хоть и имеет сильные отличия, однако это всего лишь сильно переработанный K7. Ну а K10 - это эволюционное развитие K8.
Однако и Intel и AMD обещают в ближайшие полтора-два года представить принципиально новые процессорные архитектуры. Междоусобная конкуренция заставила пойти обоих производителей ЦП на этот весьма дорогостоящий шаг. Intel стала говорить об этом еще два года назад, а AMD в этом году объявила о намерении представить новый процессор с высокой интеграцией компонентов. В этой статье мы собрали всю имеющуюся информацию о планах этих компаний касательно готовящегося обновления архитектур. Сведений пока мало, но из них уже можно делать кое-какие выводы.
Что есть сейчас
Прежде чем перейти к новому поколению процессоров Intel и AMD вкратце остановимся на том, что есть на рынке сейчас и что будет в ближайшее время. Начнем с AMD. Как было отмечено выше, этот производитель готовит к выходу условно называемую архитектуру K10. Первые чипы, в основу которых она ляжет, станут серверные Opteron на ядре Barcelona. Их анонс назначен на 10 сентября этого года, хотя изначально компания планировала это событие шестью месяцами ранее.
Вполне возможно, что главной причиной задержки стал неотработанный 65 нм техпроцесс производства. До сих пор на эти нормы переведены только процессоры на ядре Brisbane, и их частота не превышает 2.7 ГГц. А вот старшие модели на 90 нм ядре Windsor работают на частотах до 3.2 ГГц. Главной "фишкой" Barcelona должен стать специально разработанный четырехъядерный дизайн. А четыре ядра на одном кристалле будут весьма ощутимо греться. Не удивительно, что частота первых моделей не превысит 2.0 ГГц.
В ноябре появится 2.2 ГГц версия, однако это далеко до 2.9 ГГц, о которых ходили слухи еще год назад. В следующем году K10 пойдет в массы. AMD представит новые процессоры для настольных компьютеров. О мобильных модификациях пока ничего неизвестно. Пока ожидается пять различных семейств на основе K10:
- Phenom FX (ядро Agena FX);
- Phenom X4 (ядро Agena);
- Phenom X2 (ядро Kuma);
- Athlon X2 (ядро Rana);
- Sempron (ядро Spica).
Первые три будут оснащены общим кэшем третьего уровня объемом 2 Мбайта. Это одно из главных нововведений, что позволит повысить скорость обмена данными между ядрами. Остальные процессоры предназначаются для бюджетного сегмента и L3-кэшем похвастать не смогут. Тем не менее, остальные нововведения K10 им будут не чужды.
Мы не будем подробно расписывать изменения, внесенные в новую архитектуру AMD, поскольку цель этой статьи несколько иная. Поэтому только приведем их краткий список.
- Выборка инструкций. Процессоры K10 будут производить выборку инструкций из кэша первого уровня по 32 байта, а не 16 как это делают все K8 и Core2.
- Предсказание переходов. В K10 будет улучшен блок предсказаний переходов. Он используется для содержания исполнительного конвейера постоянном загруженным. Теперь конвейер будет простаивать меньше благодаря лучшей приспособленности процессора к угадыванию правильных переходов.
- Декодирование. Будет значительно улучшен блок отвечающий за декодирование команд. К схемам декодера даже добавлен специальный блок Sidebank Stack Optimizer, назначение которого повысить эффективность декодирования.
- ALU. Произойдет оптимизация блока целочисленных вычислений. В нем закроют наиболее слабые места процессоров K8.
- FPU. Блок FPU, отвечающий за операции с плавающей точкой, всегда был сильной стороной процессоров AMD (начиная с K7). В K10 он будет модернизирован и улучшен. В частности повысится скорость работы с SSE-инструкциями. Кроме того по ряду параметров он превзойдет FPU чипов Core 2.
- Кэш. Одним из главных недостатков кэша процессоров Athlon была и есть узкая шина обмена данными между L1 и L2 кэшами. В K10 ожидается ее двухкратное расширение, хотя эти данные не подтверждены. Если это случится, то возрастет как скорость работы кэша, так и снизятся его задержки. Помимо этого у старших семейств появится кэш третьего уровня. Он будет общим для всех ядер (двух или четырех в зависимости от модели чипа). Это позволит значительно повысить скорость обмена данными между ними.
- TLB. Будут увеличены буферы кэша TLB (translation-lookaside buffer). Этот кэш используется для хранения соответствия между виртуальными и физическими страницами. В новых процессорах преобразования адресов будут происходить быстрее.
- Предвыборка данных. Предвыборка данных впервые была реализована в процессорах Pentium 4, после чего перекочевала в Athlon XP и во все их последователи. Специальный блок отслеживает за обработкой данных процессором и пытается рассчитать, которые могут пригодиться в ближайшее время, после чего подгружает их в кэш-память из ОЗУ. В K8 данный блок был скорее для галочки. AMD не уделила его реализации должного внимания, положившись на низколатентный контроллер памяти. Но данное упущение будет исправлено с выходом Barcelona - блок предвыборки в нем значительно усовершенствован.
- Контроллер памяти. Интегрированный на кристалл контроллер памяти уже четыре года остается одной из сильнейших сторон архитектуры K8. В K10 данный компонент будет усовершенствован. Теперь получение данных может происходить по двум независимым каналам по 64 бита каждый, тогда как до этого был один общий канал на 128 бит, что не очень хорошо подходит для многоядерных решений.
- Виртуализация. Будет расширена поддержка технологии виртуализации. Местами ожидается значительный прирост производительности при запуске нескольких операционных систем.
- Управление питанием. Новые процессоры смогут регулировать частоту работы каждого из ядер в зависимости от текущей нагрузки. При этом рабочее напряжение будет оставаться у всех одинаковым. Его значение будет соответствовать максимальному из четырех ядер.
- HyperTransport 3.0. В качестве средства связи процессора и северного моста (а также процессоров в многопроцессорных конфигурациях на Opteron) будет использоваться новая шина HyperTransport 3.0 вместо текущей HT 1.1. Нововведение обещает повысить скорость работы в несколько раз, при этом сохранив совместимость со старой версией.
Ожидается, что в следующем году абсолютно все процессоры AMD будут построены на обновленной архитектуре. В мобильном секторе на смену текущим Turion 64 X2 придут чипы на ядре Griffin, обещающие повышение производительности и снижение энергопотребления. Но все это промежуточное решение на пути к принципиально новой архитектуре, о которой мы расскажем позже. Пока несколько слов о новых ЦП Intel на ядре Penryn.
Процессоры Penryn должны будут появиться на несколько месяцев позже Barcelona. Они не предложат столь значительные усовершенствования, как K10 по отношению к K8, однако чипы Core 2 Duo и так достаточно хороши, чтобы их сильно модифицировать. А Penryn как раз придет на смену последним. Ожидается, что новые ЦП смогут поднять планку производительности на новый уровень. Посмотрим, благодаря чему это должно случиться.
- 45 нм техпроцесс. Penryn станет первым процессором, выполненным по 45 нм техпроцессу производства. Это позволит поднять тактовые частоты выше теперешних 3.0 ГГц, что не может не радовать. При этом понизится энергопотребление и нагрев.
- L2-кэш. Размер кэша второго уровня возрастет с 4 до 6 Мбайт, таким образом доведя число транзисторов в четырехъядерном процессоре до 820 млн.
- Частота и FSB. Изначально частоты первых Penryn составят не более 3.3 ГГц, хотя ходят слухи, что они возрастут до 3.6 ГГц. Вырастит и системная шина. Сейчас она составляет 1067 или 1333 МГц. У некоторых новых чипов она будет работать на частоте 1600 МГц.
- Энергосбережение. Будет добавлен новый режим энергосбережения, условно называемый Deeper Power Down Technology. Процессор будет способен уходить "в сон" еще глубже, таким образом экономя больше энергии. Это особенно актуально в ноутбуках.
- Остальное. Помимо вышеперечисленного будет модернизирована технология виртуализации, а также в Penryn добавят несколько новых команд и сделают незначительные улучшения в архитектуре. Но последнее не более чем доведение уже отработанных механизмов до совершенства.
Интересно будет понаблюдать, кто опять окажется на коне. С одной стороны AMD приложила все усилия, чтобы вывести быстродействие своего нового чипа на новый уровень. Однако Intel не дремлет, и обновленная архитектура Core станет еще более быстрой. Поэтому как бы не получилась ситуация, что K10 на короткое время вырвет первенство у Core 2 Duo, а потом опять его потеряет, хоть и разница в быстродействии будет не такой значительной.
Однако это все баталии совсем близкого будущего. Самое интересное ждет нас впереди. Как уже было сказано выше, в 2009 году обе компании представят принципиально новые процессорные архитектуры, к которым мы и переходим.
Bulldozer и Bobcat: тяжеловес и легкоатлет от AMD
В 2009 году компания AMD собирается представить два принципиально новых процессорных ядра: Bulldozer и Bobcat.
Bulldozer позиционируется на место современных мобильных, настольных и серверных процессоров. На основе этого ядра будут представлены чипы с тепловыделением от 10 до 100 Вт. Babcat в свою очередь предназначен для энергоэффективных устройств, вроде субноутбуков, а также встраиваемых систем, плееров и т.д. TDP этих чипов будет варьироваться в пределах от 1 до 10 Вт. Остановимся подробнее на ядре Bulldozer.
В числе нововведений ЦП на основе следующей архитектуры AMD ожидаются следующие:
- до 16 процессорных ядер;
- более длинный конвейер, в сравнении с K8/K10, что позволит поднять тактовые частоты;
- новые дополнительные инструкции, направленные на оптимизацию работы с мультимедиа-контентом;
- поддержка шины HyperTransport 3 (до четырех линков на процессор);
- поддержка памяти DDR3 и технологии G3MX;
- поддержка интерфейса PCI Express 2.0.
Как можно заметить, в будущем нас ожидает развитие идеи многоядерных процессоров. Если сегодня двухъядерные модели уже почти заняли все сегменты рынка, а четырехъядерные неуклонно приближаются к mainstream-сегменту, то через два года мы можем увидеть восьми- и шестнадцатиядерные процессоры. При этом у процессоров Bulldozer будет увеличено число стадий исполнительного конвейера. У теперешних K8/K10 их 12, у Core 2 Duo - 14, а у Pentium 4 было 31. Наверняка многие помнят особенности последних - высокая частота и малая эффективность. Будем надеяться, что AMD в этом вопросе поведет себя разумно и конвейер будет разбит не на столь значительное число стадий.
Поддержка шины HyperTransport 3.0 появится уже в чипах Barcelona, поэтому для Bulldozer она уже будет не в новинку. Но число линков (через них осуществляется обмен данными с чипсетом и другими процессорами) в серверных ЦП будет равно четырем, тогда как сейчас используется только три линка.
Пока неизвестно, будут ли процессоры K10 поддерживать память DDR3 или нет, но ясно то, что такая совместимость появится в Bulldozer. При этом ожидается, что с DD2 новые чипы работать не смогут. Все это означает смену процессорного разъема, несовместимого с Socket AM2 и Socket AM2 . И виной тому не только обновленный контроллер памяти, но и множество нововведений в архитектуре.
Вместе с тем ожидается внедрение технологии G3MX (G3 Memory Extender). Прежде чем объяснить что это такое сделаем небольшой экскурс в историю. Несколько лет назад на рынке появился новый тип памяти FB-DIMM, главное назначение которого - значительно увеличить максимальный объем ОЗУ на одном компьютере. Intel быстро взяла на себя инициативу, и представила чипсеты с поддержкой FB-DIMM. Сегодня вся серверная платформа Intel работает только с этими модулями. Даже в Apple Mac Pro стоят планки FB-DIMM вместо стандартных DDR2.
Но полностью буферизированная (Fully-Buffered Dual In-line Memory Module - FB-DIMM) память при своих достоинствах имеет ряд недостатков. Среди них высокая стоимость конечных модулей, большая латентность и большой нагрев. В процессоры AMD, чьей сильной стороной являются малые задержки при работе с памятью, такая поддержка не была добавлена. И, судя по всему, не будет.
Технология G3MX призвана дать достойный ответ FB-DIMM. Принцип работы последней заключается в размещении на модулях памяти специального буфера, что и позволяет значительно увеличивать максимальный объем. И это же источник всех недостатков. При использовании G3MX такой буфер и специальный чип, контролирующий поток данных, будет расположен прямо на системной плате. Таким образом решается проблема большого нагрева, а также высокой стоимости планок памяти - можно будет использовать самую обычную небуферизированную DDR3.
Одним из главных вопросов касательно процессоров Bulldozer, является вопрос об их производительности. Ведь мало оснастить ЦП сотней новых блоков и функций - важно чтобы при этом он обеспечивал высокое быстродействие. По неподтвержденным данным, Bulldozer будет быстрее современных чипов. Так решения для настольного и мобильного сегментов будут иметь на 30% лучшее соотношение производительность/ватт, чем у Barcelona. В серверном секторе превосходство над Barcelona составит 50-100%. Что ж, будем надеяться, что всем будет именно так.
На основе архитектуры Bulldozer также будет представлено отдельное семейство процессоров, известное под кодовым именем Falcon. При этом в его состав войдет чип Fusion, информация о котором циркулирует в Сети уже около года.
Fusion - это решение высокой интеграции, на одном кристалле которого разместятся несколько процессорных ядер Bulldozer, графический процессор (с поддержкой UVD - Unified Video Decoder), общая для CPU и GPU кэш-память, а также контроллер шины PCI Express 2.0.
Пока неизвестно, что именно за графическое ядро будет интегрировано на кристалл, однако в числе его возможностей значатся поддержка API DirectX 9/10, второе поколение технологии UVD, а также возможность вывода информации на порты DVI, HDMI и DisplayPort.
Полагаем, что компания AMD не сможет интегрировать высокопроизводительный GPU вместе с процессорными ядрами, в противном случае она просто не справятся с отводом тепла.
Процессоры Fusion будут позиционироваться на рынок мобильных компьютеров. В настольном сегменте они также "засветятся", однако это будут mainstream и low-end решения. Для достижения максимальной производительности придется покупать процессор и видеокарту по отдельности.
И несколько слов о Bobcat. Процессоры на этом ядре будут довольно сильно урезанными версиями Bulldozer. С одной стороны это снизит производительность, а с другой позволит значительно уменьшить энергопотребление. Ожидается, что они найдут свое место в сегменте смартфонов, карманных компьютеров, UMPC, телевизорах, ТВ-приставках и так далее. Теперь посмотрим, чем на все это "безобразие" ответит Intel.
Nehalem: реинкарнация нерожденных процессоров Intel
У Intel архитектура следующего поколения называется Nehalem. Однако если обратиться к архивным документам, то можно обнаружить, что процессор с таким кодовым именем был запланирован еще в 2000 году. Но по планам того времени это должен был стать чип, в основу которого легла бы архитектура NetBurst, используемая в Pentium 4 и Pentium D.
Порядок выхода чипов был следующим:
Willamette -> Northwood -> Prescott -> Tejas -> Nehalem
Как известно, NetBurst остановила свое развитие на ядре Prescott. В 2004 году Intel официально заявила, что Tejas представлен не будет, а все силы компания бросает на разработку принципиально нового процессора, которым стал Core 2 Duo, представленный в 2006 году.
Покопавшись в архиве новостей за последние несколько лет мы обнаружили некоторые интересные сведения о первой версии Nehalem. В 2003 году предполагалось, что частота Prescott достигнет 5.2 ГГц (шина 800 МГц), хотя реально она не превысила 3.8 ГГц (4.0 ГГц версия планировалась, но была отменена). В конце 2004 года ожидался выход чипов на ядре Tejas. Выполненные по 90 нм техпроцессу его первые версии должны были работать на частотах до 5.6 ГГц, а системная шина составила бы 1066 МГц. Судя по слухам, Tejas смог бы "дорасти" до внушительных 9.2 ГГц (!). Nehalem в свою очередь стал бы очередным эволюционным витком NetBurst. Его начальная частота должна была составить 9.6 ГГц, а в 2005 году вроде как должен был появиться 10.2 ГГц (!) процессор. Системная шина при этом работала на 1200 МГц.
Что ж, внушает надо сказать. Из данных прогнозов сбылись предсказания только насчет системной шины: сегодня она составляет 1333 МГц, а в будущих Penryn поднимется до 1600 МГц. Да и Nehalem вновь всплыл в роадмэпе Intel. Вообще компания говорит о новой архитектуре еще с 2005 года, а во второй половине следующего она должна увидеть свет. Посмотрим, что предложат новые процессоры своим потенциальным потребителям.
Вот примерный список возможностей архитектуры Nehalem:
- переменное число ядер. У первых версий их число достигнет восьми;
- встроенный контроллер памяти;
- поддержка новой высокоскоростной шины CSI;
- встроенное графическое ядро (в специальных версиях);
- 45 нм техпроцесс производства;
- поддержка новых SIMD-инструкций;
- поддержка многоуровневой кэш-памяти.
При первом взгляде на данный список в голове мелькает мысль "где-то это мы уже видели". И действительно, второй и третий пункты уже реализованы в процессорах AMD, а первый и четвертый будут присутствовать в Bulldozer. Конечно, реализация компании Intel будет довольно сильно отличаться - общие только идеи.
Пока неизвестно, сколько ядер будет в Nehalem на пике развития этой архитектуры. Но точно известно (даже официально подтверждено), что вернется поддержка технологии логической многопроцессорности, ранее применявшейся в Pentium 4 и известной как HyperThreading.
О встроенном контроллере памяти известно очень мало. Мы только знаем, что он будет. Вероятно, будет поддерживаться память типа DDR3, а также FB-DIMM в серверном сегменте. Данных о канальности пока нет.
Информация о шине CSI ходит по Интернету уже несколько лет. По сути это альтернативная реализация HyperTransport. Последняя, к слову, присутствует на рынке уже более семи лет, хоть используется в процессорах AMD не более четырех. Теперь Intel решила реализовать идею последовательной шины, работающей по принципу точка-точка, и внедрить ее в свой процессор нового поколения. К сожалению, никаких данных о возможностях CSI пока нет.
Встроенное графическое ядро вероятнее всего будет присутствовать в мобильных версиях чипов Nehalem. При этом пока тоже не ясно, какой именно GPU будет взят за основу. По слухам Intel в последнее время стала вкладывать большие средства в разработку графических процессоров, поэтому не исключено, что новая встроенная графика будет обеспечивать весьма достойный уровень производительности.
Само собой Nehalem будут устанавливаться в новые процессорные разъемы и ни о какой обратной совместимости с современными Core 2 Duo и Pentium D речи не идет. По неофициальным данным для работы новых ЦП потребуется 1366-контактный разъем Socket B.
Как уже было сказано, первые версии Nehalem появятся в следующем году и будут изготовлены по 45 нм нормам техпроцесса. Они будут позиционироваться в серверный сегмент. Настольные и мобильные варианты выйдут в 2009 году. Тогда же начнется постепенный переход на 32 нм техпроцесс. Первым чипом на его основе станет Westmere - эволюционное развитие Nehalem. Чуть позже (предположительно в 2009-2010 годах) его сменят новые процессоры на архитектуре Gesher. О ней сейчас известно еще меньше, чем о Nehalem.
Но Nehalem и Gesher - это далеко не единственные разработки Intel. Эта компания имеет достаточно ресурсов, чтобы финансировать множество независимых друг от друга проектов. К примеру, многим известен чип Itanium, который так и не оправдал возложенных на него надежд. Еще одна перспективная разработка сейчас создается в рамках проекта Terascale. Это процессор, способный обеспечивать вычислительную мощность до 1 TFLOPS. Но это может статьи темой для одной из наших будущих статей.
Дорога в будущее
Компании AMD и Intel наконец-то решили отойти от своих ранних разработок, представив что-то принципиально новое. Конечно, множество из тех идей, что будут реализованы в Bulldozer и Nehalem были уже изложены ранее, но до реализации дело дошло только сейчас. Например, интегрировать графическое ядро на кристалл с процессором еще 7 лет назад собиралась Intel. Проект назывался Timna и позиционировался как решение для бюджетных компьютеров. Однако он был закрыт, а силы израильской команды, занимавшейся им, бросили на создание "настоящего" мобильного ЦП, коим стал Pentium M.
Все новое - это хорошо забытое старое. И это отчетливо видно по будущим процессорным архитектурам. Будем надеяться, что они не разочаруют нас, а конкуренция между Intel и AMD продолжится в том же духе. Ведь ее плоды - снижение цен - радует нас с вами каждый день.