Мур, Мур, Мур…
Может ли дальше работать любимое заклинание Интел?

на страницах сайта 

www.electrosad.ru

Наблюдая за развитием технологий при производстве процессоров, может сложиться впечатление, что "флагман индустрии" Intel, летит на полных парах впереди других, осваивая все более тонкие технологические процессы, получая при этом рекордные производительности. Где-то сзади плетутся неповоротливые AMD и IBM, "с трудом осваивающие" даже тех. процесс 65 нм. Где предел этой гонки?

 
 

Конечно, нельзя отрицать, что Intel осваивает новые технологии. Успешно решает многие из возникающих проблем, своевременно оповещает об своих успехах.  Рядом трудятся «незаметные» AMD и IBM, может даже показаться отстающие.

Но посмотрим на результаты:

  1. Pentium 4 так и не достиг тактовой частоты 4 ГГц, ни на техпроцессе 90нм, ни на 65 нм, нет пока анонсированных моделей с этой тактовой частотой и на 32 нм. По некоторым признакам, похоже, эта частота так и осталась заветной целью Intel.
  2. IBM провела испытания процессора Power 6, 4,7 ГГц (4 Мб L2, 32 Мб L3). Заявлен ряд чипов с частотой 3,5, 4,2 или 4,7 ГГц.
  3. Процессоры AMD с переменным успехом соперничают с процессорами Intel, в производительности. При этом они имеют тактовые частоты меньше процессоров Intel.

Сейчас можно говорить о разных путях, по которым идут эти компании.

Intel - делает ставку на освоение сверхтонких технологических процессов. И не считаясь с затратами штурмует заданные Муром высоты. Это понятно, в конечном итоге потребитель все оплатит. Куда они денутся без Intel.

AMD – отрабатывает тонкости технологии, работает над архитектурой процессоров. Это позволяет при меньших тактовых частотах, с переменным успехом, конкурировать на рынке и иметь от него свою долю.

IBM - продолжает работу над процессорами, успешно повышая тактовую частоту, выпустив Power6 4.7 ГГц с количеством транзисторов — более 790 млн.; площадью — 341 кв. мм.. Он даже изготовленный по 65 нм техпроцессу обогнала Intel по тактовой частоте почти на 1 ГГц и показывает высокую производительность.

Но, не смотря ни на что, никому не удается далеко оторваться от соперников.
 Прежде чем продолжить разговор хочу напомнить об одном опыте AMD в августе 2002 года.Это процессор AMD Thoroughbreg ревизии B. Тогда компания AMD ввела новое понятие - «электромагнитной интерференции на кристалле». Ее влияние, AMD, снимается введением дополнительного медного слоя и дополнительных фильтрующих конденсаторов на кристалле процессора Thoroughbreg ревизии B. (Это все отличия от Thoroughbreg ревизии А!) Это привело к увеличению фактической тактовой частоты ядра от 14,4% до 26%, при увеличении тепловыделения только на 7,9% и увеличении площади кристалла на 5% на процессорах Thoroughbreg +1700. А за счет увеличения физической тактовой частоты шины до 166 МГц, на более поздних моделях процессоров Athlon XP 2700+ и Athlon XP 2800+ реальная производительность возросла от 17,6% до 27,2%, при сохранении всех прочих характеристик и структуры процессора Thoroughbreg ревизии А.

При таких тактовых частотах создается ощущение, что интерференция и стоячие волны на кристалле нам не грозят. Но стоит почитать дальше и будет видно, не все так хорошо как кажется.

Что нужно для электромагнитной интерференции на кристалле процессора?

(Нас не интересует интерференция в пространстве за пределами кристалла, которая существует во внешних шинах уже на частотах выше 0,3 ГГц.)

Для существования интерференции (хотя бы одного максимума) на кристалле между двумя источниками E1 и E2, расположенными в максимально удаленных точках необходимо, чтобы расстояние между ними было кратно длине волны источников, но не меньше (1-2)λ.

 

Рисунок 1. Кристалл Thoroughbreg ревизии B.

 

При площади кристалла порядка 120 мм2 наибольшее расстояние на кристалле около 15 мм. Для существования интерференции в открытом пространстве при расстоянии порядка 10 мм необходима частота более 30ГГц. Для среды, где диэлектрик SiO2 (изолятор в структуре процессора), она больше 10 ГГц. Частота может быть еще меньше на новых диэлектриках с высокой диэлектрической проницаемости.

При меньших расстояниях эти частоты соответственно выше.

Здесь следует уточнить, что интерференция возникает не на тактовой частоте процессора, а на гармонических составляющих импульсов тока переключения, максимальная частота которых определяется формулой [4]. Она всегда много больше тактовой частоты процессора, в таблице 1 она приведена в графе «Макс. частота помехи fмакс ГГц».

Но это не единственный источник электромагнитного воздействия на кристалле. На тех же частотах в шинах кристалла и в том числе в линиях распределения питания образуются стоячие волны. Это еще более опасно, из-за суммирования на них помех со всех ключей кристалла и в результате их высокой мощности.

 

С переходом на более тонкие технологии укорачивается канал полевого транзистора, а значит, растет его быстродействие. В некоторых источниках приводится информация о способности МОП транзисторов работать на частоте порядка 1 ТГц. Конечно, близкие значения граничной частоты современные технологии могут обеспечить, но в процессорах комплементарные МОП транзисторы образуют сложные структуры, где большие результирующие емкости их нагружающие требуют большего времени на перезарядку. Поэтому времена переключения имеют величину близкую к указанной в таблице 1.

Быстродействие растет еще пропорционально уменьшению площади полевого транзистора и росту напряжения питания. Каждый шаг при переходе с одного техпроцесса на другой, более тонкий, в существующем ряду, уменьшает площадь полевого транзистора на чипе в два раза и поэтому, за счет снижения емкости нагрузки, должен увеличивать быстродействие примерно вдвое. Поэтому тактовая частота процессора, при переходе на новую ступень, должна увеличиваться примерно вдвое. Это и наблюдалось на начальном этапе освоения новых техпроцессов.

Еще одно преимущество, при переходе на более тонкие технологические процессы – снижение мощности, рассеиваемое одним транзистором примерно вдвое на шаг. Оно происходит пропорционально снижению площади. Но мы наблюдаем все тот же TDR = 130-:-140 Вт у самых производительных моделей процессоров. Причина гонка за выполнением «закона» Мура, примерно вдвое растет число транзисторов на кристалле. Результат - TDR сохраняется.

Реально, у Intel, рост тактовой частоты происходил только до техпроцесса 130 нм, выше которого рост сначала замедлился, а потом остановился.Причины этого считаются техническими и производителями не афишируются.

Попробуем разобраться в них, для этого рассмотрим временные ограничения на работу ключей и дискретной логики.

На рисунке 2 показана типичная циклограмма, описывающие временную диаграмму работы процессора. Она взята из описания процессора Intel Xeon.

 

Рисунок 2.

 

Так какова может быть тактовая частота процессора?

Для оценки ее величины посмотрим рисунок 3, на котором рассмотрена циклограмма одного из наиболее быстрых циклов процессора.

 

Рисунок 3.

 

Известно:

  • структуры процессора состоит из логических элементов AND, OR, триггеров и их комбинаций,
  • операции выполняются процессором за 2,4,8, 16, ... тактов,
  • ячейки типа – триггер, срабатывают по фронтам импульсов,
  • логические элементы работают по плоской части импульса,
  • узлы процессора, работающие с максимальной частотой - ядро и тактовый генератор.

 

Для работы логического элемента AND с N входами необходимо, чтобы плоская часть вершины импульса (лог. «1») совпала на всех входах, тогда на его выходе будет зафиксирован логическая «1». Для этого достаточно длительности вершины равной 2 tф (рис.2). Если это перевести в период следования импульсов, которые может обрабатывать логический элемент AND, то получим:

 

T = (4-5) t ф [1]

 

Тактовая частота задающего генератора процессора определяется быстродействием цепочки логических элементов его образующих.

 

T = (4-5) t ф [2]

 

Другие оценки могут отличаться от этих, но разница в величине меньше 100 %, и никак не на порядки, что имеет место быть.

Рассмотрим эти формулы и таблицу 1 из статьи " Как веревочке не виться, …"

Для наглядности введем в таблицу 1. параметр T – период следования импульсов наивысшей возможной тактовой частоты, тактового генератора процессора fпр, при этом примем:

 

T = 4tф и fпр = 1/T. [3]

 

Исходя из временных характеристик транзисторов процессора, немного модифицируем ту же таблицу. Введя в нее дополнительную строку «Макс тактовая частота (ГГц), по быстродействию» - это частота f [3]. Она показывает, какая предельная частота могла быть у процессора, если бы она определялась быстродействием транзисторов (при данном технологическом процессе). В результате получим Таблицу 1.

"Максимальная частота помехи fмакс ГГц" в таблице 1 - из генерируемого процессором спектра помех (согласно п.3 Списка литературы) определяем как:

 

fмакс = 1/tф [4]

 

Подробно о механизме генерации помех на кристалле процессора их мощности и частотном составе описано в материале «Механизм генерации помех в БИС процессоров».

Но хочу напомнить основные положения:

  • Мощность потребляемая процессором это сумма мощностей перезарядки емкостей нагрузки всех КМОП ключей образующих структуру процессора. Конечно при отсутствии других потребителей – утечек, неисправных элементов.
    Pп=fперекл Cн E2пит
  • Источником генерируемых процессором помех является тот же ток перезарядки емкостей нагрузки КМОП ключей. Они представляют собой индуцируемые импульсами токов перезарядки в индуктивностях линий распределения питания – сумму напряжений помехи.
  • Поэтому реальная мощность генерируемых процессором помех связана с потребляемой процессором мощностью и оценивается от 0,25 до 0,5 нее (Pпр).
  • максимальная частота помех определяется не тактовой частотой процессора, а длительностью импульсов токов перезарядки емкостей нагрузки, поэтому их частота много выше тактовой частоты.
 

Обращаю внимание программистов на зависимость мощности генерируемой помехи от алгоритмов работы программ. Они могут управлять загрузкой ядра процессора, а поэтому и его температурой и мощностью помех.

 

Таблица 1

ГОД по данным Intel 1993 1995 1997 1999 2001 2003 2005 2007 (2008*) 2009 (2011*)
Технология мкм 0,5 0,35 0,25 0,18 0,13 0,09 0,065 0,045 0,032
Длина канала нм - - 120 90 70 45 35 30 15
Макс. достигнутая тактовая частота процессора ГГц 0,2 0,45 1 2 3,4 3,8 3,8 3,8
(3,2**)
3,5
Модель Pentium 200 Pentium Pro Pentium III Pentium4 2,0 Pentium 4 3,4 Pentium4  571 Pentium4  673 Penryn Quad-Core Xeon DP X5460 Nehalem
*** Время переключения
τ (псек)
1 нс 550 250 125 65 23 12 9 <5
Макс тактовая частота (ГГц), по быстродействию 0,25 0,454 1 2 3,8 10 19-20 27-28,4 >50
Макс. частота помехи fмакс ГГц - 2 4 8 15 45 83 >100 >200
****Коэф. мощности 1 1 1 1 1,125 2,75 5,25 8,5 >15
 

*- из других источников,

** - Core 2 Extreme QX9770, ядро Yorkfield, 4 ядра, тактовая частота 3,2 ГГц, FSB 400 МГц, Кэш L2 12 Мб, TDR136Вт

*** - зависимость достаточно сложная, время переключения зависит от длины канала МДП транзистора, напряжения его питания и емкости затворов (площади под транзистором) .

**** -характеризует во сколько раз потребляемая процессором мощность меньше мощности на максимальной тактовой частоте определяемой быстродействием.

На основе этих данных построим график функции описывающей зависимость тактовой частоты реальной и максимальной (определяемой быстродействием транзистора), которые отложены по вертикальной шкале от шага технологического процесса, отложенного по горизонтальной шкале.

 

Рисунок 4.

 

На рисунке 3, синей сплошной линией, показана, какой бы могла быть тактовая частота процессора, если бы она определялась только быстродействием транзистора. Это геометрическая прогрессия. Точка 0,032 мкм расчетная.

Еще раз хотелось бы вспомнить пресловутый «закон» Мура. Число транзисторов, согласно ему, удваивается каждый год (как говорилось в начале) или каждые два года (как говорят сейчас). А может быть больше? Возникает вопрос, как долго может, оно расти?

Была даже версия об удвоении тактовых частот процессора за тот же период. После фиаско с 4 ГГц Pentium 4 ее вывели из употребления.

Для представления ситуации можно вспомнить индийскую сказку о радже, проигравшем в шахматы весь свой урожай. Для расплаты на каждую следующую клетку доски надо было положить удвоенное число зерен риса. На 64 клетку его зерна не хватило.

Конечно, можно ради выполнения «закона» Мура сделать 2, 4, 8, …64 Мб, .. кеш или 2,4,8 ,…, 80 ядер.

Сколько пожелаете уважаемый Мур?

Но это полезно до определенного момента, поскольку поможет уложиться в «закон» Мура.

Доводя до абсурда, можно предложить Intel размещать на кристалле не используемые транзисторы, уж тогда-то «закон» можно будет выполнить с достаточной точностью. А может быть это уже используется? Транзисторы отключенных Кешей и такая практика уже существует?

Для наглядности рассмотрим начальный участок (до частоты 5 ГГц) графика. На нем синей штриховой линией, показана тактовая частота, определяемая быстродействием транзисторов, а синей точечной линией реальная тактовая частота процессоров. Точка 0,032 мкм это прогноз. Зона между красными линиями это зона возможного разброса тактовых частот. По верхней ее границе могут работать разгоняемые или отдельные процессоры.

 

Рисунок 5.

 

Из графиков рис.4 и 5 видим, что на техпроцессах до 0,13 мкм кривые расчетных и практических значений практически совпадают, но далее появляется все более увеличивающийся разбег. При разгоне применяется повышение напряжения питания ядра, что вполне логично, поскольку с его ростом повышается быстродействие КМОП (точнее КМДП) транзисторов процессора, прямо пропорционально величине напряжения питания и это несколько поднимает верхнюю границу красной зоны на графике.

Его причины упоминались в серии статей на сайте. Фактор, способствующий этому те самые ВЧ и СВЧ помехи, генерируемые структурой процессора на линиях распределения питания.

До техпроцессов до 0,13 мкм было возможно с помощью внешней обвески конденсаторами разных емкостей на корпусе процессора и в системной плате хотя бы частично решить проблему. Это был своего рода широкополосный (многополосный, как еще говорят) фильтр, правда, он не расчетный, а подобранный опытным путем. Хоть и не всегда, поскольку множество публикаций о текущих конденсаторах говорит, что часто решения были не оптимальны. Были опыты распространения фильтров и на сам процессор. Это уже описанный выше процессор AMD Thoroughbreg ревизии B и описанный в статье «Влияние параметров генератора помех на эффективность их фильтрации.» процессор Xeon от Intel.

Начиная с техпроцесса 0,09 мкм, СВЧ помеха в своем составе имеет частотные составляющие выше 30 ГГц, правда их доля еще невелика. Тут уже возможно не только поглощение этих помех в кристалле, но реальны интерференция и стоячие волны. Это как раз не только снижает помехоустойчивость, но и увеличивает в чипе поглощаемую мощность. Отрицательно действующим фактором на техпроцессах менее 0,09 мкм является рост частот помех. При превышении некоторых частот, определяемых конструкцией процессора, большая их часть, именно высокочастотных составляющих, остается в процессоре. Они то и определяют разбег видимый на рис. 4 и 5. На техпроцессах 45 и 32 нм не только растет высокочастотная граница помех, но и доля их мощности остающаяся в процессоре увеличивается с каждым шагом.

Для решения проблемы надо гасить помехи в источнике, а для этого необходимо работать над структурой и схемой процессора. А это работа Intel, AMD, IBM!

Что касается системной платы, то никакими техническими решениями, повлиять на то, что происходит в процессоре, стало просто невозможно. А на самой плате даже "твердотельные" конденсаторы одни не могут решить проблему, они работают только до частот 1-10 МГц.

Но в любом случае широкополосный фильтр на системной плате необходимо обращать все больше внимания - оптимизировать и рассчитывать, поскольку за пределы процессора выходят помехи с частотами ниже 0,5-1 ГГц, и их мощность имеет тенденцию к росту. Иначе будем иметь дополнительное тепловыделение на плате и проблемы с конденсаторами фильтра.

Следует сказать, что с ростом числа ядер, наиболее быстродействующих и нагруженных узлов процессора, будет расти тепловыделение, мощность помехи. А поэтому ограничиваться тактовая частота. Как фиксировано производителем, так и введением специальных управляющих подпрограмм и алгоритмов.
 Глядя на то что:

  • «закон» Мура все реже упоминается Intel,
  • ее технологические планы не распространяются далее 2 ближайших лет.
  • ожидать существенного или пропорционального прироста тактовой частоты процессоров при современных технологиях не приходится.
  • попытки оптимизировать расположение узлов процессора не способна качественно изменить ситуацию с тактовой частотой.
  • прогнозируется даже некоторое снижение тактовой частоты на техпроцессе 32 нм.

Мур, Мур, Мур ….

Мы живем во время, когда любимое заклинание Intel перестает действовать. Позволит 32 нм техпроцесс хотя бы повысить плотность элементов на кристалле?

А дальше?
Что нас ждет?

 

Реальности таковы, что "S - кривая" - это то что нам преподносится как "закон мура"

 

P.S.

Сразу можно сказать, что еще с 2001-2002 года, когда проблема еще не стояла так остро, я пытался довести все изложенное на сайте и в патенте до десятка производителей графических процессоров, CPU, памяти, но:

  • Российское представительство Intel ответило «у нас нет специалистов этого профиля», просьба дать координаты подразделений занимающихся этими вопросами в компании остались без ответа.
  • Все остальные просто не ответили.

Единственный результат проверка соответствующих органов на предмет разглашения гос. тайны, но все это оказалось никак не связано с моей основной работой. На том все пока и закончилось.


 

Теперь подошло время ответить на вопрос K.A.B. поступивший на статью «Как бы веревочке не виться …»

Вопрос: -

Какой реальной частоты 45-нм CPU можно было бы достичь при Ucpu=ном с учетом применения всех возможных способов по снижению процессорной ВЧ - помехи (каких именно, помимо уже используемых?) при данном положении вещей ?

Ответ: -

Если подавить помехи, реально иметь тактовую частоту процессора на техпроцессе 0,045 мкм – до 10-30 ГГц. См. таблицу 1 и рис. 4 и 5. При этом могут возникнуть проблемы по синхронизации фронтов сигналов при передаче по шинам. Уже сейчас эта проблема существует.
И необходимо помнить, что на этих частотах придется отводить от процессора мощности на порядок большие существующих. Я бы сказал, что вполне реально при приемлемых затратах и отсутствии проблем иметь тактовую частоту процессора более 7 ГГц.

 

Вопрос: -

Известны ли Вам серийные современные модели СП с многополосной фильтрацией помех в цепи питания ?

Ответ: -

Все современные СП, и процессоры на корпусе, имеют обвеску конденсаторами фильтров их можно назвать многополосным фильтром. Иначе процессоры с тактовыми частотами уже более 0,5 ГГц просто не смогут устойчиво работать в системе. Одни из них более, другие менее оптимальны, но у производителей СП и процессоров задача обеспечить работу СП и процессора на паспортных частотах. Не оптимальность фильтров СП проявляются в виде нагрева оксидных конденсаторов (ОК) даже на десяток другой градусов, а процессоров в виде неустойчивой работы и это проявляются при разгоне. Как я уже писал ОК при хороших фильтрах должны иметь температуры превышающую окружающий их воздух не более 2-5 °С. Но все это не просчитывается, не оптимизируется. К сожалению, мною работы, по тестированию СП и процессоров (именно с точки зрения фильтров) не проводится из-за отсутствия средств и предложения СП и камней на тестирование.

 

Вопрос: -

Что вы думаете по поводу применения 12-ти фазных инверторов питания процессора (как, например, на GigaByte_GA-P35-DQ6)? Хотя понятно, что для CPU это только плюс, а вот для СП не скажется ли усложнение схемотехники на увеличении вероятности выхода из строя какого-либо компонента инвертора, хотя, конечно же, разгрузка каждого канала в отдельности должна идти только на пользу тепловому режиму работы.

Ответ: -

С одной стороны - при мощности потребления процессором порядка 100 Вт в 12 фазном инверторе на одну фазу приходится нагрузка менее 8,5 Вт. Это дает менее 2Вт тепловыделения с фазы. Такие инверторы могут выполняться в интегральном исполнении и иметь большее быстродействие. Это удешевляет производство.
С другой стороны – со снижением мощности приходящейся на фазу, ростом числа фаз и повышением быстродействия можно повысить тактовую частоту переключения, что позволяет при тех же величинах емкости конденсаторов фильтра получить более стабильное напряжение питания. Появляется возможность снизить шаг регулирования напряжения питания процессора.
Еще это решение позволяет снизить нагрузку на накопительные дроссели инверторов.

 

Ссылки:

1.  Закон Мура, вторая версия, Евгений Золотов,  http://www.computerra.ru/think/sentinel/33060/ , 2004 г.

2. Закон Мура исправили, Сергей КОЛЯДА, Известия науки, 2005, http://www.inauka.ru/technology/article53383.html

3. Тайны Закона Мура, Владимир Дьяконов, CNews аналитика, 2003, http://www.cnews.ru/reviews/index.shtml?2003/07/14/146261

А.Сорокин

 

 

Яндекс.Метрика

<<назад>> <<в начало>> <<на главную>>

Попасть прямо в разделы сайта можно здесь:

/Неизвестный процессор/Охлаждение ПК/Электроника для ПК/Linux/Проекты, идеи/Полезные советы/Разное/
/
Карта сайта/Скачать/Ссылки/Обои/

При полном или частичном использовании материалов ссылка на "www.electrosad.ru" обязательна.
Ваши замечания, предложения, вопросы можно отправить автору
почтой.

Copyright © Sorokin A.D.©

2002 - 2020