Све формуле и методе за израчунавање перформанси процесора

Последње ажурирање: КСНУМКС августа КСНУМКС
Аутор: Исак
  • Основни однос: Време = (НИ × ИПЦ)/f и Учинак = (f × ИПЦ)/НИ, где су ИПЦ/ИПЦ кључне полуге.
  • Права скалабилност: Амдал и Густафсон ограничавају убрзање; ефикасност се смањује са повећањем општих трошкова.
  • Правила меморије: погодак/промашај, DDR и пропусни опсег утичу на CPI колико и фреквенција.
  • WPA метода: критична путања, нити (Спреман/Радујући/Чекајући), DPC/ISR и приоритети објашњавају уска грла.

Формуле за перформансе процесора

Када тражите све формуле за израчунавање перформанси процесора, идеално је да буду добро објашњене, са контекстом и практичним случајевима., не само лабав списак једначина. Овај водич обједињује и преписује на јасан и свеобухватан начин метрике, формуле, нијансе и технике професионалне анализе. (укључујући употребу Windows Performance Analyzer-а) који се често појављују раштркани по многим изворима.

Овде ћете пронаћи све, од класичних јединица (IPS, IPC, CPI и FLOPS) до тачне везе између времена извршавања и перформанси, Амдалових и Густафсонових закона, меморије и пропусног опсега, па чак и како проучавати интерференцију нити и DPC/ISR са WPA.Поред тога, укључује прорачун потрошње енергије процесора (C·V²·F), алате за њено мерење и препоруке за практична побољшања ефикасности и перформанси.

Основне јединице и метрике: IPS, IPC, CPI, FLOPS и фреквенција

АСУС Приме ЗКСНУМКС-П

Прво што треба узети у обзир је које су најважније јединице којима ћемо се бавити:

  • IPS (Инструкције у секунди) мери колико инструкција процесор извршава у једној секунди (обично MIPS, милиони IPS). То је корисна метрика за добијање глобалне представе о пропусности, иако не обухвата добро сложеност инструкција или микроархитектонске разлике. Историјски и модерни примери показују јаз између дизајна и епоха, а са оверклоковањем може да варира.
  • IPC (Инструкције по циклусу) Показује колико инструкција процесор извршава у просеку по такту. Кључно је разумети ефикасност по циклусу без обзира на фреквенцију. Поређење IPC-а захтева коришћење истог програма или бенчмарка на различитим машинама, јер број и врста инструкција зависе од софтвера.
  • CPI (циклуси по инструкцији) То је концептуална инверзија CPI-ја: колико циклуса свака инструкција траје у просеку. CPI варира у зависности од типа инструкције и микроархитектуре. (на пример, оптерећење може захтевати више циклуса него скок), па се обично израчунава као пондерисани просек по часовима наставе.
  • FLOPS (операције са покретним зарезом у секунди) квантификује израчунавање са покретним зарезом, што је кључно у високопроизводном рачунарству, вештачкој интелигенцији и науци. Прави се разлика између једноструке прецизности (SP) и двоструке прецизности (DP), а енергетска ефикасност се назива и FLOPS/W.. Важно је разликовати изворне FLOPS-ове и нормализоване FLOPS-ове. када се упоређују хетерогене платформе.
  • фреквенција (Хз) означава ритам сата, али није директно синоним за перформансе. Мит о MHzДанас процесор ниже фреквенције може да надмаши бржи за паралелизам, бољи IPC и ефикасније микроархитектуре. Поред тога, дубина цевовода и критична логика одређују достижну фреквенцију..
  Објашњење напона процесора: VID, Vcore, SVI2/TFN (VR VOUT), Vdrop и Vdroop са кућиштима из стварног света

Основне формуле: време извршавања, пропусност, IPC, CPI, IPS и FLOPS

Неки Основне формуле за израчунавање/мерење учинка процесора које бисте требали знати су:

  • Време извршењаСтандардни начин изражавања овога је Време = НИ × ИПЦ × ТГде NI је број инструкција у програму, ИПЦ просечан број циклуса по инструкцији и T период такта (T = 1/фреквенција). Еквивалент: Време = (НИ × ЦПИ) / Учесталост. Хардвер и компајлер често нападају CPI и фреквенцију; NI зависи од софтвера..
  • Перформансе је инверзна вредност времена: Перформансе = 1 / ВремеПреписивање, Перформансе = (Учесталост × CPI) / NI. Ово јасно разјашњава троугао обавеза: повећање учесталости и потрошачких цена и/или смањење националног дохотка (бољи алгоритам, боља компилација) повећава перформансе.
  • Процесорско време на вишепроцесорским системима Изражава се додавањем времена нити или коришћењем агрегација које разматрају П процесори. Паралелно, део који се може заиста паралелизовати и трошкови координације ограничавају корист. (видети Амдалове и Густафсонове законе испод).
  • Ефективна цена по инвестицији (CPI) за одређени програм се добија из стварни просечан број посматраних инструкција по циклусу током његовог извршења; ради поређења, користи исти бенчмарк на обе машине тако да су NI и мешање инструкција упоредиви.
  • Пондерисани просечни CPI Обично се израчунава као Σ (CPI_i × weight_i), где сваки CPI_i одговара класи инструкција и тежина_i је део те класе у програму. Овај приказ заснован на класи вам омогућава да видите где да оптимизујете (нпр. спора учитавања или скупе поделе).
  • IPS (Инструкције у секунди) често се апроксимира као IPS ≈ Фреквенција × CPI. Будите опрезни са цевоводима, зависностима, предвиђањима и пражњењем канала: у пракси, Рафалси и казне могу вас удаљити од теоријске бројке.
  • ФЛОПС У једноставном систему се процењује као Фреквенција × плутајуће операције по циклусу (у зависности од ширине вектора и FPU јединица), и паралелно као Укупан број FLOPS-ова ≈ Σ FLOPS-ова сваког процесора. Разлика ако радите у СП или DP и запамтите разлику између Изворни и нормализовани FLOPS-ови.
  Intel Nova Lake-S има за циљ прави скок напред у десктоп рачунарству

Скалабилност: Амдалов закон, Густафсонов закон, убрзање, ефикасност и изоефикасност

Остале важне формуле за израчунавање перформанси рачунара, ефикасности итд.:

  • Амдалов закон моделира добит од убрзања дела система. Ако део f времена нема користи од побољшања, максимално убрзање је ограничено са 1/f. Паралелно, са паралелабилним разломком p, типична граница је изражена као S(N) = 1 / ((1 − p) + p/N). Побољшање уског грла (смањење ефективног секвенцијалног дела) је оно што се највише исплати.
  • Примена на цевоводПајпилининг смањује латенције по инструкцији у стабилном стању, али Мехурићи, ризици података и неуспеси у предвиђањима Додају казне које ограничити идеално убрзање. Продубљивање цевовода повећава учесталост, али и казне за пражњење..
  • Густафсонов закон заузима другачији став: како проблем расте са бројем процесора, S(N) ≈ N − α (N − 1), где α апроксимира секвенцијални разломак скалирањем оптерећења. Он наглашава да расподела оптерећења и режијски трошкови одређују стварну ефикасност..
  • Ефикасност је дефинисано као E = S(N) / N. Како се N повећава, E има тенденцију да се смањује координацијом, заједничким памћењем и неравнотежама. Изоефикасност потражи како повећати величину проблема n пар одржавати E константним како се p (процесори) повећава, апсорбујући режијске трошкове.

Меморија, кеш меморија, пропусни опсег и складиштење: преосталих 50% перформанси

Врсте DIMM меморија

Поред прорачуна за обраду, важне су и перформансе меморије, а најважније формуле за то су:

  • Хијерархија меморије одређује CPIПриступ кеш меморији може коштати 1 циклус, док приступ РАМ меморији стотине циклуса. Стопе погодака/неуспеха су важне колико и, или чак и више, од пропусног опсега и латенције.Боља стопа погодака једнака је мање казни и мање енергије утрошене на памћење.
  • Кључне дефиниције: Стопа промашаја = број неуспеха / укупан број приступа y Стопа погодака = број погодака / укупан број приступа. Повећајте величину кеша инструкција или података и побољшајте локалност вашег кода повећајте стопу погодака и смањите цену по инсталацији (CPI).
  • DDR и ефективна фреквенцијаDDR меморије раде 2 преноса по циклусу контролора, зато DDR4-3200 је еквивалентно 1600 MHz memorije CLC.. Теоретски пропусни опсег по модулу је апроксимирано као memclk × 2 × ширина магистрале (битови) × број канала, и изражава се у бајтовима/с (подељено са 8). Класичан пример DDR4-3200, 64-битна магистрала, двоканални: 1.600.000.000 × 2 × 64 × 2 = 409.600.000.000 бита/с ≈ КСНУМКС ГБ / с.
  • Ротациона латенција на тврдом диску (када је глава већ на прузи): процењује се као 0,5 обртаја / (о/мин/60). За 7200 обртаја у минути: 0,5 / (7200/60) ≈ КСНУМКС МС. Бафери диска и кеш меморије могу ублажити део времена приступа, али не елиминишу механичку природу кашњења.
  • Потражња за меморијом и рачунарствомКод HPC оптерећења анализа се врши од интензитет рада (FLOP/бајт), који се односи Инструкције са покретним зарезом и кретање података. Ниског интензитета издаје ограничење меморије; висок, ограничење рачунања. Оптимизујте распореде и секвенцијални приступ може потпуно променити профил перформанси.
Повезани чланак:
Најпоузданији бенчмаркови за процесор и графичку картицу

Потрошња и ефикасност: TDP, динамичка снага и алати

С друге стране, имамо и питања потрошње и ефикасности:

  • TDP није стварна потрошња: је термички/дизајнерски циљ. Потрошња варира у зависности од ефективног оптерећења, напона и фреквенцијеПод малим оптерећењима, Стварна просечна потрошња је обично много нижа од TDP-а.
  • Приближна динамичка снага: P = C · V² · F. C је прекидани капацитет, V напон и F фреквенција. Повећање напона кажњава квадратно; стога оверклоковање са пренапоном узрокује велики скокови у потрошњи и топлоти. Поред динамичког дела, постоје цурења која расту са температуром и процесом..
Интел Цоре Ултра 9 185Х
Повезани чланак:
Intel Core Ultra 9 185H се појављује на CPU-Z-у и обећава изванредне перформансе у лаптоповима, мини рачунарима и AIO уређајима