Visas formulas un metodes centrālā procesora veiktspējas aprēķināšanai

Pēdējā atjaunošana: 12 augusts 2025
Autors: Isaac
  • Galvenās attiecības: laiks = (NI × CPI)/f un veiktspēja = (f × CPI)/NI, kur CPI/CPI ir galvenie sviras.
  • Patiesa mērogojamība: Amdāls un Gustafsons ierobežo ātruma palielināšanu; efektivitāte samazinās, palielinoties pieskaitāmajām izmaksām.
  • Atmiņas noteikumi: trāpījums/kļūda, DDR un joslas platums ietekmē CPI tikpat lielā mērā kā frekvence.
  • WPA metode: kritiskais ceļš, pavedieni (gatavs/darbojas/gaida), DPC/ISR un prioritātes izskaidro vājās vietas.

CPU veiktspējas formulas

Meklējot visas formulas centrālā procesora veiktspējas aprēķināšanai, ir ideāli tās labi izskaidrot, iekļaujot kontekstu un praktiskus piemērus., nevis tikai brīvs vienādojumu saraksts. Šajā rokasgrāmatā ir apkopoti un skaidrā un visaptverošā veidā pārrakstīti profesionālās analīzes rādītāji, formulas, nianses un paņēmieni. (tostarp Windows Performance Analyzer izmantošana), kas bieži vien ir izkaisīti pa daudziem avotiem.

Šeit atradīsiet visu, sākot no klasiskajām mērvienībām (IPS, IPC, CPI un FLOPS) līdz precīzai izpildes laika un veiktspējas attiecībai, Amdāla un Gustafsona likumiem, atmiņai un joslas platumam, un pat to, kā pētīt pavedienu traucējumus un DPC/ISR ar WPA.Turklāt tajā ir iekļauts centrālā procesora (C·V²·F) enerģijas patēriņa aprēķins, rīki tā mērīšanai un ieteikumi praktiskiem efektivitātes un veiktspējas uzlabojumiem.

Pamatvienības un metrikas: IPS, IPC, CPI, FLOPS un frekvence

ASUS Prime Z790-P

Pirmkārt, ir jāņem vērā, kuras ir vissvarīgākās vienības, ar kurām mēs strādāsim:

  • IPS (instrukcijas sekundē) mēra, cik instrukciju procesors izpilda vienas sekundes laikā (parasti MIPS, miljoniem IPS). Tas ir noderīgs rādītājs, lai iegūtu globālu priekšstatu par caurlaidspēju., lai gan tas labi neaptver instrukciju sarežģītību vai mikroarhitektūras atšķirības. Vēsturiski un mūsdienu piemēri parāda plaisu starp dizainiem un laikmetiem, un ar pārslodzi tas var atšķirties.
  • IPC (instrukcijas ciklā) Norāda, cik instrukciju centrālais procesors izpilda vidēji vienā pulksteņa ciklā. Ir svarīgi saprast efektivitāti katrā ciklā neatkarīgi no frekvences.. IPC salīdzināšanai ir jāizmanto viena un tā pati programma vai etalons. dažādās iekārtās, jo instrukciju skaits un veids ir atkarīgs no programmatūras.
  • CPI (cikli vienā instrukcijā) Tas ir patēriņa cenu indeksa (CPI) konceptuālais apgrieztais variants: cik ciklus vidēji veic katra instrukcija. CPI mainās atkarībā no instrukcijas veida un mikroarhitektūras. (piemēram, slodzei var būt nepieciešams vairāk ciklu nekā lēcienam), tāpēc to parasti aprēķina kā svērtais vidējais rādītājs pa instrukciju klasēm.
  • FLOPS (peldošā komata operācijas sekundē) kvantificē peldošā komata aprēķinus, kas ir kritiski svarīgi augstas veiktspējas skaitļošanā, mākslīgajā intelektā un zinātnē. Izšķir vienkāršas precizitātes (SP) un dubultas precizitātes (DP) mērījumus, un energoefektivitāti sauc arī par FLOPS/W.. Ir svarīgi atšķirt vietējos FLOPS un normalizētos FLOPS. salīdzinot heterogēnas platformas.
  • Frekvence (Hz) iezīmē pulksteņa ritmu, bet nav tieši sinonīms veiktspējai. MHz mītsMūsdienās zemākas frekvences centrālais procesors var pārspēt ātrāku procesoru par paralēlisms, labāka IPC un efektīvākas mikroarhitektūras. Turklāt cauruļvada dziļums un kritiskā loģika nosaka sasniedzamo frekvenci..
  AMD Radeon RX 6600 salīdzinājumā ar NVIDIA GeForce RTX 3050: Kura ir labāka?

Būtiskākās formulas: izpildes laiks, caurlaidspēja, IPC, CPI, IPS un FLOPS

Daži Būtiskas formulas veiktspējas aprēķināšanai/mērīšanai procesors, kas jums jāzina, ir:

  • Izpildes laiksStandarta veids, kā to izteikt, ir Laiks = NI × PCI × T, kur NI ir instrukciju skaits programmā, PCI vidējais ciklu skaits vienā instrukcijā un T pulksteņa periods (T = 1/frekvence). Ekvivalents: Laiks = (NI × PCI) / Biežums. Aparatūra un kompilators bieži uzbrūk CPI un frekvencei; NI ir atkarīgs no programmatūras..
  • Sniegums ir laika apgrieztā vērtība: Veiktspēja = 1 / LaiksPārrakstīšana, Veiktspēja = (Biežums × CPI) / NI. Tas skaidri parāda saistību trīsstūri: palielināt biežumu un patēriņa cenu indeksu un/vai samazināt neto pārdošanas apjomus (NI). (labāks algoritms, labāka kompilācija) palielina veiktspēju.
  • CPU laiks daudzprocesoru sistēmās To izsaka, saskaitot pavedienu laikus vai izmantojot agregācijas, kas paredz P procesori. Paralēli faktiski paralēlojamā daļa un koordinācijas pieskaitāmās izmaksas ierobežo ieguvumu. (skatīt Amdāla un Gustafsona likumus zemāk).
  • Efektīvais patēriņa cenu indekss (PCI) konkrētai programmai tas tiek iegūts no faktiskais vidējais novērotais instrukciju skaits ciklā tā izpildes laikā; salīdzinājumiem, izmanto to pašu etalonu abās iekārtās, lai NI un instrukciju miksēšana būtu salīdzināma.
  • Svērtais vidējais patēriņa cenu indekss (PCI) Parasti to aprēķina kā Σ (PCI_i × svars_i), kur katrs CPI_i atbilst mācību klasei un svars_i ir šīs klases daļa programmā. Šis uz klasēm balstītais skats ļauj redzēt, kur optimizēt (piemēram, lēna ielāde vai dārgas sadalīšanas)..
  • IPS (instrukcijas sekundē) bieži tiek tuvināts kā IPS ≈ Frekvence × CPI. Esiet uzmanīgi ar cauruļvadiem, atkarībām, prognozēšanu un kanālu iztukšošanupraksē, Pārsprādzieni un sodi var novirzīt jūs no teorētiskā skaitļa.
  • PLAUKI Vienkāršā sistēmā to aprēķina kā Frekvence × peldošās darbības ciklā (atkarībā no vektora platuma un FPU vienībām) un paralēli kā Katra procesora kopējais FLOPS ≈ Σ FLOPS. Atšķirība, ja strādājat SP vai DP un atcerieties atšķirību starp Vietējie un normalizētie FLOPS.
  Intel Core i5-13400 salīdzinājumā ar Core i5-12400: salīdzinājums un veiktspēja

Mērogojamība: Amdāla likums, Gustafsona likums, paātrinājums, efektivitāte un izoefektivitāte

Citas svarīgas formulas datora veiktspējas, efektivitātes u. c. aprēķināšanai:

  • Amdāla likums modelē ieguvumu, paātrinot sistēmas daļu. Ja daļa f laika negūst labumu no uzlabojuma, maksimālo paātrinājumu ierobežo 1/f. Paralēli, ar paralēlizējamu daļu p, tipisko robežu izsaka kā S(N) = 1 / ((1 − p) + p/N). Vislielāko atdevi sniedz sašaurinājuma uzlabošana (efektīvās secīgās daļas samazināšana)..
  • Pielietojums cauruļvadamCauruļvadu veidošana samazina latentumu katrai instrukcijai līdzsvara stāvoklī, bet Burbuļošana, datu riski un prognozēšanas kļūmes Viņi pievieno sodus, kas ierobežojiet ideālo paātrinājumu. Cauruļvada padziļināšana palielina biežumu, bet arī soda par iztukšošanos..
  • Gustafsona likums pauž atšķirīgu viedokli: problēmai pieaugot līdz ar procesoru skaitu, S(N) ≈ N − α (N − 1), kur α tuvina secīgo daļu, mērogojot slodzi. Viņš uzsver, ka slodzes sadalījums un virszemes izmaksas nosaka patieso efektivitāti..
  • Efektivitāte tas definē como E = S(N) / N. Palielinoties N, E mēdz samazināties. ar koordināciju, kopīgu atmiņu un nelīdzsvarotību. Izoefektivitāte meklēt, kā palieliniet problēmas izmēru n par saglabājiet E konstantu, palielinoties p (procesoriem), absorbējot virs galvas izmaksas.

Atmiņa, kešatmiņa, joslas platums un krātuve: pārējie 50% veiktspējas

DIMM moduļu veidi

Papildus apstrādes aprēķiniem svarīga ir arī atmiņas veiktspēja, kuras svarīgākās formulas ir:

  • Atmiņas hierarhija nosaka patēriņa cenu (CPI).Piekļuve kešatmiņai var maksāt 1 ciklu, savukārt piekļuve RAM atmiņai simtiem ciklu. Sadursmju/neveiksmju rādītājiem ir tikpat liela vai pat lielāka nozīme nekā neapstrādātam joslas platumam un latentumam.Labāks trāpījumu rādītājs ir vienāds ar mazāk sodu un mazāk enerģijas, kas tiek patērēts, iedziļinoties atmiņā.
  • Galvenās definīcijas: Kļūmju biežums = kļūmju skaits / kopējais piekļuves reižu skaits y Rezultātu biežums = trāpījumu skaits / kopējais piekļuves reižu skaits. Palieliniet instrukcijas vai datu kešatmiņas izmēru un uzlabojiet koda lokalizāciju palielināt trāpījumu līmeni un samazināt patēriņa cenu indeksu.
  • DDR un efektīvā frekvenceDDR atmiņas darbojas 2 pārsūtījumi ciklā kontroliera, tāpēc DDR4-3200 atbilst 1600 MHz memclk atmiņai. Teorētiskais joslas platums pēc moduļa tiek tuvināts kā memclk × 2 × kopnes_platums (biti) × kanālu skaits, un tiek izteikts baitos/s (dalīt ar 8). Klasisks DDR4-3200 piemērs, 64 bitu kopne, divkanāls1.600.000.000 2 64 2 × 409.600.000.000 × XNUMX × XNUMX = XNUMX XNUMX XNUMX XNUMX biti/s ≈ 51,2 GB / s.
  • Cietā diska rotācijas latentums (kad galva jau atrodas uz sliedēm): tiek lēsts, ka 0,5 apgriezieni / (apgr./min./60). 7200 apgr./min0,5 / (7200/60) ≈ 4,16 ms. Diska buferi un kešatmiņas var samazināt daļu piekļuves laika, bet tie neizslēdz kavēšanās mehānisko raksturu.
  • Atmiņas un skaitļošanas pieprasījumsHPC slodžu analīze tiek veikta no darbības intensitāte (FLOP/baits), kas attiecas Peldošā komata instrukcijas un datu pārvietošana. Zema intensitāte nodod atmiņas ierobežojumsaugsts skaitļošanas ierobežojums. Optimizējiet izkārtojumus un secīgu piekļuvi var pilnībā mainīt veiktspējas profilu.
Saistītais raksts:
Visuzticamākie CPU un GPU etaloni

Patēriņš un efektivitāte: TDP, dinamiskā jauda un instrumenti

No otras puses, mums ir arī patēriņa un efektivitātes jautājumi:

  • TDP nav faktiskais patēriņš: ir termiskais/dizaina mērķis. Patēriņš mainās atkarībā no efektīvās slodzes, sprieguma un frekvencesZem nelielas slodzes, Faktiskais vidējais patēriņš parasti ir daudz zemāks nekā TDP.
  • Aptuvenā dinamiskā jauda: P = C · V² · F. C ir pārslēgtā kapacitāte, V spriegums un F frekvence. Sprieguma palielināšana soda kvadrātiski; līdz ar to pārslodze ar pārsprieguma cēloņiem lieli patēriņa un siltuma lēcieni. Papildus dinamiskajai daļai pastāv noplūdes, kas palielinās līdz ar temperatūru un procesu..
Intel Core Ultra 9 185H
Saistītais raksts:
Intel Core Ultra 9 185H procesors parādās CPU-Z un sola izcilu veiktspēju klēpjdatoros, mini datoros un AIO ierīcēs.