- Hubungan teras: Masa = (NI × CPI)/f dan Prestasi = (f × CPI)/NI, dengan CPI/CPI sebagai tuas utama.
- Kebolehskalaan sebenar: Amdahl dan Gustafson mengehadkan kelajuan; kecekapan berkurangan apabila overhed meningkat.
- Peraturan memori: hit/miss, DDR dan lebar jalur mempengaruhi CPI sama seperti kekerapan.
- Kaedah WPA: laluan kritikal, utas (Sedia/Berjalan/Menunggu), DPC/ISR dan keutamaan menjelaskan kesesakan.
Apabila anda mencari semua formula untuk mengira prestasi CPU, adalah sesuai untuk menjelaskannya dengan baik, dengan konteks dan kes praktikal., bukan sekadar senarai persamaan yang longgar. Panduan ini menghimpunkan dan menulis semula dengan cara yang jelas dan menyeluruh metrik, formula, nuansa dan teknik analisis profesional. (termasuk penggunaan Windows Performance Analyzer) yang sering kelihatan bertaburan di banyak sumber.
Di sini anda akan menemui segala-galanya daripada unit klasik (IPS, IPC, CPI dan FLOPS) kepada hubungan yang tepat antara masa pelaksanaan dan prestasi, undang-undang Amdahl dan Gustafson, memori dan lebar jalur, malah cara mengkaji gangguan benang dan DPC/ISR dengan WPA.Selain itu, ia termasuk pengiraan penggunaan kuasa CPU (C·V²·F), alat untuk mengukurnya dan cadangan untuk kecekapan praktikal dan peningkatan prestasi.
Unit dan metrik asas: IPS, IPC, CPI, FLOPS dan kekerapan

Perkara pertama adalah untuk mengambil kira unit yang paling penting yang akan kami kendalikan:
- IPS (Arahan sesaat) mengukur berapa banyak arahan yang dilaksanakan pemproses dalam satu saat (biasanya MIPS, berjuta-juta IPS). Ia adalah metrik yang berguna untuk mendapatkan idea global tentang daya pemprosesan, walaupun ia tidak menangkap kerumitan arahan atau perbezaan seni bina mikro dengan baik. Contoh sejarah dan moden menunjukkan jurang antara reka bentuk dan era, dan dengan overclocking ia boleh berbeza-beza.
- IPC (Arahan setiap kitaran) Menunjukkan berapa banyak arahan yang CPU laksanakan secara purata bagi setiap kitaran jam. Ia adalah kunci untuk memahami kecekapan setiap kitaran tanpa mengira kekerapan. Membandingkan IPC memerlukan penggunaan program atau penanda aras yang sama pada mesin yang berbeza, kerana kiraan dan jenis arahan bergantung pada perisian.
- CPI (Kitaran setiap arahan) Ia adalah songsang konsep IHP: berapa banyak kitaran yang diambil setiap arahan secara purata. CPI berbeza-beza bergantung pada jenis arahan dan microarchitecture. (contohnya, beban mungkin memerlukan lebih banyak kitaran daripada lompatan), jadi ia biasanya dikira sebagai purata wajaran mengikut kelas pengajaran.
- FLOPS (Operasi Titik Terapung Sesaat) mengukur pengiraan titik terapung, kritikal dalam HPC, AI dan sains. Perbezaan dibuat antara ketepatan tunggal (SP) dan ketepatan berganda (DP) dan kecekapan tenaga juga dirujuk sebagai FLOPS/W.. Adalah penting untuk membezakan antara FLOPS asli dan FLOPS ternormal. apabila membandingkan platform heterogen.
- Kekerapan (Hz) menandakan irama jam, tetapi tidak sinonim langsung dengan prestasi. Mitos MHz: Hari ini CPU frekuensi yang lebih rendah boleh mengatasi prestasi yang lebih pantas dengan selari, IPC yang lebih baik dan seni bina mikro yang lebih cekap. Di samping itu, kedalaman saluran paip dan logik kritikal menentukan frekuensi yang boleh dicapai..
Formula penting: masa pelaksanaan, throughput, IPC, CPI, IPS dan FLOPS
Sesetengah Formula penting untuk mengira/mengukur prestasi pemproses yang perlu anda ketahui ialah:
- Masa perlaksanaan: Cara standard untuk menyatakan ini ialah Masa = NI × CPI × T, di mana NI ialah bilangan arahan dalam program, IHP purata bilangan kitaran setiap arahan dan T tempoh jam (T = 1/frekuensi). Setara: Masa = (NI × CPI) / Kekerapan. Perkakasan dan pengkompil sering menyerang CPI dan kekerapan; NI bergantung kepada perisian..
- Prestasi adalah songsang masa: Prestasi = 1 / Masa. Menulis semula, Prestasi = (Kekerapan × CPI) / NI. Ini menjelaskan segi tiga komitmen: meningkatkan kekerapan dan CPI dan/atau menurunkan NI (algoritma yang lebih baik, penyusunan yang lebih baik) meningkatkan prestasi.
- Masa CPU pada sistem berbilang pemproses Ia dinyatakan dengan menambah masa benang atau menggunakan pengagregatan yang merenung pemproses P. Secara selari, bahagian yang sebenarnya boleh selari dan overhed penyelarasan mengehadkan faedah. (lihat Undang-undang Amdahl dan Gustafson di bawah).
- CPI berkesan untuk program tertentu ia diperoleh daripada bilangan purata sebenar bagi setiap kitaran yang diperhatikan semasa pelaksanaannya; untuk perbandingan, menggunakan penanda aras yang sama pada kedua-dua mesin supaya NI dan pencampuran arahan adalah setanding.
- CPI purata wajaran Ia biasanya dikira sebagai Σ (CPI_i × berat_i), di mana masing-masing CPI_i sepadan dengan kelas pengajaran dan berat_i ialah pecahan kelas itu dalam program. Paparan berasaskan kelas ini membolehkan anda melihat tempat untuk mengoptimumkan (cth., beban perlahan atau pembahagian yang mahal).
- IPS (Arahan sesaat) selalunya dianggarkan sebagai IPS ≈ Kekerapan × CPI. Berhati-hati dengan saluran paip, kebergantungan, ramalan dan pengosongan saluran: dalam amalan, Ledakan dan penalti boleh membawa anda jauh dari angka teori.
- BANJIR Dalam sistem mudah dianggarkan sebagai Kekerapan × operasi terapung setiap kitaran (bergantung pada lebar vektor dan unit FPU), dan selari dengan Jumlah FLOPS ≈ Σ FLOPS setiap pemproses. Bezanya jika anda bekerja di SP atau DP dan ingat perbezaan antara FLOPS asli dan normal.
Kebolehskalaan: Undang-undang Amdahl, Undang-undang Gustafson, kelajuan, kecekapan dan kecekapan
Formula penting lain untuk mengira prestasi komputer, kecekapan, dsb.:
- Undang-undang Amdahl memodelkan keuntungan daripada mempercepatkan sebahagian daripada sistem. Jika pecahan f masa tidak mendapat manfaat daripada peningkatan, kelajuan maksimum adalah dihadkan oleh 1/f. Selari, dengan pecahan selari p, had biasa dinyatakan sebagai S(N) = 1 / ((1 − p) + p/N). Memperbaiki kesesakan (mengurangkan bahagian urutan yang berkesan) adalah yang paling menguntungkan.
- Permohonan ke saluran paip: Pipelining mengurangkan latensi setiap arahan dalam keadaan mantap, tetapi Menggelembung, risiko data dan kegagalan ramalan Mereka menambah penalti itu hadkan kelajuan yang ideal. Mendalam saluran paip meningkatkan kekerapan tetapi juga penalti untuk mengosongkan..
- Undang-undang Gustafson mengambil pandangan yang berbeza: apabila masalah bertambah dengan bilangan pemproses, S(N) ≈ N − α (N − 1), di mana α menghampiri pecahan jujukan dengan menskalakan beban. Beliau menekankan bahawa pengagihan beban dan overhed menentukan kecekapan sebenar..
- Kecekapan ditakrifkan sebagai E = S(N) / N. Apabila N bertambah, E cenderung menurun melalui penyelarasan, ingatan bersama dan ketidakseimbangan. Kecekapan cari macam mana meningkatkan saiz masalah n perenggan kekalkan E tetap apabila p (pemproses) bertambah, menyerap overhed.
Memori, cache, lebar jalur dan storan: 50% lagi prestasi

Sebagai tambahan kepada pengiraan untuk pemprosesan, prestasi memori juga penting, formula yang paling penting ialah:
- Hierarki memori menentukan CPI: Akses cache mungkin memerlukan 1 kitaran, manakala akses RAM beratus kitaran. Kadar hit/gagal adalah penting seperti, atau lebih daripada, lebar jalur mentah dan kependaman.. Kadar pukulan yang lebih baik adalah sama lebih sedikit penalti dan kurang tenaga yang dibelanjakan untuk mengingati.
- Definisi utama: Kadar ketinggalan = bilangan kegagalan / jumlah bilangan akses y Kadar hit = bilangan hits / jumlah bilangan akses. Tingkatkan saiz arahan atau cache data dan tingkatkan lokaliti kod anda meningkatkan kadar hit dan mengurangkan CPI.
- DDR dan kekerapan berkesan: Kenangan DDR beraksi 2 pemindahan setiap kitaran daripada pengawal, itulah sebabnya DDR4-3200 bersamaan dengan 1600 MHz memclk. Jalur lebar teori mengikut modul dianggarkan sebagai memclk × 2 × bus_width (bit) × bilangan saluran, dan dinyatakan dalam bait/s (bahagi dengan 8). Contoh klasik DDR4-3200, bas 64-bit, Dual Channel: 1.600.000.000 × 2 × 64 × 2 = 409.600.000.000 bit/s ≈ 51,2 GB / s.
- Latensi putaran dalam HDD (apabila kepala sudah berada di landasan): dianggarkan sebagai Putaran 0,5 / (RPM/60). Untuk 7200 RPM: 0,5 / (7200/60) ≈ ms 4,16. Penampan cakera dan cache boleh menampung beberapa masa capaian, tetapi mereka tidak menghapuskan sifat mekanikal kelewatan.
- Permintaan memori dan pengkomputeran: Dalam beban HPC analisis dibuat daripada keamatan operasi (FLOP/bait), berkaitan Arahan titik terapung dan pergerakan data. Keamatan yang rendah mengkhianati had ingatan; yang tinggi, had pengiraan. Optimumkan reka letak dan akses berjujukan boleh menukar profil prestasi sepenuhnya.
Penggunaan dan kecekapan: TDP, kuasa dinamik dan alatan
Sebaliknya, kami juga mempunyai isu penggunaan dan kecekapan:
- TDP bukan penggunaan sebenar: ialah objektif terma/reka bentuk. Penggunaan berbeza dengan beban berkesan, voltan dan kekerapan. Di bawah beban ringan, Purata penggunaan sebenar biasanya jauh lebih rendah daripada TDP.
- Anggaran kuasa dinamik: P = C · V² · F. C ialah kapasitans tersuis, V voltan dan F kekerapan. Meningkatkan voltan menghukum secara kuadratik; maka overclocking dengan punca overvolt lompatan besar dalam penggunaan dan haba. Sebagai tambahan kepada bahagian dinamik, terdapat kebocoran yang tumbuh dengan suhu dan proses..