Semua rumus dan metode untuk menghitung kinerja CPU

Pembaharuan Terakhir: 12 Agustus 2025
penulis: Isaac
  • Hubungan inti: Waktu = (NI × CPI)/f dan Kinerja = (f × CPI)/NI, dengan CPI/CPI sebagai pengungkit utama.
  • Skalabilitas sejati: Amdahl dan Gustafson membatasi percepatan; efisiensi menurun seiring meningkatnya overhead.
  • Aturan memori: hit/miss, DDR dan bandwidth memengaruhi CPI sebanyak frekuensi.
  • Metode WPA: jalur kritis, untaian (Siap/Berjalan/Menunggu), DPC/ISR dan prioritas menjelaskan kemacetan.

Rumus Kinerja CPU

Saat Anda mencari semua rumus untuk menghitung kinerja CPU, alangkah idealnya jika rumus tersebut dijelaskan dengan baik, disertai konteks dan kasus praktis., bukan sekadar daftar persamaan yang longgar. Panduan ini menyatukan dan menulis ulang dengan cara yang jelas dan komprehensif metrik, rumus, nuansa, dan teknik analisis profesional. (termasuk penggunaan Windows Performance Analyzer) yang sering muncul tersebar di banyak sumber.

Di sini Anda akan menemukan semuanya mulai dari unit klasik (IPS, IPC, CPI, dan FLOPS) hingga hubungan yang tepat antara waktu eksekusi dan kinerja, hukum Amdahl dan Gustafson, memori dan bandwidth, dan bahkan cara mempelajari interferensi thread dan DPC/ISR dengan WPA.Selain itu, disertakan pula perhitungan konsumsi daya CPU (C·V²·F), alat untuk mengukurnya, serta rekomendasi untuk efisiensi praktis dan peningkatan kinerja.

Unit dan metrik dasar: IPS, IPC, CPI, FLOPS, dan frekuensi

ASUS Prime Z790-P

Hal pertama yang harus diperhatikan adalah unit mana saja yang paling penting yang akan kita tangani:

  • IPS (Instruksi per detik) mengukur berapa banyak instruksi yang dieksekusi prosesor dalam satu detik (biasanya MIPS, jutaan IPS). Ini adalah metrik yang berguna untuk mendapatkan gambaran global tentang throughput, meskipun tidak menangkap kompleksitas instruksi atau perbedaan mikroarsitektur dengan baik. Contoh historis dan modern menunjukkan kesenjangan antara desain dan era, dan dengan overclocking dapat bervariasi.
  • IPC (Instruksi per siklus) Menunjukkan berapa banyak instruksi yang dieksekusi CPU rata-rata per siklus jam. Penting untuk memahami efisiensi per siklus terlepas dari frekuensinya. Membandingkan IPC memerlukan penggunaan program atau benchmark yang sama pada mesin yang berbeda, karena jumlah dan jenis instruksi bergantung pada perangkat lunak.
  • CPI (Siklus per instruksi) Ini adalah kebalikan konseptual dari CPI: berapa banyak siklus yang dibutuhkan setiap instruksi rata-rata. CPI bervariasi bergantung pada jenis instruksi dan mikroarsitektur. (misalnya, beban mungkin memerlukan lebih banyak siklus daripada lompatan), jadi biasanya dihitung sebagai rata-rata tertimbang berdasarkan kelas instruksi.
  • FLOPS (Operasi Titik Mengambang Per Detik) mengukur komputasi titik-mengambang, yang penting dalam HPC, AI, dan sains. Perbedaan dibuat antara presisi tunggal (SP) dan presisi ganda (DP) dan efisiensi energi juga disebut sebagai FLOPS/W.. Penting untuk membedakan antara FLOPS asli dan FLOPS yang dinormalisasi. saat membandingkan platform heterogen.
  • Frekuensi (Hz) menandai ritme jam, tapi tidak secara langsung identik dengan kinerja. Mitos MHz:Saat ini CPU dengan frekuensi rendah dapat mengungguli CPU yang lebih cepat dengan paralelisme, IPC yang lebih baik dan mikroarsitektur yang lebih efisien. Selain itu, kedalaman pipa dan logika kritis menentukan frekuensi yang dapat dicapai..
  Snapdragon 7+ Gen 2 vs. Snapdragon 8+ Gen 1: Perbandingan

Rumus penting: waktu eksekusi, throughput, IPC, CPI, IPS, dan FLOPS

Beberapa Rumus penting untuk menghitung/mengukur kinerja dari prosesor yang harus Anda ketahui adalah:

  • Waktu eksekusi:Cara standar untuk mengungkapkan hal ini adalah Waktu = NI × CPI × TDimana NI adalah jumlah instruksi dalam program, CPI rata-rata jumlah siklus per instruksi dan T periode jam (T = 1/frekuensi). Setara: Waktu = (NI × CPI) / Frekuensi. Perangkat keras dan kompiler sering menyerang CPI dan frekuensi; NI bergantung pada perangkat lunak..
  • Prestasi adalah kebalikan dari waktu: Kinerja = 1 / WaktuMenulis ulang, Kinerja = (Frekuensi × CPI) / NI. Hal ini memperjelas segitiga komitmen: meningkatkan frekuensi dan CPI dan/atau menurunkan NI (algoritma yang lebih baik, kompilasi yang lebih baik) meningkatkan kinerja.
  • Waktu CPU pada sistem multiprosesor Hal ini diungkapkan dengan menambahkan waktu utas atau menggunakan agregasi yang mempertimbangkan Prosesor P. Secara paralel, bagian yang sebenarnya dapat diparalelkan dan overhead koordinasi membatasi manfaatnya. (lihat Hukum Amdahl dan Gustafson di bawah).
  • CPI yang efektif untuk program tertentu diperoleh dari jumlah rata-rata aktual instruksi per siklus yang diamati selama pelaksanaannya; untuk perbandingan, menggunakan tolok ukur yang sama pada kedua mesin sehingga NI dan pencampuran instruksi sebanding.
  • Rata-rata tertimbang CPI Biasanya dihitung sebagai Σ (CPI_i × bobot_i), dimana masing-masing CPI_i sesuai dengan kelas instruksi dan berat_i adalah fraksi kelas tersebut dalam program. Tampilan berbasis kelas ini memungkinkan Anda melihat bagian mana yang perlu dioptimalkan (misalnya, pemuatan lambat atau pemisahan mahal).
  • IPS (Instruksi per detik) sering didekati sebagai IPS ≈ Frekuensi × CPI. Hati-hati dengan pipeline, dependensi, prediksi, dan pengosongan saluran:dalam praktiknya, Ledakan dan penalti dapat menjauhkan Anda dari angka teoritis.
  • TERJADI Dalam sistem sederhana diperkirakan sebagai Frekuensi × operasi mengambang per siklus (tergantung pada lebar vektor dan unit FPU), dan secara paralel sebagai Total FLOPS ≈ Σ FLOPS dari setiap prosesor. Perbedaan jika Anda bekerja di SP atau DP dan ingat perbedaan antara FLOPS asli dan ternormalisasi.
  RTX 7900 XTX vs. RTX 4090: Mana yang lebih bertenaga?

Skalabilitas: Hukum Amdahl, Hukum Gustafson, percepatan, efisiensi dan isoefisiensi

Rumus penting lainnya untuk menghitung kinerja komputer, efisiensi, dll.:

  • Hukum Amdahl memodelkan keuntungan dari percepatan bagian sistem. Jika sebagian waktu f tidak mendapatkan manfaat dari peningkatan, percepatan maksimum dibatasi oleh 1/f. Secara paralel, dengan fraksi p yang dapat diparalelkan, batas tipikal dinyatakan sebagai S(N) = 1 / ((1 − p) + p/N). Memperbaiki kemacetan (mengurangi bagian sekuensial yang efektif) adalah cara yang paling menguntungkan.
  • Aplikasi pada pipa:Pipelining mengurangi latensi per instruksi dalam kondisi stabil, tetapi Gelembung, risiko data, dan kegagalan prediksi Mereka menambahkan hukuman yang batasi percepatan ideal. Pendalaman pipa akan meningkatkan frekuensi tetapi juga penalti untuk pengosongan..
  • Hukum Gustafson mengambil pandangan yang berbeda: seiring bertambahnya jumlah prosesor, S(N) ≈ N − α (N − 1), di mana α memperkirakan fraksi berurutan dengan menskalakan beban. Ia menekankan bahwa distribusi beban dan overhead menentukan efisiensi nyata..
  • Efisiensi didefinisikan sebagai E = S(N) / N. Ketika N meningkat, E cenderung menurun melalui koordinasi, memori bersama, dan ketidakseimbangan. Isoefisiensi mencari bagaimana meningkatkan ukuran masalah n ayat pertahankan E konstan saat p (prosesor) meningkat, menyerap biaya overhead.

Memori, cache, bandwidth, dan penyimpanan: 50% kinerja lainnya

Jenis DIMM

Selain perhitungan untuk pemrosesan, kinerja memori juga penting, rumus terpentingnya adalah:

  • Hirarki memori menentukan CPI: Akses cache mungkin memerlukan 1 siklus, sedangkan akses RAM ratusan siklus. Rasio berhasil/gagal sama pentingnya atau bahkan lebih penting daripada bandwidth dan latensi mentah.Tingkat hit yang lebih baik sama dengan lebih sedikit penalti dan lebih sedikit energi yang dihabiskan untuk mengingat.
  • Definisi utama: Tingkat kesalahan = jumlah kegagalan / jumlah total akses y Tingkat hit = jumlah hit / jumlah total akses. Tingkatkan ukuran cache instruksi atau data dan tingkatkan lokalitas kode Anda meningkatkan rasio hit dan mengurangi CPI.
  • DDR dan frekuensi efektif: Memori DDR bekerja 2 transfer per siklus dari pengontrol, itulah sebabnya DDR4-3200 setara dengan 1600 MHz memclk. Bandwidth teoritis dengan modul diperkirakan sebagai memclk × 2 × bus_width (bit) × jumlah saluran, dan dinyatakan dalam byte/s (dibagi dengan 8). Contoh klasik DDR4-3200, bus 64-bit, Saluran Ganda: 1.600.000.000 × 2 × 64 × 2 = 409.600.000.000 bit/detik ≈ 51,2 GB / s.
  • Latensi rotasi di HDD (ketika kepala sudah berada di lintasan): diperkirakan sebagai 0,5 rotasi / (RPM/60). Untuk 7200 RPM: 0,5 / (7200/60) ≈ 4,16 ms. Buffer dan cache disk dapat mengurangi sebagian waktu akses, tetapi tidak menghilangkan sifat mekanis dari penundaan.
  • Permintaan memori dan komputasi:Pada beban HPC analisisnya dilakukan dengan intensitas operasi (FLOP/byte), berhubungan Instruksi titik mengambang dan pergerakan data. Intensitas rendah mengkhianati keterbatasan memori; yang tinggi, keterbatasan komputasi. Optimalkan tata letak dan akses berurutan dapat mengubah profil kinerja sepenuhnya.
Artikel terkait:
Benchmark CPU dan GPU yang paling andal

Konsumsi dan efisiensi: TDP, daya dinamis, dan alat

Di sisi lain, kita juga memiliki masalah konsumsi dan efisiensi:

  • TDP bukan konsumsi aktual: adalah tujuan termal/desain. Konsumsi bervariasi dengan beban efektif, tegangan dan frekuensi. Pada beban ringan, Konsumsi rata-rata sebenarnya biasanya jauh lebih rendah daripada TDP.
  • Perkiraan daya dinamis: P = C · V² · F. C adalah kapasitansi yang diaktifkan, V tegangan dan F frekuensi. Peningkatan tegangan memberikan penalti secara kuadrat; oleh karena itu overclocking dengan tegangan lebih menyebabkan lonjakan besar dalam konsumsi dan panas. Selain bagian yang dinamis, ada kebocoran yang bertambah seiring dengan naiknya suhu dan proses..
Intel Core Ultra 9 185 jam
Artikel terkait:
Intel Core Ultra 9 185H muncul di CPU-Z dan menjanjikan kinerja luar biasa di laptop, mini PC, dan AIO