একটি CPU-এর কর্মক্ষমতা গণনা করার জন্য সমস্ত সূত্র এবং পদ্ধতি

সর্বশেষ আপডেট: 12 আগস্ট 2025
লেখক: ইসহাক
  • মূল সম্পর্ক: সময় = (NI × CPI)/f এবং কর্মক্ষমতা = (f × CPI)/NI, CPI/CPI কে মূল লিভার হিসেবে বিবেচনা করে।
  • প্রকৃত স্কেলেবিলিটি: আমডাহল এবং গুস্তাফসন গতি বৃদ্ধি সীমিত করে; ওভারহেড বৃদ্ধির সাথে সাথে দক্ষতা হ্রাস পায়।
  • মেমোরির নিয়ম: হিট/মিস, ডিডিআর এবং ব্যান্ডউইথ ফ্রিকোয়েন্সির মতোই সিপিআইকে প্রভাবিত করে।
  • WPA পদ্ধতি: গুরুত্বপূর্ণ পথ, থ্রেড (প্রস্তুত/চলমান/অপেক্ষা), DPC/ISR এবং অগ্রাধিকারগুলি বাধাগুলি ব্যাখ্যা করে।

সিপিইউ পারফরম্যান্স সূত্র

যখন আপনি একটি CPU-এর কর্মক্ষমতা গণনা করার জন্য সমস্ত সূত্র খুঁজছেন, তখন প্রেক্ষাপট এবং ব্যবহারিক ক্ষেত্রে সেগুলি ভালভাবে ব্যাখ্যা করা আদর্শ।, কেবল সমীকরণের একটি আলগা তালিকা নয়। এই নির্দেশিকাটি পেশাদার বিশ্লেষণের মেট্রিক্স, সূত্র, সূক্ষ্মতা এবং কৌশলগুলিকে স্পষ্ট এবং বিস্তৃতভাবে একত্রিত করে এবং পুনর্লিখন করে। (উইন্ডোজ পারফরম্যান্স অ্যানালাইজার ব্যবহার সহ) যা প্রায়শই বিভিন্ন উৎসে ছড়িয়ে ছিটিয়ে দেখা যায়।

এখানে আপনি ক্লাসিক ইউনিট (IPS, IPC, CPI এবং FLOPS) থেকে শুরু করে কার্যকর করার সময় এবং কর্মক্ষমতার মধ্যে সঠিক সম্পর্ক, Amdahl এবং Gustafson এর সূত্র, মেমরি এবং ব্যান্ডউইথ, এমনকি WPA এর সাথে থ্রেড ইন্টারফেরেন্স এবং DPC/ISR কীভাবে অধ্যয়ন করবেন তা সবকিছুই পাবেন।অতিরিক্তভাবে, এতে একটি CPU পাওয়ার খরচ (C·V²·F) গণনা, এটি পরিমাপের জন্য সরঞ্জাম এবং ব্যবহারিক দক্ষতা এবং কর্মক্ষমতা উন্নতির জন্য সুপারিশ অন্তর্ভুক্ত রয়েছে।

মৌলিক একক এবং মেট্রিক্স: আইপিএস, আইপিসি, সিপিআই, এফএলওপিএস এবং ফ্রিকোয়েন্সি

আসুস প্রাইম Z790-P

প্রথম জিনিসটি হল বিবেচনা করা উচিত যে আমরা কোন ইউনিটগুলি পরিচালনা করতে যাচ্ছি তা সবচেয়ে গুরুত্বপূর্ণ:

  • আইপিএস (প্রতি সেকেন্ডে নির্দেশাবলী) প্রসেসর এক সেকেন্ডে কতগুলি নির্দেশাবলী কার্যকর করে তা পরিমাপ করে (সাধারণত MIPS, লক্ষ লক্ষ IPS)। থ্রুপুট সম্পর্কে বিশ্বব্যাপী ধারণা পেতে এটি একটি কার্যকর মেট্রিক।, যদিও এটি নির্দেশনা জটিলতা বা মাইক্রোআর্কিটেকচারাল পার্থক্যগুলিকে ভালভাবে ধারণ করে না। ঐতিহাসিক এবং আধুনিক উদাহরণগুলি নকশা এবং যুগের মধ্যে ব্যবধান দেখায়, এবং ওভারক্লকিংয়ের সাথে এটি পরিবর্তিত হতে পারে।
  • আইপিসি (প্রতি চক্রের নির্দেশাবলী) প্রতি ঘড়ি চক্রে CPU গড়ে কতগুলি নির্দেশাবলী কার্যকর করে তা নির্দেশ করে। ফ্রিকোয়েন্সি নির্বিশেষে প্রতি চক্রের দক্ষতা বোঝা গুরুত্বপূর্ণ।. IPC তুলনা করার জন্য একই প্রোগ্রাম বা বেঞ্চমার্ক ব্যবহার করা প্রয়োজন বিভিন্ন মেশিনে, কারণ নির্দেশাবলীর সংখ্যা এবং ধরণ সফ্টওয়্যারের উপর নির্ভর করে।
  • সিপিআই (প্রতি নির্দেশের চক্র) এটি CPI-এর ধারণাগত বিপরীত: প্রতিটি নির্দেশ গড়ে কত চক্র নেয়?. নির্দেশের ধরণ এবং মাইক্রোআর্কিটেকচারের উপর নির্ভর করে সিপিআই পরিবর্তিত হয়। (উদাহরণস্বরূপ, একটি লোডের জন্য লাফের চেয়ে বেশি চক্রের প্রয়োজন হতে পারে), তাই এটি সাধারণত গণনা করা হয় নির্দেশিকা শ্রেণী অনুসারে ওজনযুক্ত গড়.
  • FLOPS (প্রতি সেকেন্ডে ভাসমান বিন্দুর ক্রিয়াকলাপ) এইচপিসি, এআই এবং বিজ্ঞানের ক্ষেত্রে গুরুত্বপূর্ণ ভাসমান-পয়েন্ট গণনার পরিমাণ নির্ধারণ করে। একক নির্ভুলতা (SP) এবং দ্বিগুণ নির্ভুলতা (DP) এর মধ্যে একটি পার্থক্য করা হয় এবং শক্তি দক্ষতাকে FLOPS/W হিসাবেও উল্লেখ করা হয়।. নেটিভ এফএলওপিএস এবং নরমালাইজড এফএলওপিএসের মধ্যে পার্থক্য করা গুরুত্বপূর্ণ। ভিন্ন ভিন্ন প্ল্যাটফর্মের তুলনা করার সময়।
  • ফ্রিকুয়েনসিয়া (Hz) ঘড়ির ছন্দ চিহ্নিত করে, কিন্তু কর্মক্ষমতার সাথে সরাসরি সমার্থক নয়. MHz এর মিথ: আজকাল একটি কম ফ্রিকোয়েন্সি CPU দ্রুততর CPU-কে ছাড়িয়ে যেতে পারে সমান্তরালতা, উন্নত আইপিসি এবং আরও দক্ষ মাইক্রোআর্কিটেকচার. এছাড়াও, পাইপলাইনের গভীরতা এবং সমালোচনামূলক যুক্তি অর্জনযোগ্য ফ্রিকোয়েন্সি নির্ধারণ করে।.
  ইন্টেল কোর i7-11800H এবং ইন্টেল কোর i7-12700H এর মধ্যে কি খুব বেশি পার্থক্য আছে?

প্রয়োজনীয় সূত্র: কার্যকর করার সময়, থ্রুপুট, আইপিসি, সিপিআই, আইপিএস এবং এফএলওপিএস

কিছু কর্মক্ষমতা গণনা/পরিমাপের জন্য প্রয়োজনীয় সূত্র আপনার জানা উচিত এমন প্রসেসরের তালিকা:

  • সঞ্চালনের সময়: এটি প্রকাশের একটি আদর্শ উপায় হল সময় = NI × CPI × T, কোথায় NI হল প্রোগ্রামের নির্দেশাবলীর সংখ্যা, সি পি আই প্রতি নির্দেশে চক্রের গড় সংখ্যা এবং T ঘড়ির সময়কাল (T = 1/ফ্রিকোয়েন্সি)। সমতুল্য: সময় = (NI × CPI) / ফ্রিকোয়েন্সি. হার্ডওয়্যার এবং কম্পাইলার প্রায়শই CPI এবং ফ্রিকোয়েন্সি আক্রমণ করে; NI সফ্টওয়্যারের উপর নির্ভর করে।.
  • অভিনয় সময়ের বিপরীত হল: কর্মক্ষমতা = ১ / সময়. পুনর্লিখন, কর্মক্ষমতা = (ফ্রিকোয়েন্সি × সিপিআই) / এনআই. এটি প্রতিশ্রুতির ত্রিভুজটি স্পষ্ট করে: ফ্রিকোয়েন্সি এবং সিপিআই বৃদ্ধি এবং/অথবা এনআই কম (আরও ভালো অ্যালগরিদম, আরও ভালো সংকলন) কর্মক্ষমতা বৃদ্ধি করে।
  • মাল্টি-প্রসেসর সিস্টেমে CPU সময় এটি থ্রেডের সময় যোগ করে বা বিবেচনা করে এমন সমষ্টি ব্যবহার করে প্রকাশ করা হয় পি প্রসেসর. সমান্তরালভাবে, প্রকৃতপক্ষে সমান্তরালযোগ্য অংশ এবং সমন্বয় ওভারহেড সুবিধা সীমিত করে। (নীচে আমডাহল এবং গুস্তাফসনের সূত্র দেখুন)।
  • কার্যকর সিপিআই একটি নির্দিষ্ট প্রোগ্রামের জন্য এটি থেকে প্রাপ্ত হয় প্রতি চক্রে পরিলক্ষিত নির্দেশাবলীর প্রকৃত গড় সংখ্যা এর বাস্তবায়নের সময়; তুলনার জন্য, একই মানদণ্ড ব্যবহার করে উভয় মেশিনেই যাতে NI এবং নির্দেশের মিশ্রণ তুলনামূলক হয়।
  • ওজনযুক্ত গড় সিপিআই এটি সাধারণত গণনা করা হয় Σ (সিপিআই_আই × ওজন_আই), যেখানে প্রতিটি সিপিআই_আই শিক্ষার একটি শ্রেণীর সাথে সঙ্গতিপূর্ণ এবং ওজন_আমি হল প্রোগ্রামের সেই শ্রেণীর ভগ্নাংশ। এই ক্লাস-ভিত্তিক ভিউ আপনাকে কোথায় অপ্টিমাইজ করতে হবে তা দেখতে দেয় (যেমন, ধীর লোড বা ব্যয়বহুল স্প্লিট).
  • আইপিএস (প্রতি সেকেন্ডে নির্দেশাবলী) প্রায়শই আনুমানিকভাবে বলা হয় আইপিএস ≈ ফ্রিকোয়েন্সি × সিপিআই. পাইপলাইন, নির্ভরতা, পূর্বাভাস এবং চ্যানেল খালি করার ক্ষেত্রে সতর্ক থাকুন: বাস্তবে, বিস্ফোরণ এবং জরিমানা আপনাকে তাত্ত্বিক চিত্র থেকে দূরে নিয়ে যেতে পারে.
  • ফ্লপস একটি সরল পদ্ধতিতে এটি অনুমান করা হয় প্রতি চক্রে ফ্রিকোয়েন্সি × ভাসমান ক্রিয়াকলাপ (ভেক্টর প্রস্থ এবং FPU ইউনিটের উপর নির্ভর করে), এবং সমান্তরালভাবে প্রতিটি প্রসেসরের মোট FLOPS ≈ Σ FLOPS. এসপি বা ডিপিতে কাজ করলে পার্থক্য এবং এর মধ্যে পার্থক্য মনে রাখবেন নেটিভ এবং নরমালাইজড এফএলওপিএস.
  AMD RX 6500 XT বনাম NVIDIA GTX 1650, কোন গ্রাফিক্স কার্ড কেনা উচিত?

স্কেলেবিলিটি: আমডাহলের সূত্র, গুস্তাফসনের সূত্র, গতি বৃদ্ধি, দক্ষতা এবং আইসোএফিশিয়েন্সি

কম্পিউটারের কর্মক্ষমতা, দক্ষতা ইত্যাদি গণনার জন্য অন্যান্য গুরুত্বপূর্ণ সূত্র:

  • আমডাহলের সূত্র সিস্টেমের একটি অংশের গতি বাড়ানোর ফলে লাভের মডেল তৈরি করে। যদি সময়ের একটি ভগ্নাংশ f উন্নতি থেকে উপকৃত না হয়, তাহলে সর্বোচ্চ গতি-বৃদ্ধি 1/f দ্বারা আবদ্ধ হয়. সমান্তরাল, সমান্তরাল ভগ্নাংশ p সহ, সাধারণ সীমাটি হিসাবে প্রকাশ করা হয় S(N) = 1 / ((1 − p) + p/N). বাধা উন্নত করা (কার্যকর ক্রমিক অংশ হ্রাস করা) হল সবচেয়ে বেশি অর্থ প্রদান করে.
  • পাইপলাইনে আবেদন: পাইপলাইনিং স্থির অবস্থায় প্রতি নির্দেশে বিলম্ব কমায়, কিন্তু বুদবুদ, ডেটা ঝুঁকি এবং ভবিষ্যদ্বাণী ব্যর্থতা তারা এমন শাস্তি যোগ করে যা আদর্শ গতিসীমা সীমিত করুন. পাইপলাইন গভীর করলে ফ্রিকোয়েন্সি বাড়ে কিন্তু খালি করার জন্য জরিমানাও হয়।.
  • গুস্তাফসনের সূত্র ভিন্ন দৃষ্টিভঙ্গি গ্রহণ করে: প্রসেসরের সংখ্যা বৃদ্ধির সাথে সাথে সমস্যাটি বৃদ্ধি পায়, S(N) ≈ N − α (N − 1), যেখানে α লোড স্কেল করে ক্রমিক ভগ্নাংশের আনুমানিক হিসাব করে। তিনি জোর দিয়ে বলেন যে লোড বিতরণ এবং ওভারহেড প্রকৃত দক্ষতা নির্ধারণ করে।.
  • দক্ষতা হিসাবে সংজ্ঞায়িত করা হয় ই = এস (এন) / এন. N বৃদ্ধি পেলে, E হ্রাস পেতে থাকে সমন্বয়, ভাগ করা স্মৃতি এবং ভারসাম্যহীনতার মাধ্যমে। আইসোএফিসিয়েন্সি কিভাবে খুঁজো সমস্যার আকার বৃদ্ধি করুন n জন্য p (প্রসেসর) বৃদ্ধির সাথে সাথে E ধ্রুবক রাখুন, ওভারহেড শোষণ করে।

মেমোরি, ক্যাশে, ব্যান্ডউইথ এবং স্টোরেজ: কর্মক্ষমতার বাকি ৫০%

DIMM-এর প্রকারভেদ

প্রক্রিয়াকরণের জন্য গণনার পাশাপাশি, মেমরির কর্মক্ষমতাও গুরুত্বপূর্ণ, যার জন্য সবচেয়ে গুরুত্বপূর্ণ সূত্রগুলি হল:

  • স্মৃতির শ্রেণিবিন্যাস সিপিআই নির্ধারণ করে: ক্যাশে অ্যাক্সেসের জন্য ১ সাইকেল খরচ হতে পারে, যখন RAM অ্যাক্সেসের জন্য শত শত চক্র. হিট/ফেইল রেটগুলি কাঁচা ব্যান্ডউইথ এবং ল্যাটেন্সির মতোই বা তার চেয়েও বেশি গুরুত্বপূর্ণ।. ভালো হিট-রেট সমান কম জরিমানা এবং স্মৃতিতে যাওয়ার জন্য কম শক্তি ব্যয় হয়.
  • মূল সংজ্ঞা: মিস রেট = ব্যর্থতার সংখ্যা / মোট অ্যাক্সেসের সংখ্যা y হিট রেট = হিটের সংখ্যা / মোট অ্যাক্সেসের সংখ্যা. নির্দেশনা বা ডেটা ক্যাশের আকার বাড়ান এবং আপনার কোডের স্থানীয়তা উন্নত করুন। হিট-রেট বৃদ্ধি করুন এবং সিপিআই কমান।
  • ডিডিআর এবং কার্যকর ফ্রিকোয়েন্সি: ডিডিআর স্মৃতিগুলি কাজ করে প্রতি চক্রে ২টি স্থানান্তর নিয়ন্ত্রকের, তাই DDR4-3200 হল 1600 MHz memclk এর সমতুল্য. তাত্ত্বিক ব্যান্ডউইথ মডিউল অনুসারে আনুমানিকভাবে memclk × 2 × বাস_প্রস্থ (বিট) × চ্যানেলের সংখ্যা, এবং বাইট/সেকেন্ডে প্রকাশ করা হয় (8 দিয়ে ভাগ করুন)। DDR4-3200, 64-বিট বাস, ডুয়াল চ্যানেলের ক্লাসিক উদাহরণ: ১,৬০০,০০০,০০০ × ২ × ৬৪ × ২ = ৪০৯,৬০০,০০০,০০০ বিট/সেকেন্ড ≈ 51,2 GB / গুলি.
  • HDD-তে ঘূর্ণনশীল ল্যাটেন্সি (যখন মাথাটি ইতিমধ্যেই ট্র্যাকে থাকে): এটি অনুমান করা হয় ০.৫ ঘূর্ণন / (RPM/0,5). ৭২০০ আরপিএমের জন্য: ০.৫ / (৭২০০/৬০) ≈ 4,16 এমএস. ডিস্ক বাফার এবং ক্যাশে অ্যাক্সেসের সময় কিছুটা কমিয়ে আনতে পারে, কিন্তু তারা বিলম্বের যান্ত্রিক প্রকৃতি বাদ দেয় না।
  • মেমোরি এবং কম্পিউটিং চাহিদা: HPC লোডে বিশ্লেষণটি তৈরি করা হয় অপারেটিং তীব্রতা (FLOP/বাইট), সম্পর্কিত ভাসমান বিন্দু নির্দেশাবলী এবং তথ্য চলাচল. কম তীব্রতা বিশ্বাসঘাতকতা করে স্মৃতি সীমাবদ্ধতা; একটি উচ্চ, গণনাগত সীমাবদ্ধতা. লেআউট এবং ক্রমিক অ্যাক্সেস অপ্টিমাইজ করুন পারফরম্যান্স প্রোফাইল সম্পূর্ণরূপে পরিবর্তন করতে পারে।
সম্পর্কিত নিবন্ধ:
সবচেয়ে নির্ভরযোগ্য CPU এবং GPU বেঞ্চমার্ক

খরচ এবং দক্ষতা: টিডিপি, গতিশীল শক্তি এবং সরঞ্জাম

অন্যদিকে, আমাদের খরচ এবং দক্ষতার সমস্যাও রয়েছে:

  • টিডিপি প্রকৃত খরচ নয়: তাপীয়/নকশা উদ্দেশ্য। কার্যকর লোড, ভোল্টেজ এবং ফ্রিকোয়েন্সি অনুসারে খরচ পরিবর্তিত হয়হালকা বোঝার নিচে, প্রকৃত গড় খরচ সাধারণত টিডিপির তুলনায় অনেক কম হয়।.
  • আনুমানিক গতিশীল শক্তি: P = C · V² · F. C সুইচড ক্যাপাসিট্যান্স হল, V ভোল্টেজ এবং F ফ্রিকোয়েন্সি। ভোল্টেজ বৃদ্ধি দ্বিঘাতভাবে দণ্ডিত করে; অতএব ওভারভোল্টের সাথে ওভারক্লকিং এর কারণ খরচ এবং তাপের বড় উল্লম্ফন. গতিশীল অংশ ছাড়াও, তাপমাত্রা এবং প্রক্রিয়ার সাথে সাথে লিকেজ বৃদ্ধি পায়।.
ইন্টেল কোর আল্ট্রা 9 185H
সম্পর্কিত নিবন্ধ:
ইন্টেল কোর আল্ট্রা ৯ ১৮৫এইচ সিপিইউ-জেড-এ প্রদর্শিত হচ্ছে এবং ল্যাপটপ, মিনি পিসি এবং এআইও-তে অসাধারণ পারফরম্যান্সের প্রতিশ্রুতি দিচ্ছে