כל הנוסחאות והשיטות לחישוב ביצועי המעבד

העדכון אחרון: 12 אוגוסט 2025
מחבר: יצחק
  • קשר ליבה: זמן = (NI × CPI)/f וביצועים = (f × CPI)/NI, כאשר מדד המחירים לצרכן/מדד המחירים לצרכן הם מנופים מרכזיים.
  • מדרגיות אמיתית: אמדאהל וגוסטפסון מגבילים את המהירות; היעילות פוחתת ככל שהתקורה עולה.
  • כללי זיכרון: התאמה/החמצה, DDR ורוחב פס משפיעים על מדד המחירים לצרכן באותה מידה כמו התדירות.
  • שיטת WPA: נתיב קריטי, הליכים (מוכן/פועל/ממתין), DPC/ISR וסדרי עדיפויות מסבירים צווארי בקבוק.

נוסחאות ביצועי מעבד

כאשר אתם מחפשים את כל הנוסחאות לחישוב ביצועי המעבד, מומלץ שיהיו מוסברות היטב, עם הקשר ומקרים מעשיים., לא סתם רשימה רופפת של משוואות. מדריך זה מאגד וכותב מחדש בצורה ברורה ומקיפה את המדדים, הנוסחאות, הניואנסים והטכניקות של ניתוח מקצועי. (כולל השימוש ב-Windows Performance Analyzer) שלעתים קרובות מופיעים מפוזרים במקורות רבים.

כאן תמצאו הכל, החל מהיחידות הקלאסיות (IPS, IPC, CPI ו-FLOPS) ועד לקשר המדויק בין זמן ביצוע לביצועים, חוקי אמדאהל וגוסטפסון, זיכרון ורוחב פס, ואפילו כיצד לחקור הפרעות נימים ו-DPC/ISR עם WPA.בנוסף, הוא כולל חישוב צריכת חשמל של המעבד (C·V²·F), כלים למדידתה והמלצות לשיפורים מעשיים ביעילות ובביצועים.

יחידות ומדדים בסיסיות: IPS, IPC, CPI, FLOPS ותדירות

ASUS פריים Z790-P

הדבר הראשון הוא לקחת בחשבון אילו יחידות הן החיוניות ביותר שאנו הולכים לטפל בהן:

  • IPS (הוראות לשנייה) מודד כמה הוראות המעבד מבצע בשנייה אחת (בדרך כלל MIPS, מיליוני IPS). זהו מדד שימושי כדי לקבל מושג כללי על התפוקה, למרות שהוא אינו לוכד היטב את מורכבות ההוראה או את ההבדלים במיקרו-ארכיטקטורה. דוגמאות היסטוריות ומודרניות מראות את הפער בין עיצובים ותקופות, ועם אוברקלוקינג זה יכול להשתנות.
  • IPC (הוראות לכל מחזור) מציין כמה הוראות המעבד מבצע בממוצע בכל מחזור שעון. חשוב להבין את היעילות לכל מחזור ללא קשר לתדירות. השוואת IPC דורשת שימוש באותה תוכנית או מדד ביצועים במכונות שונות, מכיוון שספירת וסוג ההוראות תלויים בתוכנה.
  • מדד המחירים לצרכן (CPI) (מחזורים להוראה) זהו ההיפך הקונספטואלי של מדד המחירים לצרכן: כמה מחזורים לוקחת כל הוראה בממוצע. מדד המחירים לצרכן (CPI) משתנה בהתאם לסוג ההוראה ולמיקרו-ארכיטקטורה. (לדוגמה, עומס עשוי לדרוש יותר מחזורים מקפיצה), ולכן הוא מחושב בדרך כלל כ ממוצע משוקלל לפי שיעורי הוראה.
  • FLOPS (פעולות נקודה צפה לשנייה) מכמת חישוב נקודה צפה, קריטי ב-HPC, בינה מלאכותית ומדע. מבחינים בין דיוק יחיד (SP) לדיוק כפול (DP) ויעילות אנרגטית מכונה גם FLOPS/W.. חשוב להבדיל בין FLOPS מקוריים ל-FLOPS מנורמלים. כאשר משווים פלטפורמות הטרוגניות.
  • תדר (הרץ) מסמן את קצב השעון, אבל אינו שם נרדף ישירות לביצועים. המיתוס של ה-MHzכיום מעבד בתדר נמוך יותר יכול להצליח יותר ממעבד מהיר יותר. מקביליות, IPC טוב יותר ומיקרו-ארכיטקטורות יעילות יותר. בנוסף, עומק הצינור והלוגיקה הקריטית קובעים את התדירות שניתן להשיג..
  MediaTek Dimensity 8300: ניתוח מעמיק של כל סודות הארכיטקטורה שלו

נוסחאות חיוניות: זמן ביצוע, תפוקה, IPC, CPI, IPS ו-FLOPS

כמה נוסחאות חיוניות לחישוב/מדידת ביצועים של מעבד שכדאי לכם להכיר הם:

  • זמן ביצועדרך סטנדרטית לבטא זאת היא זמן = NI × CPI × T, איפה NI הוא מספר ההוראות בתוכנית, מדד המחירים לצרכן מספר המחזורים הממוצע להוראה ו T מחזור השעון (T = 1/תדירות). שווה ערך: זמן = (NI × CPI) / תדירות. חומרה ומהדר תוקפים לעתים קרובות את מדד המחירים לצרכן ואת התדירות; NI תלוי בתוכנה..
  • הצגה הוא ההפך של הזמן: ביצועים = 1 / זמןכתיבה מחדש, ביצועים = (תדירות × מדד המחירים לצרכן) / NI. זה מבהיר את משולש ההתחייבויות: הגדלת התדירות ומדד המחירים לצרכן ו/או הורדת ה-NI (אלגוריתם טוב יותר, קומפילציה טובה יותר) משפר את הביצועים.
  • זמן מעבד במערכות מרובות מעבדים זה בא לידי ביטוי על ידי הוספת זמני שרשור או שימוש בצבירה ששוקלת מעבדי P. במקביל, החלק שניתן להקביל בפועל ותקורת התיאום מגבילים את התועלת. (ראה חוקי אמדאהל וחוקי גוסטפסון להלן).
  • מדד המחירים לצרכן האפקטיבי עבור תוכנית ספציפית הוא מתקבל מ מספר ממוצע בפועל של הוראות למחזור שנצפה במהלך ביצועו; לצורך השוואות, משתמש באותו מדד בשתי המכונות כך ש-NI וערבוב ההוראות יהיו דומים.
  • מדד המחירים לצרכן הממוצע המשוקלל זה בדרך כלל מחושב כ Σ (מדד המחירים לצרכן × משקל_i), שבו כל אחד מדד המחירים לצרכן מתאים לשיעור הוראה ו משקל_i הוא השבר של אותה מחלקה בתוכנית. תצוגה מבוססת-מחלקה זו מאפשרת לך לראות היכן לבצע אופטימיזציה (למשל, טעינות איטיות או פיצולים יקרים).
  • IPS (הוראות לשנייה) לעיתים קרובות מקורב כ שב"ס ≈ תדר × מדד המחירים לצרכן. היזהרו עם צינורות, תלויות, חיזוי וריקון ערוציםבפועל, התפרצויות ועונשים יכולים להרחיק אותך מהנתון התיאורטי.
  • פלופים במערכת פשוטה זה מוערך כ תדירות × פעולות צפות למחזור (בהתאם לרוחב הווקטור וליחידות ה-FPU), ובמקביל כ סך כל ה-FLOPS ≈ Σ FLOPS של כל מעבד. ההבדל אם אתה עובד ב-SP או DP ולזכור את ההבדל בין FLOPS מקוריים ומנורמלים.
  DPU עבור HPC: מה זה, למה זה משמש, וכיצד זה משנה את מרכז הנתונים שלך

מדרגיות: חוק אמדאהל, חוק גוסטפסון, מהירות, יעילות ואיזו-יעילות

נוסחאות חשובות נוספות לחישוב ביצועי המחשב, יעילות וכו':

  • חוק אמדאהל מדמה את הרווח מהאצת חלק מהמערכת. אם חלק f מהזמן אינו מרוויח מהשיפור, העלייה המרבית בהאצה מוגבלת על ידי 1/f. במקביל, עם שבר p הניתן להקבלה, הגבול הטיפוסי מבוטא כ S(N) = 1 / ((1 − p) + p/N). שיפור צוואר הבקבוק (הפחתת החלק הרציף האפקטיבי) הוא מה שמשתלם ביותר..
  • יישום לצינור: עיבוד צינורות מפחית השהיות להוראה במצב יציב, אבל בועות, סיכוני נתונים וכשלים בחיזוי הם מוסיפים עונשים ש להגביל את המהירות האידיאלית. העמקת הצינור מגבירה את התדירות אך גם את העונשים על ריקון..
  • חוק גוסטפסון נוקט בגישה שונה: ככל שהבעיה גדלה עם מספר המעבדים, S(N) ≈ N − α (N − 1), כאשר α קירוב את השבר הסדרתי על ידי קנה המידה של העומס. הוא מדגיש כי חלוקת העומס והתקורה קובעים את היעילות האמיתית..
  • יעיל מוגדר כ E = S(N) / N. ככל ש-N עולה, E נוטה לרדת על ידי קואורדינציה, זיכרון משותף וחוסר איזון. איזו-יעילות חפשו איך להגדיל את גודל הבעיה n סעיף שמור על E קבוע ככל ש-p (מעבדים) עולה, סופג את הוצאות התקורה.

זיכרון, מטמונים, רוחב פס ואחסון: 50% הנותרים של ביצועים

סוגי DIMM

בנוסף לחישובים לעיבוד, גם ביצועי הזיכרון חשובים, כאשר הנוסחאות החשובות ביותר עבורם הן:

  • היררכיית הזיכרון קובעת את מדד המחירים לצרכןגישה למטמון עשויה לעלות מחזור אחד, בעוד שגישה לזיכרון RAM מאות מחזורים. שיעורי פגיעה/כישלון חשובים באותה מידה, או יותר, מרוחב פס גולמי ומהשהייה.שיעור פגיעה טוב יותר שווה פחות עונשים ופחות אנרגיה המושקעת בזיכרון.
  • הגדרות מפתח: שיעור החמצות = מספר כשלים / מספר כולל של גישות y שיעור פגיעה = מספר פגיעה / מספר כולל של כניסות. הגדל את גודל ההוראה או מטמון הנתונים ושפר את המיקום של הקוד שלך להגדיל את שיעור ההצלחה ולהפחית את מדד המחירים לצרכן.
  • DDR ותדר אפקטיביזיכרונות DDR מבצעים 2 העברות בכל מחזור של הבקר, זו הסיבה DDR4-3200 שווה ערך ל-1600 מגה-הרץ של memclk. רוחב פס תיאורטי לפי מודול משוער כ- memclk × 2 × bus_width (bits) × מספר ערוצים, ומבוטא ב-bייט/שנייה (מחלק ב-8). דוגמה קלאסית של DDR4-3200, אפיק 64 סיביות, ערוץ כפול: 1.600.000.000 × 2 × 64 × 2 = 409.600.000.000 סיביות/שנייה ≈ 51,2 GB / s.
  • השהיית סיבוב בכונן קשיח (כאשר הראש כבר על המסילה): זה מוערך כ 0,5 סיבובים / (סל"ד/60). עבור 7200 סל"ד: 0,5 / (7200/60) ≈ 4,16 ms. מאגרי דיסק ומטמון יכולים לרכך חלק מזמן הגישה, אך הם אינם מבטלים את האופי המכני של העיכוב.
  • דרישת זיכרון ומחשובבעומסי HPC הניתוח נעשה על ידי עוצמת פעולה (FLOP/בייט), הקשור הוראות נקודה צפה ותנועת נתונים. עוצמה נמוכה בוגד מגבלת זיכרון; אחד גבוה, מגבלה חישובית. אופטימיזציה של פריסות וגישה סדרתית יכול לשנות לחלוטין את פרופיל הביצועים.
Artaculo relacionado:
מדדי המעבד וה-GPU האמינים ביותר

צריכה ויעילות: TDP, כוח דינמי וכלים

מצד שני, יש לנו גם את בעיות הצריכה והיעילות:

  • TDP אינו צריכה בפועל: היא מטרה תרמית/עיצובית. הצריכה משתנה בהתאם לעומס האפקטיבי, למתח ולתדרתחת עומסים קלים, הצריכה הממוצעת בפועל בדרך כלל נמוכה בהרבה מה-TDP.
  • הספק דינמי משוער: P = C · V² · F. C הוא הקיבול הממותג, V המתח ו F התדירות. הגדלת המתח מענישה באופן ריבועי; ולכן אוברקלוקינג עם מתח יתר גורם קפיצות גדולות בצריכה ובחום. בנוסף לחלק הדינמי, ישנן דליפות שגדלות עם הטמפרטורה והתהליך..
Intel Core Ultra 9 185H
Artaculo relacionado:
Intel Core Ultra 9 185H מופיע על גבי CPU-Z ומבטיח ביצועים יוצאי דופן במחשבים ניידים, מיני-PC ו-AIOs