Feynmanas ir TSMC A16: žingsnis, kuris gali pakeisti žaidimą

Paskutiniai pakeitimai: rugsėjo 17 d. 2025 m.
Autorius: Izaokas
  • „Nvidia“ ruošia „Feynman“ technologiją TSMC A16 procesoriuje su GAA ir galiniu maitinimu, kad maksimaliai padidintų efektyvumą ir našumą.
  • „TSMC A16“ žada +8–10 % greitį arba −15–20 % sunaudojimą, palyginti su N2, ir didesnį tankį.
  • Plokštelių kaina >30.000 XNUMX USD ir pradinė pelningumo rizika, tačiau su dirbtinio intelekto maržomis, kurios daro ją perspektyvią.
  • Tvarkaraštis: gamyba 2 m. antrąjį pusmetį ir produktų pasirodymo laikotarpis nuo 2026 iki 2027 m., spaudžiant AMD ir „Intel“.

„Nvidia Feynman“ ir „TSMC A16“

Silicio ekosistema ruošiasi ciklo pokyčiams su galimu šuoliu. Nvidia į TSMC A16 dėl savo Feynmano architektūros. Visur aplink vartus veikiančios (GAA) ir atgalinio tiekimo derinys iškeltų šiuos GPU į priešakines pozicijas – tai evoliucija, kuria siekiama ne tik didesnio našumo, bet ir išspręsti maitinimo ir maršruto parinkimo kliūtys kurie jau dabar apkrauna didžiausias dirbtinio intelekto lustus.

Nors keli šaltiniai sutinka, kad TSMC A16 masinė gamyba prasidės... antroji pusė 2026 m, nėra vieningos nuomonės dėl produkto išleidimo datų: kai kuriose ataskaitose kalbama apie Feynmaną 2026 m., kitose – apie jo pasirodymą rinkoje 2027 m. ar net XNUMX m. 2028Šis laikotarpis kartu su abejonėmis, ar tai liks duomenų centruose, ar bus žengtas ir vartojimo slenksčio link, žymi naratyvą apie... ambicingas ir rizikingas statymas gerai apskaičiuotas.

TSMC A16: kas tai yra ir ką jis siūlo, palyginti su N2

TSMC A16 mazgas GPU

TSMC A16 yra klasės mazgas 1,6 nm kuris neapsiriboja proceso „sumažinimu“: jame pristatomi nanosluoksniniai tranzistoriai (GAA) ir pirmą kartą Taivano liejykloje – maitinimo tinklas plokštelės galinėje pusėje. Šis tinklas, viduje žinomas kaip Super galingas geležinkelis arba BSDPN (Backside Delivery Power Network) perkelia elektros linijas į galą, atlaisvindamas priekinį metalą signalams ir sumažindamas varžos nuostolius.

Skaičiais TSMC kalba apie 8–10 % greičio padidėjimas esant tokiai pačiai galiai arba, kita vertus, 15–20 % mažesnis suvartojimas tuo pačiu dažniu, tankiui padidėjus maždaug 7–10 % (≈1,10 karto). Kai kurie nutekėjimai šią idėją išplečia, nurodydami tokias inovacijas kaip NanoFlex/nanoskopas ir maršruto parinkimo optimizavimas, kuris palengvintų SoC ir ypač GPU su daugybe dirbtinio intelekto variklių ir dideliais talpyklos blokais mastelio keitimą.

Lemiamas privalumas slypi ne tik procentuose, bet ir jų leidžiamoje konstrukcijoje: atskiriant galią ir signalus, lusto priekinė dalis daug geriau „kvėpuoja“, o tai sumažina tarpinių tinklų perkrova ir tiekimo „IR kritimą“. Tai atveria duris agresyvesni duomenų pločiai, didesnes talpyklas ir daugiau dirbtiniam intelektui skirtos logikos, tačiau nepatiriant pernelyg didelio maršrutizavimo sudėtingumo.

Be to, nuvalant viršutinį metalą nuo ženklų, galima naudoti smulkiai surišantis hibridas priekiniame paviršiuje – tai esminis dalykas, jei norite sukrauti SRAM arba 3D talpyklą ir jei norite sumažinti „eismo spūstis“ aplink fizinius lustai HBM labai didelio tankio pakuotėse. Žinoma, visa tai reikalauja lygiagretaus tobulinimo terminiai ir metodologija sukurta taip, kad išnaudotų potencialą neperkaitindama ir neblogindama ilgalaikio našumo.

Galutiniam vartotojui vertimas gana paprastas: galingesni ir efektyvesni GPU, kurie gali geriau veikti žaidžiant ir kuriant turinį, o svarbiausia – geriau pritaikyti mastelį. Dirbtinio intelekto ir didelio našumo kompiuterinio skaičiavimo darbo krūviai nedidinant energijos suvartojimo. Šis efektyvumo padidėjimas yra ypač reikšmingas, kai kalbame apie greitintuvus, kurių TDP yra keli šimtai vatų, kur kiekvienas procentas svarbus.

  „Asus“ „GamesCom“ parodoje pristatė naujas „AM5“ pagrindines plokštes

Nuo Blackwello ir Rubino iki Feynmano: „Nvidia“ posūkis

„Nvidia“ planas Feynmano teorijai

Metų metus „Nvidia“ savo debiute vengė pažangiausių litografijos pavyzdžių, kad sutelktų dėmesį į... brandžios architektūros, mažos sąnaudos ir našumas vienam vatui. Bunkeris buvo pagamintas 4N, „Blackwell“ duomenų centrams remiasi 4NP, o „GeForce RTX 50“ serija taip pat pasirinko 4NP vietoj ankstyvojo N3. Su „Rubin“ planuojamas šuolis yra į N3 šeima (3N/3NP), o RTX 60 modeliai juda ta kryptimi.

Didelis pokytis ateina su Feynmanu: įvairūs šaltiniai rodo, kad „Nvidia“ ketina praleisti N2/N2P nusileisti tiesiai ant A16. Jei tai bus patvirtinta, tai bus pirmas kartas per ilgą laiką, kai bendrovė vadovaus „kraujuojančio krašto“ mazgui, o ne lauks, kol jis subręs. Šis sprendimas nėra užgaida, jis reaguoja į būtinybę: milžiniški dirbtinio intelekto GPU susidūrė su ribomis priekinis energijos tiekimas ir maršrutizavimas, o maitinimas iš galo pradeda tapti architektūriniu reikalavimu.

Kitas svarbus darinys yra „Apple“ vaidmuo. Tradiciškai „Apple“ paleido TSMC mazgus su savo „iPhone“ lustų rinkiniais – apimties „inkaru“, kuris garantavo tiekimo prioritetasŠia proga Taivano žiniasklaida, tokia kaip „Commercial Times“, „Nvidia“ įvardija kaip pirmąją „A16“ klientę – tai simbolinis pokytis, patvirtinantis, kad TSMC augimas vis labiau kyla iš... HPC ir dirbtinis intelektas ir ne tiek daug apie mobilųjį telefoną.

Jei Feynmanas pirmas pasieks A16, mes nagrinėsime pirmąjį komercinį lustą, kuris dideliu mastu sujungs GAA nanoskopas su TSMC galia iš išorės. Tai ne tik proceso etapas: tai priverstų konkurentus ir visą ekosistemą paspartinti įrankius, darbo eigas ir galios modeliai pritaikytas šiai maitinimo topologijai.

Kalbant apie datas, čia ir prasideda triukšmas: vieni kalba apie Feynmano GPU, kurie 2026 m. sutaps su A16 „rampa“, kiti, remdamiesi ankstesniais planais, Feynmaną priskiria 2028 ir jie apriboja 2026/2027 m. kaip mazgo industrializacijos langą. Pagrįstai manyti, kad net jei masinė gamyba prasidės 2 m. antrąjį pusmetį, galutiniai produktai galėtų būti pamatyti 2026 m. viduryje arba pabaigoje, o visiškas diegimas galėtų būti nukeltas į 2027 m., remiantis pakavimo sudėtingumas ir SKU mišinys.

Išlaidos, rizika ir konkurencinė aplinka: „Apple“, AMD ir „Intel“

Pažangių mazgų konkurencija

Mazgo paleidimas turi kainą. „Apple“ 2 nm plokštelių numatoma įsigyti maždaug 27.000–28.000 XNUMX USD, o A16 su savo galiniu elektros tinklu viršytų 30.000 XNUMX USD už vaflįN2P, kuris taip pat apima BSDPN, dėl didesnio sudėtingumo priartėtų prie šio skaičiaus. Be to, pradinė grąža yra mažesnė, todėl kiekvienas žingsnis tampa brangesnis. galiojantis lustas pirmose partijose.

Tačiau „Nvidia“ atveju kaina gali išaugti: dirbtinio intelekto greitintuvas parduodamas už dešimtis tūkstančių dolerių, o padidėjęs tankis ir efektyvumas gali kompensuoti papildomas išlaidas, jei užtikrinamas... našumo pranašumas Be to, buvimas „pagrindiniu klientu“ garantuoja prioritetinę prieigą ir dar labiau sustiprina aljansą su TSMC tuo metu, kai dirbtinio intelekto paklausa diktuoja sektoriaus tempą.

Konkurencija nerimsta: AMD paskelbė apie silicio pasiekimą N2 savo „EPYC Venice“ procesoriui ir sklando gandai apie „Zen 6“ su N2X variantais, o jo planas... Medūza (Zen 6) svarsto N2 ir N2P su atnaujinimu. Lygiagrečiai „Intel“ plečia 18 su savo galiniu maitinimo šaltiniu („PowerVia“) ir ruošiasi jį diegti, paminint „Panther Lake“ ir 18A-P. „Nvidia“ tiesioginis perėjimas prie A16 suteiktų jai, jei viskas klostysis gerai, mazgų „span“ prieš konkurentus 2 nm srityje didelę antrosios dešimtmečio pusės dalį, o tokie surinkėjai kaip ASUS pristato pažangius GPU profesionalioms komandoms.

  „BLUETTI“ keičia autonominio elektros tinklo įrengimą: „RVSolar 48V“, „Pioneer Na“ ir plonas atlošas

Rizika egzistuoja: A16 apima naujus terminius sprendimus, sudėtingą pakuotę su moderniausia HBM technologija ir EDA metodologija kad galinis tiekimas vis dar tinka. Iš pradžių derliui nustatyti gali prireikti konservatyvaus SKU segmentavimo, o išlaidos gali atsispindėti galutinėje kainoje. Tačiau „Nvidia“, regis, yra pasirengusi prisiimti šią žalą, kad sustiprintų savo vaidmenį kaip Dirbtinio intelekto nuoroda.

Vartotojui poveikis galėtų būti netiesioginis. Jei „Feynman“ pirmiausia sutelktų dėmesį į duomenų centrus, „GeForce“ rinka pirmiausia pamatytų daugiau. Rubinas N3 ir tikėtina, kad brendimo ciklas prieš vėlesnį maitinimą ir GAA patekimą į žaidimus. Vis dėlto daugelis architektūrinių ir programinės įrangos optimizavimų (pvz., DLSS tipo patobulinimai ir dirbtinio intelekto blokai) ir toliau pasiekia suvartojimas su tam tikru greičiu.

Techninės pasekmės: nuo galinio iškyšos iki 3D ir HBM

Maitinimas per galinę plokštę sutrumpina maitinimo kelią iki tranzistorių ir sumažina IR kritimą, kuris riboja dažnį ir stabilumą, ypač labai dideliuose lustuose. Atlaisvinus priekinį metalą, signalo nukreipimas yra mažiau apkrautas ir integravimas yra lengvesnis. plačios jungtys ir ambicingesnius funkcinius blokus, ne taip smarkiai sumažinant delsos greitį.

GPU atveju tai reiškia galimybę padidinti SM/branduolių plotį, pagerinti talpyklos hierarchiją ir pridėti daugiau Dirbtinio intelekto greitintuvai be specialių maitinimo metalinių sluoksnių sprogimo. Tai taip pat padidina HBM PHY integravimo laisvę, sumažindama įvesties / išvesties srities kliūtis, o tai yra labai svarbu kalbant apie HBM3E ir ateities kartas su didžiulis pralaidumas.

Kitas priekinio paviršiaus valymo šalutinis poveikis yra tas, kad hibridinis ryšys Plonasis metodas tampa praktiškesnis talpyklai arba sluoksniuotai SRAM atmintims, nes atminties hierarchijos yra arčiau branduolių ir taupoma energija prieigos metu. Tačiau tai padidina terminį sudėtingumą: reikia daugiau sluoksniuotų blokų ir didesnio tankio. šilumos modeliai ir pažangią išsklaidymą, siekiant išvengti „karštųjų taškų“.

Tie, kurie kuria šiuos lustus, turės atnaujinti bibliotekos srautus, projektavimo taisykles ir kūrimo strategijas. galios sritys Sukurta vidinės topologijos poreikiams. Elektroninės duomenų apdorojimo (EDA) įrankiai jau juda ta linkme, tačiau pirmieji, gaminantys didelius kiekius, įgyja pranašumą dėl metodologijų ir praktinės patirties, kurias sunku greitai nukopijuoti.

Duomenų centrams privalumai akivaizdūs: didesnis ilgalaikis našumas esant toms pačioms arba mažesnėms energijos sąnaudoms ir geresnis pagrindas daugiasluoksnėms architektūroms su logikos ir atminties lustais. Su A16 TSMC siekia tai įrodyti. galinis padavimas Antroje dešimtmečio pusėje intensyvių skaičiavimų plėtra yra ne tik perspektyvi, bet ir būtina.

Tik duomenų centrai ar ir žaidimai?

Didelis klausimas yra, ar Feynmanas išliks architektūros, orientuotos į Dirbtinis intelektas ir HPC arba jei jis turės „GeForce“ išvestines versijas vartotojams. Yra šaltinių, kurie rodo, kad iš pradžių daugiausia dėmesio bus skiriama duomenų centrams, o vėliau, kai mazgas bus labiau įsitvirtinęs, pereis prie vidaus rinkos, o tai atitinka... istorinė strategija „Nvidia“ noras plėsti technologijas nuo „duomenų centro pradžios“.

  „Intel Core Ultra 9 185H“ procesorius pasirodė „CPU-Z“ ir žada puikų našumą nešiojamuosiuose kompiuteriuose, mini kompiuteriuose ir daugiafunkciniuose kompiuteriuose.

Tuo tarpu viskas rodo, kad RTX 60 ir toliau remsis 3N/3NP, palaipsniui gerinant efektyvumą, dažnius ir dirbtinio intelekto galimybes. Tai logiška: norint pritaikyti GAA + galinį tiekimą žaidimų pramonei, reikia paruoštos tiekimo grandinės ir sąnaudų, kurios atitiktų numatomą pardavimo kainą. vartotojų kortelėsJei šuolis ir įvyks, jis gali įvykti šiek tiek vėliau nei profesionaliuose akceleratoriuose.

Tiems, kurie nori pirkti šiandien, protingiausia būtų sekti Rubino evoliuciją ir palyginti naujos kartos „GeForce“ našumą / energijos suvartojimą, remiantis... gidų pirkimas ir nepriklausomus testus. A16 poveikis vidaus rinkai bus juntamas, tačiau greičiausiai per etapinį diegimo ciklą ir turint tvirtą dirbtinio intelekto pagrindą.

Kalendorius ir ženklai, į kuriuos reikia atkreipti dėmesį

Kalendoriaus dalys dera tarpusavyje taip: TSMC planuoja pradėti masinę gamybą A16 2 m. antrąjį pusmetį, tad pirmieji komerciniai produktai vargu ar pasirodys anksčiau nei 2027 m. viduryje ar pabaigoje. Kai kuriuose veiksmų planuose ir ataskaitose Feynmanų šeima demonstruos savo raumenis 2028 m., o kituose nutekintuose šaltiniuose teigiama optimistiškiau. 2026 m. datosRealybė galėtų būti hibridinė: „ankstyvasis silicis“ 2026/27 m. ir platus diegimas 2028 m.

Lygiagrečiai matysime ir toliau AMD pažangą N2/N2P su „Venice“ ir „Zen 6“, o „Intel“ su „PowerVia“ ir jos ankstyvaisiais produktais siekė 18A. Svarbiausia bus tai, kas pasieks geriausią ilgalaikį našumą vienam vatui realiose dirbtinio intelekto apkrovose, kaip korpusas bręsta su HBM ir kas... išeiga iš vienos plokštelės gaukite kiekvieną mazgą masteliu.

Jei „Nvidia“ pristatys „A16“ su „Feynman“, tai nutrauks daugiau nei dešimtmetį trukusią tradiciją, kai „Apple“ atidarydavo kiekvieną procesą, ir DI bus pozicionuojama kaip demonstracinė priemonė. pažangiausia technologijaTai ne tik pavarų perjungimas: tai ženklas, kad silicio augimo varomoji jėga nebėra išmanieji telefonai, o spartesni skaičiavimai.

Be skaičių karo, lūžio taškas slypi architektūroje: užpakalinė galia Tai palengvina apribojimus, kurie stabdė didesnių GPU atsiradimą, o GAA sudaro sąlygas kitam mastelio keitimo etapui. Jei TSMC ir „Nvidia“ sėkmingai veiks, AMD, „Intel“ ir kitų kompanijų kartelė bus pakelta, o tai paskatins visą pramonę judėti sparčiau.

Dėl to susidaro labai konkurencinga situacija: pradžioje didelės išlaidos, aiški dirbtinio intelekto darbo krūvio nauda ir kiekviena įmonė turi erdvės žaisti savo kortomis mazgų, pakuočių ir optimizuota programinė įrangaKas geriausiai suderins šiuos tris elementus, laimės būsimuose produktų cikluose.

Atsižvelgiant į visa tai, kas išdėstyta aukščiau, nuotrauka yra patraukli: Feynmanas A16 gatvėje Tai ne tik pažadas dėl didesnio FPS ar TFLOPS skaičiaus, bet ir permąstymas, kaip maitinti ir mastelio keisti ekstremalius lustus; datos svyruoja nuo 2026 iki 2028 m., priklausomai nuo pasiekto etapo, DI srityje išlaidos yra didelės, bet valdomos, o konkurencija abiejose pusėse yra didelė su N2/N2P ir 18A; jei „Nvidia“ ir TSMC gerai suderins savo veiksmus proceso, pakavimo ir paklausos srityse, turėsime etaloną, kuris nulems tempą kitiems.

nvidia n1x
Susijęs straipsnis:
NVIDIA N1X: Tai revoliucinė ARM SoC su „Blackwell“ GPU, skirta nešiojamiesiems ir asmeniniams kompiuteriams