Feynman och TSMC A16: Flytten som kan förändra spelet

Senaste uppdateringen: 17 de Septiembre de 2025
Författare: Isaac
  • Nvidia förbereder Feynman på TSMC A16 med GAA och bakmatning för att maximera effektivitet och prestanda.
  • TSMC A16 lovar +8–10% hastighet eller −15–20% förbrukning jämfört med N2 och högre densitet.
  • Wafern kostar >30.000 XNUMX dollar och har initiala avkastningsrisker, men med AI-marginaler som gör den lönsam.
  • Tidsplan: Produktion under andra halvåret 2 och produktfönster mellan 2026 och 2027, med påtryckningar från AMD och Intel.

Nvidia Feynman och TSMC A16

Kiselekosystemet förbereder sig för ett cykelskifte med ett möjligt hopp av Nvidia till TSMC A16 för sin Feynman-arkitektur. Kombinationen av gate-all-around (GAA) och backfeed skulle placera dessa GPU:er i framkant, en utveckling som inte bara syftar till högre prestanda, utan också till att lösa flaskhalsar i strömförsörjning och routing som redan tynger de största AI-chippen.

Även om flera källor är överens om att TSMC A16 kommer att nå massproduktion inom andra halvåret 2026, det råder ingen enighet om produktdatumen: vissa rapporter talar om Feynman 2026, andra skjuter upp dess faktiska ankomst på marknaden mot 2027 eller till och med 2028Denna tidsram, tillsammans med tvivlet på om den kommer att finnas kvar i datacenter eller också kommer att öka konsumtionen, markerar berättelsen om en ambitiös och riskabel satsning väl beräknad.

TSMC A16: Vad det är och vad det erbjuder jämfört med N2

TSMC A16-nod för GPU:er

TSMC A16 är en klassnod 1,6 nm vilket inte begränsar sig till att "krympa" processen: det introducerar nanoskiktstransistorer (GAA) och, för första gången i det taiwanesiska gjuteriet, ett matningsnätverk på baksidan av wafern. Detta nätverk, internt känt som Super Power Rail eller BSDPN (Backside Delivery Power Network), flyttar kraftledningarna bakåt, vilket frigör metall framtill för signaler och minskar resistansförluster.

I siffror talar TSMC om en 8–10 % hastighetsförbättring med samma makt eller, alternativt, av en 15–20 % mindre förbrukning vid samma frekvens, med en densitetsökning på cirka 7–10 % (≈1,10x). Vissa läckor utvecklar denna idé genom att peka på innovationer som NanoFlex/nanoskikt och routingoptimeringar som skulle göra det enklare att skala SoC:er och särskilt GPU:er med många AI-motorer och stora cacheblock.

Den avgörande fördelen ligger inte bara i procentsatserna, utan också i den typ av design de möjliggör: genom att separera effekt och signaler andas chipets framsida mycket bättre, vilket minskar överbelastning i sammankopplingar och "IR-fallet" på matningen. Detta öppnar dörren för mer aggressiva databredder, större cacher och mer logik dedikerad till AI utan att betala en oöverkomlig vägtull i routingkomplexitet.

Dessutom, genom att rensa toppmetallen för skyltar, användningen av finbindande hybrid på framsidan, något viktigt om du vill stapla SRAM eller 3D-cache, och om du vill minska "trafikstockningen" runt PHY:erna hos HBM i förpackningar med mycket hög densitet. Naturligtvis kräver allt detta en parallell förfining i termik och metodik utformad för att utnyttja potential utan att överhettas eller försämra hållbar prestanda.

För slutanvändaren är översättningen ganska enkel: kraftfullare och effektivare GPU:er som kan prestera bättre i spel och innehållsskapande, och viktigast av allt, som skalar bättre i AI- och HPC-arbetsbelastningar utan att öka strömförbrukningen. Denna effektivitetsvinst är särskilt betydande när vi pratar om acceleratorer med TDP:er på flera hundra watt, där varje procentenhet räknas.

  Asus presenterar nya AM5-moderkort på GamesCom

Från Blackwell och Rubin till Feynman: Nvidias vändning

Nvidias färdplan till Feynman

I åratal undvek Nvidia banbrytande litografi vid sin debut för att fokusera på mogna arkitekturer, låga kostnader och prestanda per watt. Hoppern tillverkades i 4N, Blackwell för datacenter förlitar sig på 4NP, och GeForce RTX 50-serien valde också 4NP istället för den tidiga N3. Med Rubin är det planerade hoppet till familj N3 (3N/3NP), och RTX 60-korten är på väg i den riktningen.

Den stora förändringen kommer med Feynman: olika källor indikerar att Nvidia avser hoppa över N2/N2P att landa direkt på A16. Om det bekräftas skulle det vara första gången på länge som företaget leder en "blödande edge"-nod istället för att vänta på att den ska mogna. Detta beslut är inte ett infall, det svarar på en nödvändighet: gigantiska AI-GPU:er har stött på begränsningar av främre kraftleverans och routing, och bakmatning börjar bli ett arkitektoniskt krav.

En annan viktig derivat är Apples roll. Traditionellt lanserade Apple TSMC-noder med sina iPhone SoCs, ett volym-"ankare" som garanterade leveransprioritetVid detta tillfälle placerar taiwanesiska medier som Commercial Times Nvidia som A16:s första kund, en symbolisk förändring som förstärker hur TSMC:s tillväxt i allt högre grad kommer från HPC och AI och inte så mycket om mobilen.

Om Feynman blir först med A16, skulle vi titta på det första kommersiella chipet som i stor skala kombinerar, GAA-nanoskikt med baksideskraft hos TSMC. Det är inte bara en processmilstolpe: det skulle tvinga konkurrenter och hela ekosystemet att accelerera verktyg, arbetsflöden och kraftmodeller anpassad till denna strömförsörjningstopologi.

Angående datum är det här som oväsendet kommer in: vissa pratar om att Feynman-grafikprocessorer år 2026 sammanfaller med A16-"rampen", andra, baserat på tidigare färdplaner, placerar Feynman i 2028 och de begränsar 2026/2027 som industrialiseringsfönstret för noden. Det är rimligt att tro att även om massproduktionen börjar under andra halvåret 2, kan slutprodukterna ses i mitten eller slutet av 2026 och att full driftsättning kan glida fram mot 2027 enligt förpackningskomplexitet och SKU-mixen.

Kostnader, risker och konkurrenslandskapet: Apple, AMD och Intel

Avancerad nodkonkurrens

Att lansera en nod har ett pris. Apples 2nm-wafers uppskattas vara runt 27.000–28.000 XNUMX dollar, medan A16 med sitt bakre elnät skulle överstiga 30.000 XNUMX dollar per skivaN2P, som också inkluderar BSDPN, skulle närma sig den siffran på grund av sin större komplexitet. Till detta kommer lägre initial avkastning, vilket gör varje steg dyrare. giltigt chip i de första omgångarna.

För Nvidia kan dock priset öka: en AI-accelerator säljs för tiotusentals dollar, och förbättringen av densitet och effektivitet kan kompensera för den extra kostnaden om den säkerställer en prestandafördel Dessutom garanterar det prioriterad åtkomst att vara en "flaggskeppskund" och stärker ytterligare alliansen med TSMC i en tid då efterfrågan på AI sätter takten för sektorn.

Konkurrensen står inte stilla: AMD har tillkännagivit kiselmilstolpen i N2 för sin EPYC Venice CPU och det finns rykten om Zen 6 med N2X-varianter, medan dess färdplan för Medusa (Zen 6) överväger N2 och N2P med uppdatering. Parallellt driver Intel 18A med sin egen bakre strömförsörjning (PowerVia) och förbereder sin utbyggnad, med omnämnanden av Panther Lake och 18A-P. Att Nvidia hoppar direkt till A16 skulle ge dem, om allt går bra, ett nod-"spann" mot rivaler på 2 nm under en stor del av andra hälften av decenniet, och assemblers som ASUS lanserar avancerade grafikkort till professionella team.

  BLUETTI revolutionerar off-grid: RVSolar 48V, Pioneer Na och smalt ryggstöd

Risken finns: A16 innebär nya termiska material, komplex förpackning med toppmodern HBM och en EDA-metodik att den bakre matningen fortfarande passar in. Inledningsvis kan utbytet kräva konservativ SKU-segmentering, och kostnaderna kan återspeglas i slutpriset. Nvidia verkar dock villigt att ta den vägtullen för att befästa sin roll som AI-referens.

För konsumenten kan effekten vara indirekt. Om Feynman fokuserar först på datacenter, skulle GeForce-marknaden få se mer först. Rubin i N3 och troligen en mognadscykel innan bakåtmatning och GAA:er landar i spelvärlden. Ändå fortsätter många av de arkitektoniska och mjukvaruoptimeringarna (t.ex. DLSS-liknande förbättringar och AI-block) att sippra ner till förbrukning med viss hastighet.

Tekniska implikationer: från bakre styrstam till 3D och HBM

Bakplansmatning förkortar strömförsörjningen till transistorerna och minskar IR-fallet, vilket begränsar frekvens och stabilitet, särskilt i mycket stora kretsar. Genom att frigöra den främre metallen blir signaldirigeringen mindre överbelastad och integrationen enklare. breda sammankopplingar och mer ambitiösa funktionella block utan att bestraffa latensen lika mycket.

På GPU:er innebär detta möjligheten att öka bredden på SM/kärnorna, förbättra cachehierarkin och lägga till fler AI-acceleratorer utan en explosion av dedikerade kraftmetalllager. Det förbättrar också utrymmet för att integrera HBM PHY:er med färre flaskhalsar i I/O-området, vilket är avgörande när vi pratar om HBM3E och framtida generationer med massiv bandbredd.

En annan bieffekt av att rengöra framsidan är att hybridbindning Tunnt blir mer praktiskt för cache eller staplat SRAM, vilket möjliggör minneshierarkier närmare kärnorna och sparar energi vid åtkomst. Detta sker dock till priset av ökad termisk komplexitet: fler staplade block och högre densitet kräver värmemodeller och avancerad avledning för att undvika "heta punkter".

De som designar dessa chip kommer att behöva uppdatera biblioteksflöden, designregler och utvecklingsstrategier. maktdomäner Utformade för backend-topologi. EDA-verktyg rör sig redan i den riktningen, men de som först producerar i volym får en fördel i metoder och kunskap som är svåra att kopiera snabbt.

För datacenter är fördelarna tydliga: högre, ihållande prestanda vid samma eller lägre strömförbrukning och bättre grunder för multi-chip-arkitekturer med logik- och minneschiplets. Med A16 strävar TSMC efter att visa att bakmatning Det är inte bara genomförbart, utan nödvändigt för att skala upp intensiv databehandling under andra hälften av decenniet.

Bara datacenter eller även spel?

Ett stort frågetecken är om Feynman kommer att förbli som arkitektur fokuserad på AI och HPC eller om den kommer att ha GeForce-derivat för konsumentbruk. Det finns källor som tyder på ett initialt fokus på datacenter och en senare övergång till den inhemska marknaden när noden är mer etablerad, något som överensstämmer med historisk strategi Nvidias önskan att skala upp teknologier från "datacenter först".

  Intel Core Ultra 9 185H finns med på CPU-Z och lovar enastående prestanda i bärbara datorer, minidatorer och AIO:er

Samtidigt pekar allt på att RTX 60 kommer att fortsätta att förlita sig på 3N/3NP, med stegvisa förbättringar av effektivitet, frekvenser och AI-kapacitet. Det är logiskt: att introducera GAA + bakåtmatning till spel kräver en färdig leveranskedja och kostnader som passar in i ASP:n för konsumentkortOm hoppet inträffar kan det komma lite senare än i professionella acceleratorer.

För de som vill köpa idag är det rimliga att följa Rubins utveckling och jämföra prestandan/förbrukningen hos den nya generationen GeForce, baserat på köpguider och oberoende tester. Effekten av A16 på den inhemska marknaden kommer att märkas, men troligen genom en etappvis implementeringscykel och med en stark AI-grund.

Kalender och skyltar att hålla utkik efter

Kalenderns bitar passar ihop så här: TSMC planerar att starta massproduktion av A16 under andra halvåret 2, så de första kommersiella produkterna kommer knappast att dyka upp före mitten eller slutet av 2027. Vissa färdplaner och rapporter placerar familjen Feynman i full gång under 2028, medan andra läckor är mer optimistiska med 2026 datumVerkligheten skulle kunna vara en hybrid: ”tidig kisel” 2026/27 och utbredd implementering 2028.

Parallellt kommer vi att fortsätta se AMD göra framsteg inom N2/N2P med Venice och Zen 6, och Intel som driver 18A med PowerVia och dess tidiga produkter. Nyckeln kommer att vara vem som uppnår bäst hållbar prestanda per watt i verkliga AI-arbetsbelastningar, hur paketeringen mognar med HBM, och vad avkastning per skiva få varje nod i skala.

Om Nvidia lanserar A16 med Feynman, kommer det att bryta en tradition på mer än ett decennium där Apple invigde varje process och positionera AI som ett exempel på nyskapande teknologiDet är inte bara ett växelskifte: det är ett tecken på att drivkraften bakom kiseltillväxt inte längre är smartphones, utan accelererad databehandling.

Bortom sifferkriget ligger vändpunkten i arkitekturen: baksidans kraft Det lättar på de begränsningar som höll tillbaka större grafikprocessorer, och GAA lägger grunden för nästa steg i skalningen. Om TSMC och Nvidia presterar bra kommer ribban för AMD, Intel och resten att höjas, vilket kommer att pressa hela branschen att röra sig snabbare.

Detta lämnar ett mycket konkurrensutsatt scenario: höga kostnader i början, tydliga fördelar för AI-arbetsbelastningar och utrymme för varje företag att spela sina kort inom nod, paketering och optimerad programvaraDen som bäst anpassar dessa tre delar kommer att vinna i framtida produktcykler.

Med allt ovanstående på bordet är fotografiet övertygande: Feynman på A16 Det är inte bara ett löfte om mer FPS eller fler TFLOPS, utan ett nytänkande kring hur man driver och skalar extrema chip; datumen fluktuerar mellan 2026 och 2028 beroende på vilken milstolpe vi tittar på, kostnaderna är höga men hanterbara inom AI, och konkurrensen är hård på båda sidor med N2/N2P och 18A; om Nvidia och TSMC samsas väl om process, paketering och efterfrågan, kommer vi att ha riktmärket som kommer att sätta takten för resten.

nvidia n1x
Relaterad artikel:
NVIDIA N1X: Detta är den revolutionerande ARM SoC med Blackwell GPU för bärbara datorer och PC