- Nvidia pregătește Feynman pe TSMC A16 cu GAA și alimentare din spate pentru a maximiza eficiența și performanța.
- TSMC A16 promite o viteză de +8–10% sau un consum de -15–20% comparativ cu N2 și o densitate mai mare.
- Costurile napolitanelor >30.000 USD și riscurile inițiale de randament, dar cu marje de inteligență artificială care le fac viabile.
- Calendar: Producția în a doua jumătate a anului 2 și fereastra de producție între 2026 și 2027, sub presiunea AMD și Intel.
Ecosistemul de siliciu se pregătește pentru o schimbare de ciclu, cu posibilul salt al De la Nvidia la TSMC A16 pentru arhitectura sa Feynman. Combinația dintre gate-all-around (GAA) și back-feed ar plasa aceste GPU-uri în prim-plan, o evoluție care nu numai că vizează o performanță sporită, ci și rezolvarea problemelor blocaje de alimentare și rutare care deja apasă pe cele mai mari cipuri de inteligență artificială.
Deși mai multe surse sunt de acord că TSMC A16 va ajunge la producția de masă în a doua jumătate a anului 2026, nu există unanimitate în ceea ce privește datele produsului: unele rapoarte vorbesc despre Feynman în 2026, altele împing sosirea sa efectivă pe piață spre 2027 sau chiar 2028Acest interval de timp, împreună cu îndoiala dacă va rămâne în centrele de date sau va afecta și consumul, marchează narațiunea unei pariu ambițios și riscant bine calculat.
TSMC A16: Ce este și ce oferă în comparație cu N2
TSMC A16 este un nod de clasă 1,6 nm care nu se limitează la „micșorarea” procesului: introduce tranzistoare nano-folii (GAA) și, pentru prima dată în turnătoria taiwaneză, o rețea de alimentare pe partea din spate a plachetei. Această rețea, cunoscută intern ca Șină Super Putere sau BSDPN (Backside Delivery Power Network), mută liniile de alimentare în spate, eliberând metalul frontal pentru semnale și reducând pierderile de rezistență.
În cifre, TSMC vorbește despre o Îmbunătățire a vitezei cu 8–10% la putere egală sau, alternativ, a unei Consum redus cu 15–20% la aceeași frecvență, cu o creștere a densității de aproximativ 7–10% (≈1,10x). Unele scurgeri de informații extind această idee, indicând inovații precum NanoFlex/nanosheet și optimizări de rutare care ar facilita scalarea SoC-urilor și în special a GPU-urilor cu multe motoare de inteligență artificială și blocuri mari de cache.
Beneficiul decisiv nu constă doar în procente, ci și în tipul de design pe care îl permit: prin separarea puterii și a semnalelor, partea frontală a cipului respiră mult mai bine, ceea ce reduce congestie de interconectare și „căderea IR” a sursei de alimentare. Aceasta deschide ușa către lățimi de date mai agresive, cache-uri mai mari și mai multă logică dedicată inteligenței artificiale, fără a plăti o taxă prohibitivă în ceea ce privește complexitatea rutării.
În plus, prin eliminarea suprafeței metalice pentru semne, utilizarea hibrid cu legături fine pe partea frontală, ceva cheie dacă vrei să suprapui SRAM sau cache 3D și dacă vrei să reduci „ambuteiajul” din jurul PHY-urilor HBM în pachete cu densitate foarte mare. Desigur, toate acestea necesită o rafinare paralelă în termice și metodologie conceput pentru a exploata potențialul fără a supraîncălzi sau a penaliza performanța susținută.
Pentru utilizatorul final, traducerea este destul de simplă: GPU-uri mai puternice și mai eficiente, care pot performa mai bine în jocuri și crearea de conținut și, cel mai important, care se scalează mai bine în... Sarcini de lucru AI și HPC fără a crește consumul de energie. Această creștere a eficienței este deosebit de semnificativă atunci când vorbim despre acceleratoare cu TDP-uri de câteva sute de wați, unde fiecare punct procentual contează.
De la Blackwell și Rubin la Feynman: Redresarea Nvidia

Ani de zile, Nvidia a evitat litografia de ultimă generație la debutul său pentru a se concentra pe arhitecturi mature, costuri reduse și performanță per watt. Pâlnia a fost fabricată în 4N, Blackwell pentru centre de date se bazează pe 4NP, iar seria GeForce RTX 50 a optat și ea pentru 4NP în loc de N3-ul inițial. Cu Rubin, saltul planificat este către familia N3 (3N/3NP), iar RTX 60 se îndreaptă în această direcție.
Marea schimbare vine odată cu Feynman: diverse surse indică faptul că Nvidia intenționează sări peste N2/N2P să aterizeze direct pe A16. Dacă se confirmă, ar fi prima dată după mult timp când compania conduce un nod „de ultimă generație” în loc să aștepte ca acesta să se maturizeze. Această decizie nu este un capriciu, ci răspunde unei necesități: GPU-urile gigantice cu inteligență artificială au întâmpinat limite de livrare și rutare a puterii frontale...iar alimentarea din spate începe să devină o cerință arhitecturală.
O altă variantă derivată cheie este rolul Apple. În mod tradițional, Apple a lansat noduri TSMC cu SoC-urile sale pentru iPhone, o „ancoră” de volum care garanta prioritate de aprovizionareCu această ocazie, presa taiwaneză, precum Commercial Times, plasează Nvidia drept primul client al A16, o schimbare simbolică ce întărește modul în care creșterea TSMC vine din ce în ce mai mult din... HPC și AI și nu atât de mult despre mobil.
Dacă Feynman ajunge acolo primul în A16, vom avea de-a face cu primul cip comercial care combină, la scară largă, Nanosheet GAA cu putere din spate la TSMC. Aceasta nu este doar o etapă importantă a procesului: ar obliga concurenții și întregul ecosistem să accelereze instrumentele, fluxurile de lucru și modele de putere adaptat la această topologie de alimentare.
În ceea ce privește datele, aici intervine zgomotul: unii vorbesc despre GPU-uri Feynman în 2026 care coincid cu „rampa” A16, alții, pe baza planurilor de parcurs anterioare, plasează Feynman în 2028 și limitează perioada 2026/2027 ca fereastră de industrializare pentru nod. Este rezonabil să credem că, chiar dacă producția de masă începe în a doua jumătate a anului 2, produsele finale ar putea fi văzute la mijlocul sau sfârșitul anului 2026 și că implementarea completă ar putea decala spre 2027, conform complexitatea ambalajelor și mixul SKU.
Costuri, riscuri și peisajul concurențial: Apple, AMD și Intel

Lansarea unui nod are un preț. Se estimează că napolitanele Apple de 2nm sunt în jur de... 27.000–28.000 USD, în timp ce A16 cu rețeaua sa electrică din spate ar depăși 30.000 de dolari pe napolitanăN2P, care încorporează și BSDPN, s-ar apropia de această cifră datorită complexității sale mai mari. La aceasta se adaugă randamente inițiale mai mici, ceea ce face ca fiecare pas să fie mai scump. cip valid în primele loturi.
Pentru Nvidia, însă, prețul s-ar putea aduna: un accelerator de inteligență artificială se vinde cu zeci de mii de dolari, iar îmbunătățirea densității și a eficienței poate compensa costul suplimentar dacă asigură... avantaj de performanță În plus, statutul de „client emblematic” garantează acces prioritar și consolidează și mai mult alianța cu TSMC într-un moment în care cererea de inteligență artificială dă tonul acestui sector.
Concurența nu s-a oprit: AMD a anunțat etapa de realizare a siliciului în... N2 pentru procesorul său EPYC Venice și există zvonuri despre Zen 6 cu variante N2X, în timp ce foaia sa de parcurs a Medusa (Zen 6) ia în considerare N2 și N2P cu reîmprospătare. În paralel, Intel promovează 18A cu propria sursă de alimentare spate (PowerVia) și își pregătește implementarea, cu mențiuni despre Panther Lake și 18A-P. Trecerea directă la A16 de la Nvidia i-ar oferi, dacă totul merge bine, o „întindere” de noduri împotriva rivalilor în 2 nm pentru o bună parte a celei de-a doua jumătăți a deceniului, iar asamblori precum ASUS aduce GPU-uri avansate către echipe profesioniste.
Riscul există: A16 implică noi sisteme termice, ambalaje complexe cu HBM de ultimă generație și un... Metodologia EDA că alimentarea din spate încă se potrivește. Inițial, randamentele ar putea necesita o segmentare conservatoare a SKU-urilor, iar costurile s-ar putea reflecta în prețul final. Cu toate acestea, Nvidia pare dispusă să își asume acest cost pentru a-și consolida rolul de Referință AI.
Pentru consumator, impactul ar putea fi indirect. Dacă Feynman se concentrează în primul rând pe centrele de date, piața GeForce ar vedea mai multe în primul rând. Rubin în N3 și probabil un ciclu de maturare înainte ca rear-feeding-ul și GAA-urile să apară în jocuri. Totuși, multe dintre optimizările arhitecturale și software (de exemplu, îmbunătățiri de tip DLSS și blocuri AI) continuă să se manifeste consum cu o oarecare viteză.
Implicații tehnice: de la tija spate la 3D și HBM
Alimentarea prin placa de bază scurtează calea de alimentare către tranzistoare și reduce căderea de infraroșu (IR), ceea ce limitează frecvența și stabilitatea, în special în cazul cipurilor foarte mari. Prin eliberarea metalului frontal, rutarea semnalului este mai puțin congestionată, iar integrarea este mai ușoară. interconexiuni largi și blocuri funcționale mai ambițioase fără a penaliza la fel de mult latența.
Pe GPU-uri, acest lucru se traduce prin capacitatea de a crește lățimea SM/nucleelor, de a îmbunătăți ierarhia cache-ului și de a adăuga mai multe Acceleratoare de inteligență artificială fără o explozie de straturi dedicate de metale de putere. De asemenea, îmbunătățește spațiul pentru integrarea circuitelor PHY HBM cu mai puține blocaje în zona I/O, ceea ce este esențial atunci când vorbim despre HBM3E și generațiile viitoare cu lățime de bandă masivă.
Un alt efect secundar al curățării feței frontale este că legarea hibridă Memoria subțire devine mai practică pentru cache sau SRAM suprapuse, permițând ierarhii de memorie mai aproape de nuclee și economisind energie la accesări. Totuși, acest lucru vine cu prețul unei complexități termice crescute: mai multe blocuri suprapuse și o densitate mai mare necesită... modele de căldură și disipare avansată pentru a evita „punctele fierbinți”.
Cei care proiectează aceste cipuri vor trebui să actualizeze fluxurile bibliotecilor, regulile de proiectare și strategiile de dezvoltare. domenii de putere Conceput pentru topologie back-end. Instrumentele EDA se îndreaptă deja în această direcție, dar primul care produce în volum câștigă un avantaj în metodologii și know-how care sunt dificil de copiat rapid.
Pentru centrele de date, beneficiile sunt clare: performanță susținută mai mare la același consum de energie sau la un consum mai mic și fundații mai bune pentru arhitecturi multi-die cu logică și chiplet-uri de memorie. Cu A16, TSMC își propune să demonstreze că alimentare din spate Nu este doar viabil, ci și necesar să se extindă calculul intensiv în a doua jumătate a deceniului.
Doar centre de date sau și jocuri?
Un mare semn de întrebare este dacă Feynman va rămâne ca arhitect concentrat pe IA și HPC sau dacă va avea derivate GeForce pentru uzul consumatorilor. Există surse care sugerează o concentrare inițială pe centrele de date și o tranziție ulterioară către piața internă, atunci când nodul va fi mai bine stabilit, lucru în concordanță cu strategie istorică Dorința Nvidia de a scala tehnologiile de la „centrul de date pe primul loc”.
Între timp, totul indică faptul că RTX 60 va continua să se bazeze pe 3N/3NP, cu îmbunătățiri incrementale ale eficienței, frecvențelor și capacității AI. Are sens: aducerea GAA + rear-feed în jocuri necesită un lanț de aprovizionare pregătit și costuri care să se încadreze în ASP-ul carduri de consumDacă saltul are loc, s-ar putea întâmpla puțin mai târziu decât în cazul acceleratoarelor profesionale.
Pentru cei care doresc să cumpere astăzi, lucrul rezonabil de făcut este să urmărească evoluția lui Rubin și să compare performanța/consumul noii generații de GeForce, pe baza ghiduri de cumpărare și testare independentă. Impactul A16 asupra pieței interne se va resimți, dar probabil printr-un ciclu de adoptare etapizat și cu o bază solidă de inteligență artificială.
Calendar și semne de urmărit
Piesele calendarului se îmbină astfel: TSMC intenționează să înceapă producția în masă a A16 în a doua jumătate a anului 2, așadar primele produse comerciale vor apărea cu greu înainte de mijlocul sau sfârșitul anului 2027. Unele planuri de acțiune și rapoarte plasează familia Feynman în 2028, în timp ce alte scurgeri de informații sunt mai optimiste, Date 2026Realitatea ar putea fi un hibrid: „siliciu timpuriu” în 2026/27 și implementare pe scară largă în 2028.
În paralel, vom continua să vedem progresul AMD în N2/N2P cu Venice și Zen 6 și Intel atingând 18A cu PowerVia și primele sale produse. Cheia va fi cine obține cea mai bună performanță susținută per watt în sarcini de lucru AI din lumea reală, cum se maturizează pachetul cu HBM și ce randamente per napolitană obțineți fiecare nod la scară.
Dacă Nvidia lansează A16 cu Feynman, va rupe o tradiție de mai bine de un deceniu în care Apple a inaugurat fiecare proces și va poziționa IA ca o vitrină a... tehnologie de vârfNu este doar o schimbare de ritm: este un semn că forța motrice a creșterii siliciului nu mai sunt smartphone-urile, ci calculul accelerat.
Dincolo de războiul cifrelor, punctul de cotitură se află în arhitectură: putere din spate Aceasta reduce limitele care au împiedicat GPU-urile mai mari, iar GAA pune bazele pentru următoarea etapă de scalare. Dacă TSMC și Nvidia vor avea rezultate bune, ștacheta pentru AMD, Intel și restul va fi ridicată, împingând întreaga industrie să se miște mai repede.
Acest lucru lasă un scenariu foarte competitiv: costuri ridicate la început, beneficii clare pentru sarcinile de lucru cu inteligență artificială și spațiu pentru ca fiecare companie să își joace cărțile în ceea ce privește nodurile, ambalajele și... software optimizatCine aliniază cel mai bine aceste trei piese va câștiga în ciclurile viitoare de produse.
Având în vedere toate cele de mai sus, fotografia este convingătoare: Feynman pe A16 Nu este vorba doar de o promisiune de mai mulți FPS sau mai mulți TFLOPS, ci de o regândire a modului de a alimenta și scala cipurile extreme; datele fluctuează între 2026 și 2028, în funcție de etapa importantă pe care o analizăm, costurile sunt mari, dar gestionabile în domeniul inteligenței artificiale, iar concurența este strânsă de ambele părți cu N2/N2P și 18A; dacă Nvidia și TSMC se aliniază bine în ceea ce privește procesul, ambalajul și cererea, vom avea etalonul care va da ritmul pentru restul.
