Feynman và TSMC A16: Động thái có thể thay đổi cuộc chơi

Cập nhật lần cuối: 17 tháng 9 của 2025
tác giả: Isaac
  • Nvidia chuẩn bị Feynman trên TSMC A16 với GAA và cấp nguồn phía sau để tối đa hóa hiệu suất và hiệu suất.
  • TSMC A16 hứa hẹn tốc độ +8–10% hoặc mức tiêu thụ -15–20% so với N2 và mật độ cao hơn.
  • Chi phí sản xuất wafer >30.000 đô la và có rủi ro về lợi nhuận ban đầu, nhưng với biên lợi nhuận AI khiến nó khả thi.
  • Lịch trình: Sản xuất trong nửa cuối năm 2 và ra mắt sản phẩm từ năm 2026 đến năm 2027, chịu áp lực từ AMD và Intel.

Nvidia Feynman và TSMC A16

Hệ sinh thái silicon đang chuẩn bị cho một chu kỳ thay đổi với khả năng nhảy vọt Nvidia chuyển sang TSMC A16 cho kiến ​​trúc Feynman của nó. Sự kết hợp giữa cổng toàn diện (GAA) và phản hồi ngược sẽ đưa các GPU này lên hàng đầu, một sự phát triển không chỉ hướng đến hiệu suất cao hơn mà còn giải quyết tắc nghẽn nguồn điện và định tuyến vốn đã đè nặng lên những con chip AI lớn nhất.

Mặc dù một số nguồn tin đồng ý rằng TSMC A16 sẽ đạt sản lượng hàng loạt vào nửa cuối năm 2026, không có sự thống nhất về ngày ra mắt sản phẩm: một số báo cáo nói về Feynman vào năm 2026, những báo cáo khác lại đẩy thời điểm ra mắt thực tế của sản phẩm này trên thị trường vào năm 2027 hoặc thậm chí 2028. Khung thời gian này, cùng với sự nghi ngờ liệu nó sẽ vẫn ở trong các trung tâm dữ liệu hay cũng sẽ bước vào tiêu dùng, đánh dấu câu chuyện về một đặt cược đầy tham vọng và rủi ro được tính toán kỹ lưỡng.

TSMC A16: Nó là gì và nó cung cấp những gì so với N2

Nút TSMC A16 cho GPU

TSMC A16 là một nút lớp 1,6 nm không chỉ giới hạn ở việc "thu nhỏ" quy trình: nó còn giới thiệu các bóng bán dẫn nanosheet (GAA) và, lần đầu tiên tại xưởng đúc Đài Loan, một mạng lưới cấp liệu ở mặt sau của tấm wafer. Mạng lưới này, được gọi nội bộ là Đường sắt siêu năng lực hoặc BSDPN (Mạng lưới phân phối điện phía sau), di chuyển đường dây điện về phía sau, giải phóng phần kim loại phía trước để truyền tín hiệu và giảm tổn thất điện trở.

Trong các con số, TSMC nói về một Cải thiện tốc độ 8–10% ở mức công suất bằng nhau hoặc, thay vào đó, của một Tiêu thụ ít hơn 15–20% ở cùng tần số, với mật độ tăng khoảng 7–10% (≈1,10 lần). Một số rò rỉ mở rộng ý tưởng này bằng cách chỉ ra những đổi mới như NanoFlex/tấm nano và tối ưu hóa định tuyến giúp mở rộng quy mô SoC và đặc biệt là GPU với nhiều công cụ AI và khối bộ nhớ đệm lớn dễ dàng hơn.

Lợi ích quyết định không chỉ nằm ở phần trăm mà còn ở loại thiết kế mà chúng cho phép: bằng cách tách biệt công suất và tín hiệu, mặt trước của chip thoáng khí hơn nhiều, giúp giảm tắc nghẽn kết nối và "sự sụt giảm IR" của nguồn cung cấp. Điều này mở ra cánh cửa cho độ rộng dữ liệu tích cực hơn, bộ nhớ đệm lớn hơn và nhiều logic hơn dành riêng cho AI mà không phải trả giá quá cao cho độ phức tạp của việc định tuyến.

Ngoài ra, bằng cách dọn sạch kim loại trên cùng để làm biển báo, việc sử dụng liên kết tốt lai ở mặt trước, một số thứ quan trọng nếu bạn muốn xếp chồng SRAM hoặc bộ nhớ đệm 3D và nếu bạn muốn giảm bớt "tắc nghẽn giao thông" xung quanh các phần vật lý của HBM trong các gói có mật độ rất cao. Tất nhiên, tất cả điều này đòi hỏi một sự tinh chỉnh song song trong nhiệt và phương pháp luận được thiết kế để khai thác tiềm năng mà không gây quá nhiệt hoặc ảnh hưởng đến hiệu suất bền vững.

Đối với người dùng cuối, bản dịch khá đơn giản: GPU mạnh hơn và hiệu quả hơn có thể hoạt động tốt hơn trong trò chơi và tạo nội dung và quan trọng nhất là có khả năng mở rộng tốt hơn trong Khối lượng công việc AI và HPC mà không làm tăng mức tiêu thụ điện năng. Hiệu suất tăng này đặc biệt đáng kể khi chúng ta nói về các bộ tăng tốc có TDP lên đến vài trăm watt, trong đó mỗi phần trăm đều có giá trị.

  KaiXian KX-7000N và Kaisheng KH-50000: Cuộc cách mạng trong lĩnh vực chip của Trung Quốc

Từ Blackwell và Rubin đến Feynman: Sự chuyển mình của Nvidia

Lộ trình của Nvidia đến Feynman

Trong nhiều năm, Nvidia đã tránh sử dụng công nghệ in thạch bản tiên tiến khi ra mắt để tập trung vào kiến trúc trưởng thành, chi phí thấp và hiệu suất trên mỗi watt. Phễu được sản xuất bằng 4N, Blackwell cho các trung tâm dữ liệu dựa trên 4NP và dòng GeForce RTX 50 cũng đã chọn 4NP thay vì N3 đời đầu. Với Rubin, bước nhảy vọt theo kế hoạch là gia đình N3 (3N/3NP) và RTX 60 đang hướng tới mục tiêu đó.

Sự thay đổi lớn đến từ Feynman: nhiều nguồn tin cho biết Nvidia có ý định bỏ qua N2/N2P sẽ hạ cánh trực tiếp trên A16. Nếu được xác nhận, đây sẽ là lần đầu tiên sau một thời gian dài, công ty dẫn đầu một nút "cực kỳ tiên tiến" thay vì chờ đợi nó hoàn thiện. Quyết định này không phải là một ý thích nhất thời, mà là một sự đáp ứng nhu cầu cấp thiết: các GPU AI khổng lồ đã gặp phải giới hạn cung cấp điện phía trước và định tuyếnvà việc cấp liệu từ phía sau đang bắt đầu trở thành một yêu cầu về mặt kiến ​​trúc.

Một dẫn xuất quan trọng khác là vai trò của Apple. Theo truyền thống, Apple đã tung ra các nút TSMC với SoC iPhone của mình, một "mỏ neo" khối lượng đảm bảo ưu tiên cung cấp. Nhân dịp này, các phương tiện truyền thông Đài Loan như Commercial Times đã đưa Nvidia trở thành khách hàng đầu tiên của A16, một sự thay đổi mang tính biểu tượng củng cố cho sự tăng trưởng ngày càng tăng của TSMC đến từ HPC và AI và không nói nhiều về điện thoại di động.

Nếu Feynman đến đó trước trong A16, chúng ta sẽ thấy con chip thương mại đầu tiên kết hợp, trên quy mô lớn, Tấm nano GAA với sức mạnh hậu phương tại TSMC. Đó không chỉ là một cột mốc quy trình: nó sẽ buộc các đối thủ cạnh tranh và toàn bộ hệ sinh thái phải tăng tốc các công cụ, quy trình làm việc và mô hình quyền lực phù hợp với cấu trúc nguồn điện này.

Về ngày tháng, đây là nơi tiếng ồn xuất hiện: một số người nói về GPU Feynman vào năm 2026 trùng với "đường dốc" A16, những người khác, dựa trên các lộ trình trước đó, đặt Feynman vào 2028 và họ giới hạn năm 2026/2027 là thời điểm công nghiệp hóa cho nút này. Có lý khi cho rằng, ngay cả khi việc sản xuất hàng loạt bắt đầu vào nửa cuối năm 2, sản phẩm cuối cùng vẫn có thể được nhìn thấy vào giữa hoặc cuối năm 2026 và việc triển khai đầy đủ có thể lùi sang năm 2027 theo dự kiến. độ phức tạp của bao bì và hỗn hợp SKU.

Chi phí, rủi ro và bối cảnh cạnh tranh: Apple, AMD và Intel

Cuộc thi nút nâng cao

Việc ra mắt một nút có giá của nó. Các wafer 2nm của Apple ước tính có giá khoảng 27.000–28.000 đô la, trong khi A16 với mạng lưới điện phía sau của nó sẽ vượt quá 30.000 đô la một tấm waferN2P, vốn cũng tích hợp BSDPN, sẽ đạt đến con số đó do tính phức tạp cao hơn. Thêm vào đó, lợi nhuận ban đầu thấp hơn, khiến mỗi bước đều tốn kém hơn. chip hợp lệ trong đợt đầu tiên.

Tuy nhiên, đối với Nvidia, giá có thể tăng lên: một bộ tăng tốc AI được bán với giá hàng chục nghìn đô la và sự cải thiện về mật độ và hiệu quả có thể bù đắp chi phí phát sinh nếu nó đảm bảo lợi thế về hiệu suất Hơn nữa, việc trở thành "khách hàng chủ chốt" đảm bảo quyền truy cập ưu tiên và củng cố thêm liên minh với TSMC vào thời điểm nhu cầu về AI đang định hướng cho ngành.

Cuộc cạnh tranh vẫn chưa dừng lại: AMD đã công bố cột mốc silicon trong N2 cho CPU EPYC Venice của nó và có tin đồn về Zen 6 với các biến thể N2X, trong khi lộ trình của nó Medusa (Thiền 6) xem xét N2 và N2P với việc làm mới. Song song đó, Intel thúc đẩy 18A với bộ nguồn phía sau riêng (PowerVia) và đang chuẩn bị triển khai, với những thông tin về Panther Lake và 18A-P. Việc Nvidia chuyển thẳng sang A16, nếu mọi việc suôn sẻ, sẽ giúp hãng có một "khoảng cách" lớn so với các đối thủ trong tiến trình 2 nm trong phần lớn nửa sau của thập kỷ, và các nhà lắp ráp như ASUS mang đến GPU tiên tiến cho các đội chuyên nghiệp.

  Những card đồ họa tốt nhất có giá 300 € (hoặc thấp hơn)

Rủi ro tồn tại: A16 liên quan đến nhiệt mới, bao bì phức tạp với HBM hiện đại và Phương pháp EDA rằng nguồn cấp dữ liệu phía sau vẫn còn phù hợp. Ban đầu, sản lượng có thể yêu cầu phân khúc SKU thận trọng, và chi phí có thể được phản ánh vào giá cuối cùng. Tuy nhiên, Nvidia dường như sẵn sàng chấp nhận điều đó để củng cố vai trò của mình như một Tài liệu tham khảo AI.

Đối với người tiêu dùng, tác động có thể là gián tiếp. Nếu Feynman tập trung trước vào các trung tâm dữ liệu, thị trường GeForce sẽ chứng kiến ​​nhiều thay đổi hơn. Rubin ở N3 và có thể là một chu kỳ trưởng thành trước khi đưa dữ liệu ngược và GAA vào trò chơi. Tuy nhiên, nhiều tối ưu hóa về kiến ​​trúc và phần mềm (ví dụ: cải tiến tương tự DLSS và khối AI) vẫn tiếp tục được áp dụng. tiêu thụ với một số tốc độ.

Ý nghĩa kỹ thuật: từ thân sau đến 3D và HBM

Việc cấp nguồn cho backplane giúp rút ngắn đường dẫn điện đến các transistor và giảm độ sụt IR, vốn hạn chế tần số và độ ổn định, đặc biệt là trong các chip rất lớn. Bằng cách giải phóng lớp kim loại phía trước, việc định tuyến tín hiệu sẽ ít bị tắc nghẽn hơn và việc tích hợp trở nên dễ dàng hơn. kết nối rộng rãi và các khối chức năng tham vọng hơn mà không gây ảnh hưởng nhiều đến độ trễ.

Trên GPU, điều này chuyển thành khả năng tăng chiều rộng của SM/lõi, cải thiện hệ thống phân cấp bộ nhớ đệm và thêm nhiều hơn Máy gia tốc AI mà không cần phải bùng nổ các lớp kim loại điện chuyên dụng. Nó cũng cải thiện khả năng tích hợp các HBM PHY với ít nút thắt hơn trong khu vực I/O, điều này rất quan trọng khi chúng ta nói về HBM3E và các thế hệ tương lai với băng thông lớn.

Một tác dụng phụ khác của việc làm sạch mặt trước là liên kết lai Mỏng trở nên thiết thực hơn đối với bộ nhớ đệm hoặc SRAM xếp chồng, cho phép phân cấp bộ nhớ gần lõi hơn và tiết kiệm năng lượng khi truy cập. Tuy nhiên, điều này phải trả giá bằng độ phức tạp về nhiệt tăng lên: cần nhiều khối xếp chồng hơn và mật độ lớn hơn. mô hình nhiệt và tản nhiệt tiên tiến để tránh “điểm nóng”.

Những người thiết kế các con chip này sẽ phải cập nhật luồng thư viện, quy tắc thiết kế và chiến lược phát triển. miền năng lượng Được thiết kế cho cấu trúc back-end. Các công cụ EDA hiện đang đi theo hướng đó, nhưng những công ty đầu tiên sản xuất hàng loạt sẽ có lợi thế về phương pháp luận và bí quyết khó có thể sao chép nhanh chóng.

Đối với các trung tâm dữ liệu, lợi ích rất rõ ràng: hiệu suất duy trì cao hơn ở mức tiêu thụ điện năng tương đương hoặc thấp hơn và nền tảng tốt hơn cho kiến ​​trúc đa đế chip với các chiplet logic và bộ nhớ. Với A16, TSMC đặt mục tiêu chứng minh rằng nạp liệu phía sau Nó không chỉ khả thi mà còn cần thiết để mở rộng quy mô tính toán chuyên sâu vào nửa sau của thập kỷ này.

Chỉ có trung tâm dữ liệu hay còn có cả trò chơi?

Một dấu hỏi lớn là liệu Feynman có tiếp tục là kiến ​​trúc tập trung vào AI và HPC hoặc liệu nó có các phiên bản GeForce dành cho người tiêu dùng hay không. Có những nguồn tin cho rằng ban đầu sẽ tập trung vào các trung tâm dữ liệu và sau đó chuyển sang thị trường nội địa khi các node đã ổn định hơn, điều này phù hợp với chiến lược lịch sử Mong muốn mở rộng công nghệ của Nvidia theo hướng “ưu tiên trung tâm dữ liệu”.

  Chiếc máy tính mini mới của Chuwi với bộ xử lý i3 và dung lượng lưu trữ 512GB hiện đã có mặt tại Châu Âu.

Trong khi đó, mọi thứ đều chỉ ra thực tế rằng RTX 60 sẽ tiếp tục dựa vào 3N/3NP, với những cải tiến gia tăng về hiệu suất, tần suất và khả năng AI. Điều này hoàn toàn hợp lý: việc đưa GAA + rear-feed vào trò chơi đòi hỏi một chuỗi cung ứng sẵn sàng và chi phí phù hợp với ASP của thẻ tiêu dùngNếu cú ​​nhảy xảy ra, nó có thể đến muộn hơn một chút so với các máy gia tốc chuyên nghiệp.

Đối với những người muốn mua ngày nay, điều hợp lý cần làm là theo dõi sự phát triển của Rubin và so sánh hiệu suất/mức tiêu thụ của thế hệ GeForce mới, dựa trên mua hướng dẫn và thử nghiệm độc lập. Tác động của A16 đối với thị trường nội địa sẽ được cảm nhận, nhưng có thể sẽ thông qua một chu kỳ áp dụng theo từng giai đoạn và với nền tảng AI vững chắc.

Lịch và các dấu hiệu cần chú ý

Các mảnh của lịch khớp với nhau như thế này: TSMC có kế hoạch bắt đầu sản xuất hàng loạt A16 vào nửa cuối năm 2, vì vậy các sản phẩm thương mại đầu tiên khó có thể xuất hiện trước giữa hoặc cuối năm 2027. Một số lộ trình và báo cáo cho thấy gia đình Feynman sẽ thể hiện sức mạnh của mình vào năm 2028, trong khi các rò rỉ khác lạc quan hơn với ngày tháng năm 2026Thực tế có thể là sự kết hợp: “silicon sớm” vào năm 2026/27 và triển khai rộng rãi vào năm 2028.

Song song với đó, chúng ta sẽ tiếp tục chứng kiến ​​AMD tiến bộ trong N2/N2P với Venice và Zen 6, và Intel đang thúc đẩy 18A với PowerVia và các sản phẩm đầu tiên của hãng. Điều quan trọng sẽ là ai đạt được hiệu suất bền vững tốt nhất trên mỗi watt trong các khối lượng công việc AI thực tế, cách đóng gói hoàn thiện với HBM và những gì sản lượng trên mỗi wafer lấy từng nút theo tỷ lệ.

Nếu Nvidia ra mắt A16 với Feynman, nó sẽ phá vỡ truyền thống kéo dài hơn một thập kỷ khi Apple khai trương từng quy trình và sẽ định vị AI như một ví dụ điển hình công nghệ cắt cạnhĐây không chỉ là sự thay đổi về mặt công nghệ: đây là dấu hiệu cho thấy động lực thúc đẩy sự phát triển của silicon không còn là điện thoại thông minh nữa mà là máy tính tăng tốc.

Ngoài cuộc chiến về số lượng, bước ngoặt nằm ở kiến ​​trúc: sức mạnh phía sau Nó xóa bỏ những hạn chế vốn kìm hãm các GPU lớn hơn, và GAA đặt nền móng cho giai đoạn mở rộng quy mô tiếp theo. Nếu TSMC và Nvidia thực hiện tốt, chuẩn mực cho AMD, Intel và các hãng còn lại sẽ được nâng cao, thúc đẩy toàn bộ ngành công nghiệp phát triển nhanh hơn.

Điều này tạo ra một kịch bản rất cạnh tranh: chi phí ban đầu cao, lợi ích rõ ràng cho khối lượng công việc AI và không gian cho mỗi công ty thể hiện khả năng của mình trong việc đóng gói, phát triển và phần mềm tối ưuBất kỳ ai kết hợp tốt nhất ba yếu tố này sẽ chiến thắng trong các chu kỳ sản phẩm trong tương lai.

Với tất cả những điều trên, bức ảnh này thực sự hấp dẫn: Feynman trên A16 Đây không chỉ là lời hứa về FPS hay TFLOPS cao hơn, mà là sự tái định nghĩa về cách cung cấp năng lượng và mở rộng quy mô cho chip cực mạnh; ngày ra mắt dao động từ năm 2026 đến năm 2028 tùy thuộc vào cột mốc mà chúng tôi hướng đến, chi phí cao nhưng vẫn có thể quản lý được trong lĩnh vực AI và sự cạnh tranh rất gay gắt ở cả hai phía với N2/N2P và 18A; nếu Nvidia và TSMC phối hợp tốt về quy trình, đóng gói và nhu cầu, chúng ta sẽ có chuẩn mực định hình nhịp độ cho phần còn lại.

nvidia n1x
Bài viết liên quan:
NVIDIA N1X: Đây là SoC ARM mang tính cách mạng với GPU Blackwell dành cho máy tính xách tay và PC