OpenAI và Broadcom đã công bố chip tăng tốc AI tùy chỉnh đầu tiên của họ, mang tên "Jalapeño" 🌶️. Thay vì các GPU đa năng từ Nvidia hay AMD, Jalapeño được định vị là bộ xử lý chuyên biệt cho tác vụ suy luận mô hình ngôn ngữ lớn (LLM).
Mặc dù ban đầu được thiết kế cho ChatGPT, Codex và các sản phẩm tương lai của OpenAI, cả hai công ty đều ngụ ý rằng Jalapeño có thể sẽ được cung cấp cho các công ty AI bên ngoài, "được xây dựng từ đầu cho các LLM hiện tại và tương lai trên toàn ngành."
Tốc Độ Phát Triển Kỷ Lục Nhờ Chính AI Của OpenAI
Tốc độ phát triển của Jalapeño là "chóng mặt" trong ngành bán dẫn: từ sơ đồ ban đầu đến sẵn sàng sản xuất chỉ trong 9 tháng, trong khi chu kỳ phát triển bộ xử lý mới thường tính bằng năm 🤯. Đáng chú ý, sự hợp tác giữa OpenAI và Broadcom mới chỉ được công bố vào tháng 10/2025.
Các công ty cho rằng tốc độ này là nhờ quy trình đồng phát triển phần mềm-phần cứng chuyên sâu, trong đó chính các mô hình của OpenAI đã được sử dụng tích cực để đẩy nhanh một phần thiết kế chip. Greg Brockman, Chủ tịch kiêm đồng sáng lập OpenAI, xác nhận trên CNBC rằng quá trình này dựa trên các mô hình OpenAI thế hệ trước, thậm chí không phải GPT-5.5 tiên tiến nhất.
Sau khi nhận được một mẫu vật lý sớm vào thứ Tư, OpenAI đã vạch ra kế hoạch triển khai các bộ xử lý này tại các trung tâm dữ liệu đang hoạt động vào cuối năm nay. Công ty cho biết họ đã bắt đầu thử nghiệm chạy ít nhất một mô hình thế hệ trước, GPT-5.3-Codex-Spark, trên chip này với khối lượng công việc sản xuất trong môi trường thử nghiệm.
Việc ra mắt Jalapeño đánh dấu sự mở rộng chiến lược lớn của nhà sáng tạo ChatGPT, khi họ nỗ lực xây dựng toàn bộ ngăn xếp tính toán cần thiết để làm cho AI tiên tiến nhanh hơn, đáng tin cậy hơn và dễ tiếp cận hơn.
Tất nhiên, vẫn còn nhiều câu hỏi chưa được giải đáp 🤔 — bao gồm hiệu suất của chip Jalapeño so với các đối thủ cạnh tranh trực tiếp, chi phí và khả năng sản xuất của nó. Tuy nhiên, các nguồn tin thân cận với công ty cho biết hiệu suất ban đầu (trớ trêu thay) là "xuất sắc." Trên X, chính Brockman đã viết rằng "Hiệu suất trên mỗi watt trông thật đáng kinh ngạc." ✨
Tại Sao OpenAI Lại Chế Tạo ASIC?
Để hiểu tại sao OpenAI lại lấn sân sang thiết kế chip, hãy nhìn vào kiến trúc. Jalapeño là một Mạch tích hợp chuyên dụng (ASIC). Không giống như GPU có thể xử lý nhiều loại khối lượng công việc, ASIC được tinh chỉnh cho các ứng dụng hẹp hơn, giúp nó rẻ hơn và hiệu quả hơn cho các tác vụ AI cụ thể, mặc dù kém linh hoạt hơn so với GPU kiểu Nvidia. Trong trường hợp của Jalapeño, OpenAI bắt đầu với một thiết kế sạch tập trung vào việc phục vụ LLM hiện đại, thay vì điều chỉnh một bộ tăng tốc rộng hơn.
Broadcom đóng góp công nghệ triển khai silicon và mạng lưới cốt lõi, bao gồm silicon mạng Tomahawk, còn Celestica hỗ trợ tích hợp bo mạch, giá đỡ và hệ thống. Mục tiêu là đưa chip đến gần hơn với hiệu suất thực tế tối đa trong các khối lượng công việc thực tế, không chỉ cải thiện các điểm chuẩn lý thuyết.
Động Lực Kinh Tế Đằng Sau Con Chip:
Tuy nhiên, bước đi của OpenAI vào phần cứng độc quyền không chỉ là cuộc tìm kiếm sự ưu việt về kỹ thuật; nó còn có thể làm cho kinh tế đơn vị cốt lõi của họ bền vững hơn nhiều. Các tài liệu tài chính được kiểm toán gần đây tiết lộ rằng OpenAI đã tạo ra 13,07 tỷ đô la doanh thu vào năm 2025, nhưng tổng chi phí hoạt động trong năm đã tăng vọt lên 34 tỷ đô la, dẫn đến lỗ hoạt động gần 20,92 tỷ đô la 💸. Thủ phạm chính đằng sau việc "chảy máu tiền" này là yêu cầu về điện toán thuần túy, mặc dù phần lớn có lẽ là do huấn luyện hơn là suy luận.
Chỉ riêng năm 2025, chi phí nghiên cứu và phát triển—chủ yếu do cơ sở hạ tầng cần thiết để huấn luyện và phục vụ các mô hình ngôn ngữ lớn—đã chiếm 19,18 tỷ đô la, tương đương khoảng 56% tổng chi tiêu của công ty. Hơn nữa, OpenAI được cho là đã trả cho Microsoft hơn 10,59 tỷ đô la chỉ riêng cho R&D và cơ sở hạ tầng điện toán vào năm ngoái.
Nếu OpenAI có thể giảm chi phí suy luận AI, họ có thể bù đắp một phần khoản lỗ đã chi cho các đợt huấn luyện tốn kém. "Bằng cách tự thiết kế nhiều phần hơn trong ngăn xếp, chúng tôi có thể phục vụ nhiều trí tuệ hơn với hiệu quả cao hơn và tiếp tục đẩy AI tiên tiến đến khả năng tiếp cận rộng rãi hơn," Brockman cho biết trong thông cáo của Broadcom.
Ý Nghĩa Với Nvidia và Các Nhà Cung Cấp Chip Khác Của OpenAI?
Việc giới thiệu Jalapeño ngay lập tức đặt ra câu hỏi về vị thế chiến lược của OpenAI trong thị trường bán dẫn và GPU cạnh tranh khốc liệt. Kể từ khi khởi động kỷ nguyên AI tạo sinh vào cuối năm 2022, OpenAI vẫn là một trong những khách hàng lớn nhất của Nvidia nhưng cũng nhận hàng tỷ đô la đầu tư từ hãng này và mở rộng hợp tác với các nhà sản xuất chip đối thủ khác để đáp ứng nhu cầu khổng lồ của mình.
* Nvidia: Vào tháng 2/2026, Nvidia hoàn tất khoản đầu tư trực tiếp 30 tỷ đô la vào OpenAI. Thỏa thuận này bao gồm việc triển khai 10 gigawatt hệ thống điện toán, sử dụng nền tảng Vera Rubin thế hệ tiếp theo của Nvidia. Các nguồn tin thân cận cho biết Nvidia sẽ vẫn là trung tâm đối với OpenAI, đặc biệt là về phía huấn luyện và phát triển mô hình. * Amazon Web Services (AWS): Trong cùng vòng gọi vốn tháng 2/2026, Amazon đầu tư 50 tỷ đô la vào OpenAI. Thỏa thuận này bao gồm cam kết để OpenAI tiêu thụ khoảng hai gigawatt năng lực điện toán Trainium độc quyền của AWS trong tám năm tới. * Advanced Micro Devices (AMD): OpenAI ký thỏa thuận với đối thủ chính của Nvidia, AMD, để sử dụng GPU AMD Instinct™ MI450 Series của hãng này. * Cerebras: Công ty cũng ký một thỏa thuận với Cerebras, nhà sản xuất chip AI đã thực hiện IPO vào tháng 5/2026.
Cuộc Đua Vũ Trang Silicon Toàn Cầu: OpenAI Tham Gia Cùng Các Ông Lớn Cơ Sở Hạ Tầng AI
Trước khi Jalapeño ra đời, OpenAI hoạt động với bất lợi cấu trúc rõ rệt so với các đế chế công nghệ tích hợp theo chiều dọc trên thế giới. Các gã khổng lồ công nghệ như Google (Tensor Processing Units - TPUs) và Amazon (Trainium) đã sử dụng chương trình silicon tùy chỉnh của riêng họ trong nhiều năm để xử lý các khối lượng công việc tính toán khổng lồ với biên lợi nhuận thấp hơn đáng kể.
Microsoft, nhà cung cấp đám mây chính và nhà tài trợ tài chính lớn nhất của OpenAI, cũng đã tích cực tham gia thị trường silicon chuyên biệt bằng cách ra mắt bộ tăng tốc Azure Maia 100 vào cuối năm 2023. Sau đó, Microsoft đã tăng cường nỗ lực này vào tháng 1/2026 bằng cách giới thiệu Maia 200, một "cường quốc" suy luận được xây dựng trên quy trình 3 nanometer của TSMC, hiện đang cung cấp năng lượng cho các mô hình GPT-5.2 của OpenAI trong các trung tâm dữ liệu Azure.
Tương tự, Meta đã mở rộng danh mục Meta Training and Inference Accelerator (MTIA) của mình trong những năm gần đây, ra mắt các dòng MTIA 300, 400, 450 và 500 để cung cấp năng lượng cho các công cụ đề xuất và tính năng trí tuệ nhân tạo tạo sinh của mình mà không chỉ dựa vào Nvidia.
Jalapeño mang đến cho OpenAI cơ hội để sánh ngang và bù đắp lợi thế của các hyperscaler. Bằng cách tích hợp kiến trúc phần mềm trực tiếp vào một bộ xử lý độc quyền, OpenAI có cơ hội tái tạo, ít nhất là một phần, chiến lược của Google, Amazon, Microsoft và Meta — chuyển từ một khách hàng đám mây phụ thuộc thành một nhà cung cấp cơ sở hạ tầng AI độc lập hơn 💪.
Thời điểm này rất chín muồi trong bối cảnh cuộc đua vũ trang silicon toàn cầu đang leo thang nhanh chóng. Được thúc đẩy một phần bởi các hạn chế xuất khẩu của Hoa Kỳ, các ông lớn công nghệ Trung Quốc cũng đang theo đuổi phần cứng chip AI tùy chỉnh của riêng họ:
* Vào tháng 5, bộ phận bán dẫn của Alibaba, T-Head, đã ra mắt Zhenwu M890, một bộ xử lý độc quyền được thiết kế rõ ràng cho các tác nhân AI tự chủ đòi hỏi băng thông bộ nhớ lớn và cửa sổ ngữ cảnh dài. * Huawei được cho là đang chuẩn bị phát hành chip Ascend 950DT mới vào tháng tới. * ByteDance, công ty mẹ của TikTok, được cho là đã bắt đầu đàm phán tích cực với Qualcomm vào tháng 6/2026 để thiết kế các mạch tích hợp chuyên dụng tùy chỉnh cho các trung tâm dữ liệu của mình nhằm thoát khỏi sự phụ thuộc vào bên thứ ba.
Việc hoàn thiện thiết kế Jalapeño cho thấy OpenAI đang tìm cách vượt ra ngoài giới hạn truyền thống của một phòng thí nghiệm phần mềm để sánh vai với các cường quốc đám mây và cơ sở hạ tầng quốc tế.
Tương Lai Gigawatt:
Mạng lưới thỏa thuận rộng lớn này làm nổi bật quy mô tham vọng cơ sở hạ tầng khổng lồ của OpenAI. Mục tiêu cuối cùng của sự hợp tác OpenAI và Broadcom là triển khai các trung tâm dữ liệu quy mô gigawatt với Microsoft và các đối tác khác bắt đầu vào năm 2026 — tức là các trung tâm dữ liệu với năng lực tính toán đòi hỏi năng lượng ngang với cả một thành phố 🏙️⚡.
Đối với Broadcom, mối quan hệ đối tác này là một chất xúc tác danh tiếng khổng lồ. Công ty này đã nằm trong số những người hưởng lợi lớn nhất từ sự bùng nổ AI tạo sinh, giúp các hyperscaler và phòng thí nghiệm tiên phong thiết kế silicon tùy chỉnh. Cổ phiếu Broadcom phản ánh động lực này, cho thấy mức tăng 18% so với cùng kỳ năm trước vào đầu năm 2026 và mức tăng gần 7 lần kể từ cuối năm 2022.
Cuối cùng, Jalapeño xác nhận rằng OpenAI tin rằng họ đã sẵn sàng vượt ra khỏi phần mềm và mã để tiến vào lĩnh vực phần cứng tùy chỉnh trong thế giới thực. Bằng cách kiểm soát vật lý của đường ống suy luận của mình — đồng thời tận dụng vốn và phần cứng của Nvidia, Amazon, AMD và Cerebras — OpenAI đang cố gắng nhanh chóng viết lại kinh tế đơn vị tương lai của AI.