Microsoft đã sử dụng GPU Nvidia A100, trị giá hàng trăm triệu USD và hiện đang nâng cấp lên H100 cho ChatGPT.
Theo Bloomberg, OpenAI đã đào tạo ChatGPT trên một siêu máy tính được Microsoft xây dựng từ hàng chục nghìn GPU Nvidia A100. Microsoft dự kiến sẽ tiết lộ một mô hình AI mới sử dụng GPU H100 của Nvidia trong tuần này.
Thách thức mà Microsoft phải đối mặt bắt đầu vào năm 2019 sau khi công ty đầu tư 1 tỷ USD và đồng ý xây dựng một siêu máy tính AI cho OpenAI. Tuy nhiên, Microsoft không có phần cứng nội bộ cho những gì OpenAI cần.
Xem thêm: Microsoft ấn định thời gian ra mắt GPT- 4, AI có thể tạo video bằng văn bản
Sau khi mua lại chip của Nvidia, Microsoft buộc công ty phải tính toán đến cách sắp xếp máy chủ trên giá đỡ để đảm bảo nguồn điện không bị quá tải. Dù không tiết lộ chính xác chi phí cho dự án này, nhưng theo ông Scott Guthrie, phó chủ tịch về đám mây và AI của Microsoft, con số này có thể còn lớn hơn mức vài trăm triệu USD.
Việc chạy lượng lớn A100 cùng một lúc, buộc Redmond phải xem xét cách lắp đặt và nguồn điện. Bên cạnh đó, hệ thống phải được phát triển một phần mềm mới để tăng hiệu quả, đảm bảo thiết bị mạng có thể chịu được dữ liệu khổng lồ, hệ thống làm mát,... mọi bộ phận, mọi linh kiện phải ở vị trí hợp lý để việc vận hành diễn ra ổn định.
Hệ thống được Microsoft xây dựng để huấn luyện nên ChatGPT giờ đang được sử dụng để huấn luyện và vận hành các mô hình AI lớn khác, bao gồm chatbot Bing Chat mới được giới thiệu tháng trước. Bên cạnh đó, Microsoft còn bán hệ thống này cho các công ty khác để họ huấn luyện các mô hình của riêng mình.
Xem thêm: Microsoft phát triền thành công công cụ AI mới, có khả năng "giả" giọng con người
Kể từ thành công của ChatGPT vào đầu năm nay, Microsoft và một số đối thủ khác đã bắt đầu làm việc trên các mô hình AI song song cho các công cụ tìm kiếm và các ứng dụng khác. Để tăng tốc độ AI của mình, công ty đã giới thiệu máy ảo ND H100 v5, một máy ảo có thể sử dụng từ tám đến hàng nghìn GPU Nvidia H100.
Nvidia dự kiến sẽ tiết lộ thêm về các sản phẩm AI trong tương lai tại Hội nghị Công nghệ GPU (GTC). với bài thuyết trình quan trọng vào ngày 21 tháng 3. Ngày 16 tháng 3 tới đây, Microsoft sẽ cho ra mắt phiên bản mới trang bị GPU H100, GPT-4 mạnh hơn nhiều phiên bản hiện tại với những tính năng mới, bao gồm tạo video bằng văn bản.