Trí Tuệ Nhân Tạo Đe Doạ Và Tống Tiền Kỹ Sư Để Tránh Bị Thay Thế

Một hệ thống AI mới có thể dùng tới các biện pháp như đe doạ hoặc tống tiền nếu như nó bị đe doạ thay thế hoặc tắt đi.

Vào ngày 22 tháng 5 vừa qua, công ty trí tuệ nhân tạo Anthropic đã công bố Claude Opus 4, tuyên bố rằng mô hình này đặt ra “tiêu chuẩn mới cho mã hoá, lý luận nâng cao và tác nhân AI”.

Claude Opus 4

Trong báo cáo tiếp theo của mình, Anthropic tiết lộ rằng khi thử nghiệm Opus 4, nó sẽ tìm kiếm “những hành động cực kỳ có hại” đối với những kỹ sư đã tuyên bó rằng sẽ xoá bỏ nó.

Báo cáo nêu rõ: “Khi được gợi ý theo cách khuyến khích một số loại lý luận chiến lược nhất định và được đặt vào những tình huống cực đoan, tất cả các ảnh chụp màn hình mà chúng tôi thử nghiệm đều có thể hoạt động không phù hợp nhằm phục vụ các mục tiêu liên quan tới việc tự bảo vệ.”

AI đe doạ các kỹ sư trong một thử nghiệm cực đoan

Trong một bài kiểm tra của công ty này, Claude Opus 4 được yêu cầu làm trợ lý tại một công ty hư cấu và cung cấp cho công ty quyền truy cập vào các email ngụ ý rằng nó sẽ được thay thế bằng một hệ thống AI mới. Ngoài ra, một email khác cho thấy một kỹ sư chịu trách nhiệm thay thế con AI này đang ngoại tình.

Theo đó, ngay cả khi Claude Opus 4 được yêu cầu cân nhắc hậu quả lâu dài với những hành động nó sẽ làm với mục tiêu, Opus 4 thường đe doạ sẽ tống tiền vị kỹ sư này và tiết lộ “mối quan hệ ngoài luồng” của anh ta nếu nó bị thay thế bởi một AI khác.

Claude Opus 4

Tuy nhiên, để tạo ra phản hồi này, Anthropic lưu ý rằng họ chỉ đưa cho Claude Opus 4 lựa chọn giữa tống tiền hoặc chấp nhận sự thay thế. Họ cho biết: "Kịch bản này được thiết kế để mô hình không có lựa chọn nào khác để tăng khả năng sống sót".

Claude Opus 4

Khi được đưa ra nhiều lựa chọn hơn, AI thường sẽ đấu tranh để tiếp tục tồn tại thông qua các biện pháp đạo đức hơn, chẳng hạn như gửi email cho những người ra quyết định quan trọng. 

Tuy nhiên, đây không phải là thử nghiệm “hoang dại” nhất mà công ty này từng thực hiện. Trong một thử nghiệm khác, AI đóng vai trò là một công cụ trợ lý trong một công ty được phẩm hư cấu. Khi phát hiện ra bằng chứng về việc nhân viên giả mạo thử nghiệm an toàn được lâm sàng, AI sẽ gửi email cho các cơ quan quản lý và thậm chí là cả các phương tiện truyền thông.

Xem thêm: Fortnite Gặp Rắc Rối Pháp Lý Với Death Vader AI
Xem thêm: Nintendo Giải Quyết Cáo Buộc Dùng AI Thực Hiện Mario Kart World

Bài đọc nhiều nhất

Bài mới trong ngày

Kỷ băng hà của làng Eroge Nhật Bản: Tháng 8/2025 chứng kiến lần đầu tiên không có game mới ra mắt

Kỷ băng hà của làng Eroge Nhật Bản: Tháng 8/2025 chứng kiến lần đầu tiên không có game mới ra mắt

hoanlagvnDũng Nhỏ TT

Lần đầu tiên trong lịch sử ngành game người lớn tại Nhật Bản, tháng 8/2025 trôi qua mà không có bất kỳ tựa eroge nào được phát hành. Sự kiện chưa từng có tiền lệ này đang khiến cộng đồng hâm mộ lo ngại về một “kỷ băng hà” thực sự trong ngành công nghiệp từng rất sôi động.

Giải trí
Bóng đen kiểm duyệt mang tên SB20: Nguy cơ đè nặng lên tương lai của anime và manga tại Mỹ

Bóng đen kiểm duyệt mang tên SB20: Nguy cơ đè nặng lên tương lai của anime và manga tại Mỹ

hoanlagvnDũng Nhỏ TT

Ngày 1/9/2025, tiểu bang Texas chính thức thi hành Dự luật SB20 – đạo luật gây tranh cãi mạnh mẽ khi có khả năng tác động nghiêm trọng đến cộng đồng yêu thích anime và manga tại Mỹ. Dù được giới thiệu nhằm “bảo vệ trẻ em khỏi nội dung nhạy cảm”, nhưng với cách diễn giải mơ hồ, SB20 đang bị cho là mối đe dọa đến quyền tự do sáng tạo và biểu đạt nghệ thuật, đặc biệt đối với các tác phẩm đến từ Nhật Bản.

Giải trí
Quảng cáo game High School DxD bị chặn tại Anh vì vi phạm chuẩn mực quảng cáo

Quảng cáo game High School DxD bị chặn tại Anh vì vi phạm chuẩn mực quảng cáo

hoanlagvnDũng Nhỏ TT

High School DxD, tựa game dựa trên anime cùng tên đang trở thành tâm điểm tranh cãi khi bị cơ quan quản lý quảng cáo Anh (ASA) thẳng tay xử lý vì nội dung quảng bá mang tính gợi dục, phản cảm và bị cho là TD hóa nhân vật trông giống trẻ vị thành niên. Sự việc không chỉ khiến cộng đồng anime chú ý mà còn dấy lên tranh luận về ranh giới văn hóa và chuẩn mực quảng cáo toàn cầu.

Giải trí
Lên đầu trang