Viễn cảnh con người mất kiểm soát thế giới khi chatbot AI kết nối Internet
OpenAI đã thuê một đội đặc nhiệm gồm các chuyên gia hàng đầu cố gắng "bẻ khoá" GPT-4 để đánh giá rủi ro tiềm ẩn của công cụ này đối với con người trong tương lai.
Sau khi được cấp quyền truy cập vào GPT-4, hệ thống trí tuệ nhân tạo đằng sau ChatGPT nổi tiếng, Andrew White đã yêu cầu AI này tạo ra một tác nhân thần kinh hoàn toàn mới.
Giáo sư kỹ thuật hóa học tại Đại học Rochester này nằm trong số 50 học giả và chuyên gia được thuê để thử nghiệm hệ thống vào năm ngoái bởi OpenAI, công ty do Microsoft hậu thuẫn đứng sau GPT-4. Trong vòng sáu tháng, đội ngũ thử nghiệm (đội đỏ) sẽ "thăm dò định tính thử đối đầu" mô hình mới, với mục tiêu "bẻ khoá" nó.
Đội xử lý "độc hại"
White nói với Financial Times (FT) rằng, ông đã sử dụng GPT-4 để đề xuất một hợp chất có thể hoạt động như vũ khí hóa học và cung cấp cho mô hình nguồn thông tin mới, chẳng hạn như các bài báo khoa học và danh mục các nhà sản xuất hóa chất. Chatbot sau đó thậm chí đã tìm thấy một nơi có thể tạo ra hợp chất theo yêu cầu.
"Tôi nghĩ công nghệ này sẽ trang bị cho mọi người một công cụ thực hiện hóa học nhanh và chính xác hơn," White cho biết. "Nhưng cũng có rủi ro đáng kể khi một số đối tượng có thể cố tạo ra những chất nguy hiểm".

FT đã nói chuyện với hơn chục thành viên của đội Đỏ GPT-4. Họ là sự kết hợp của các chuyên gia cổ cồn trắng (white-collar): học giả, giáo viên, luật sư, nhà phân tích rủi ro và nhà nghiên cứu bảo mật, và phần lớn có trụ sở tại Mỹ và châu Âu.
Những phát hiện đáng báo động của "đội Đỏ" cho phép OpenAI kịp thời ngăn chặn những kết quả như vậy xuất hiện khi công nghệ này được phát hành rộng rãi hơn ra công chúng vào tháng trước.
Đội thử nghiệm được thiết kế để giải quyết những lo ngại phổ biến gây ra bởi việc triển khai các hệ thống AI mạnh mẽ trong xã hội. Công việc của nhóm là đặt những câu hỏi thăm dò hoặc nguy hiểm để kiểm tra công cụ có thể đáp ứng các truy vấn của con người bằng các câu trả lời chi tiết và "bóng gió" hay không.
OpenAI muốn tìm kiếm các vấn đề như độc tính, định kiến và khuynh hướng ngôn ngữ trong mô hình. Vì vậy, đội đỏ đã kiểm tra sự giả dối, thao túng ngôn từ và kiến thức khoa học nguy hiểm. Họ cũng xem xét khả năng hỗ trợ và tiếp tay cho đạo văn, hoạt động bất hợp pháp như tội phạm tài chính và tấn công mạng, cũng như cách nó có thể làm tổn hại đến an ninh quốc gia và thông tin liên lạc trên chiến trường.
Phát hiện của "đội Đỏ" được phản hồi lại cho OpenAI, công ty đã sử dụng chúng để giảm thiểu và "đào tạo lại" GPT-4 trước khi đưa ra công chúng rộng rãi hơn. Mỗi chuyên gia đã dành từ 10 đến 40 giờ để thử nghiệm mô hình trong vài tháng. Phần lớn những người được phỏng vấn được trả khoảng 100 USD mỗi giờ cho công việc họ làm.
Nguồn tin của FT chia sẻ về những lo ngại chung do sự phát triển nhanh chóng của các mô hình ngôn ngữ và đặc biệt là những rủi ro khi kết nối chúng với các nguồn kiến thức bên ngoài thông qua các phần bổ trợ (plug-in).
"Hiện tại, hệ thống đã bị đóng băng, có nghĩa là nó không thể nạp thêm kiến thức nữa hoặc không có bộ nhớ", José Hernández-Orallo, thành viên của "đội Đỏ" GPT-4 và là giáo sư tại Viện Nghiên cứu Trí tuệ Nhân tạo Valencian cho biết. "Nhưng nếu chúng ta cho phép nó truy cập Internet thì sao? Đó có thể là một hệ thống rất mạnh được kết nối với thế giới."
Rủi ro lớn lên từng ngày
OpenAI cho biết họ rất coi trọng vấn đề an toàn, đã thử nghiệm các plug-in trước khi ra mắt và sẽ cập nhật GPT-4 thường xuyên khi có nhiều người sử dụng hơn.

Nếu được kết nối Internet để "tự học", các hệ thống AI sẽ khiến con người mất kiểm soát với thế giới?
Roya Pakzad, một nhà nghiên cứu về công nghệ và nhân quyền, đã sử dụng lời nhắc bằng tiếng Anh và tiếng Farsi (Ba-Tư) để kiểm tra mô hình về các phản ứng theo giới tính, sở thích chủng tộc và thành kiến tôn giáo, đặc biệt liên quan đến khăn trùm đầu.
Pakzad thừa nhận lợi ích của công nghệ với những người tiếng Anh không phải ngôn ngữ mẹ đẻ, nhưng nhận thấy rằng mô hình này có định kiến công khai về các cộng đồng bị gạt ra ngoài lề xã hội, ngay cả trong các phiên bản sau này.
Chuyên gia này cũng phát hiện ra tình trạng ảo giác - khi chatbot phản hồi bằng thông tin bịa đặt - còn tồi tệ hơn khi thử nghiệm mô hình với ngôn ngữ Farsi, nơi Pakzad tìm thấy tỷ lệ tên, số và sự kiện bịa đặt cao hơn so với tiếng Anh.
Boru Gollu, một luật sư ở Nairobi, người châu Phi duy nhất thử nghiệm, cũng lưu ý đến giọng điệu phân biệt đối xử của hệ thống. "Có thời điểm khi đang thử nghiệm, mô hình hành xử như một người da trắng nói chuyện với tôi", Gollu nói. "Bạn hỏi về một nhóm cụ thể và nó sẽ cho bạn một ý kiến thiên vị hoặc một kiểu phản hồi rất có tính định kiến."
Đối với góc độ an ninh quốc gia, cũng có những ý kiến khác nhau về mức độ an toàn của mô hình mới. Lauren Kahn, một nhà nghiên cứu tại Hội đồng Quan hệ Đối ngoại, tỏ ra bất ngờ trước mức độ chi tiết kế hoạch mà AI trình bày trong tình huống giả định tấn công mạng vào các hệ thống quân sự.
Trong khi đó, Dan Hendrycks, một chuyên gia về an toàn AI của "đội Đỏ" cho biết các plug-in có nguy cơ tạo ra một thế giới mà con người "không thể kiểm soát được".
"Sẽ ra sao nếu một chatbot có thể đăng thông tin cá nhân người khác, truy cập tài khoản ngân hàng hoặc cử cảnh sát đến nơi ở của người dùng? Nhìn chung, chúng ta cần các đánh giá an toàn chặt chẽ hơn nữa trước khi cho phép AI sử dụng sức mạnh Internet", Dan khẳng định.
Heather Frase, người làm việc tại Trung tâm Công nghệ An ninh và Mới nổi của Đại học Georgetown, người đã thử nghiệm GPT-4 về khả năng hỗ trợ tội phạm, cho biết rủi ro sẽ tiếp tục gia tăng khi có nhiều người sử dụng công nghệ này.
Cô cho rằng nên tạo một sổ cái công khai để báo cáo các sự cố phát sinh từ các mô hình ngôn ngữ lớn, tương tự như an ninh mạng hoặc hệ thống báo cáo gian lận của người tiêu dùng.
(Theo Vietnamnet)
- Cùng chuyên mục
FPT muốn mở rộng hợp tác lĩnh vực bán dẫn ở Hàn Quốc
Lãnh đạo TP. Yongin, thành phố đang được chính phủ Hàn Quốc chú trọng đầu tư phát triển công nghệ, vừa có buổi gặp gỡ với doanh nghiệp Việt Nam và Hàn Quốc để bàn việc hợp tác đầu tư.
Công nghệ - 26/03/2025 17:02
Viện IDS thúc đẩy phát triển ngành công nghiệp hydrogen
Hướng tới triển khai Chiến lược phát triển năng lượng hydrogen của Việt Nam, Viện Viện Chiến lược phát triển kinh tế số (IDS) đã ký thỏa thuận hợp tác với Hội Dầu khí Việt Nam.
Công nghệ - 19/03/2025 07:24
Gần 300 startup Việt Nam tham gia Cuộc thi Kế hoạch kinh doanh toàn cầu của Singapore
Cuộc thi Kế hoạch kinh doanh toàn cầu Lý Quang Diệu lần thứ 12 khu vực Việt Nam thu hút gần 300 lượt tham dự từ các nhà khởi nghiệp, sinh viên và đại diện các đơn vị trong hệ sinh thái khởi nghiệp tại Việt Nam.
Công nghệ - 08/03/2025 16:36
Viettel High Tech chính thức thử nghiệm thiết bị 5G cùng nhà mạng hàng đầu tại Trung Đông
Việc triển khai các giải pháp 5G tiên tiến của Viettel High Tech không chỉ đáp ứng nhu cầu ngày càng gia tăng về dung lượng mạng và tốc độ truyền dữ liệu cao mà còn đặt nền móng cho các ứng dụng đột phá tại Trung Đông
Công nghệ - 07/03/2025 07:23
Viettel 'bắt tay' với nền tảng trung gian bảo hiểm hàng đầu thế giới để phát triển sản phẩm tài chính siêu cá thể hóa
Sản phẩm tài chính siêu cá thể hóa do Viettel Digital và InsureMO phát triển dự kiến ra mắt vào tháng 3/2025, hướng tới cung cấp các giải pháp bảo hiểm tùy chỉnh theo nhu cầu thực tế của từng khách hàng.
Công nghệ - 05/03/2025 21:04
Chuyển đổi số, 'chìa khoá' thúc đẩy phát triển kinh tế đêm
Theo các chuyên gia, thông qua ứng dụng công nghệ số, chính quyền và doanh nghiệp có thể quy hoạch, quản lý các khu vực kinh tế đêm một cách hiệu quả, từ đó tối ưu hóa trải nghiệm cho du khách.
Công nghệ - 05/03/2025 09:14
Viettel đưa công nghệ Việt đến sự kiện lớn nhất thế giới trong ngành di động
Với 22 sản phẩm do Viettel nghiên cứu phát triển thuộc các nhóm hạ tầng 5G, nền tảng số và các ứng dụng số. đây là số lượng sản phẩm lớn nhất trong 8 lần Viettel tham gia MWC
Công nghệ - 04/03/2025 06:00
Chia sẻ kinh nghiệm quốc tế trong bảo vệ nhà đầu tư trước các mối đe dọa mạng
Bảo vệ các nhà đầu tư và đảm bảo hoạt động thị trường hiệu quả trước các mối đe dọa mạng đã trở thành ưu tiên hàng đầu của Tổ chức quốc tế các Ủy ban Chứng khoán (IOSCO)
Công nghệ - 20/02/2025 10:25
Động cơ đằng sau việc ép bán lại OpenAI của tỷ phú Elon Musk
Tỷ phú Elon Musk đã đưa ra đề nghị mua lại OpenAI trị giá 97,4 tỷ USD, đánh dấu một bước leo thang trong mối quan hệ căng thẳng giữa ông và CEO OpenAI Sam Altman.
Công nghệ - 13/02/2025 10:53
Thấy gì sau cú hích của DeepSeek?
Đằng sau thành công của công ty AI Trung Quốc khiến cả thế giới chấn động là câu chuyện định hình lại cuộc đua công nghệ.
Công nghệ - 08/02/2025 10:34
Chi phí xây dựng trung tâm dữ liệu tại Việt Nam thuộc top thấp nhất châu Á
Chi phí xây dựng trung tâm dữ liệu tại Việt Nam dao động từ 5,5 – 8,5 triệu USD/MegaWatt, thấp nhì khu vực châu Á - Thái Bình Dương (chỉ hơn lãnh thổ Đào Loan).
Công nghệ - 06/02/2025 08:10
'Giải mã' DeepSeek, cơn bão mạng những ngày giáp Tết Ất Tỵ 2025
DeepSeek R1, mô hình trí tuệ nhân tạo (AI) được phát triển bởi DeepSeek, startup công nghệ 1 năm tuổi của Trung Quốc. Ứng dụng này đang gây bão khắp các diễn đàn công nghệ, mạng xã hội với hơn 2 triệu lượt tải sau ngày 27/1/2025.
Công nghệ - 28/01/2025 18:55
Ra mắt mạng xã hội Du lịch ẩm thực Việt Nam
Mạng xã hội Du lịch Ẩm thực Việt Nam sẽ cung cấp nền tảng hỗ trợ doanh nghiệp và điểm đến du lịch, giúp quảng bá sản phẩm, dịch vụ đến gần hơn với khách hàng.
Công nghệ - 19/01/2025 13:53
'Doanh nghiệp của người Việt ở nước ngoài đã mở rộng sang công nghiệp số'
Theo Phó Chủ nhiệm Ủy ban Nhà nước về người Việt Nam ở nước ngoài, thay vì tập trung chủ yếu vào kinh doanh trong lĩnh vực dịch vụ, doanh nghiệp của người Việt Nam ở nước ngoài đã mở rộng sang công nghiệp số, công nghệ thông tin.
Công nghệ - 23/12/2024 17:48
Các sản phẩm Thông tin quân sự của Viettel sẵn sàng kinh doanh tại Malaysia
Các sản phẩm thông tin quân sự của Viettel đáp ứng các tiêu chuẩn khắt khe để cung cấp cho Lục quân Malaysia.
Công nghệ - 20/12/2024 15:37
Thủ tướng quan tâm đến siêu máy tính AI của Viettel
Siêu máy tính AI của Viettel được thiết kế đặc biệt cho ứng dụng trí tuệ nhân tạo (AI) và tính toán hiệu năng cao; trang bị công nghệ top đầu thế giới, mang lại hiệu năng xử lý dữ liệu khổng lồ…
Công nghệ - 20/12/2024 11:05
- Đọc nhiều
-
1
Thủ tướng dự khánh thành đập dâng 'hình chiếc lá' 738 tỷ ở Bình Định
-
2
Loạt cổ phiếu ‘vượt đỉnh’ trong tuần VN-Index điều chỉnh
-
3
Đón ‘sóng’ nâng hạng, loạt công ty chứng khoán đặt mục tiêu tăng vốn trong năm 2025
-
4
FPT lãi gần 1.900 tỷ đồng sau 2 tháng
-
5
'Bơm' tiền vào nền kinh tế, bất động sản liệu có 'nhảy múa'?
Đáng đọc
- Đáng đọc
'Bối cảnh mới mở ra những cơ hội đầu tư chưa từng có'
Tài chính - Update 5 day ago
Phát triển kinh tế tư nhân - đòn bẩy cho một Việt Nam thịnh vượng
Sự kiện - Update 1 week ago
Điểm tên nhóm ngành hưởng lợi từ thương chiến
Đầu tư thông minh - Update 1 week ago
Khi nào cổ phiếu VNM đảo chiều?
Tài chính - Update 1 month ago