Viễn cảnh con người mất kiểm soát thế giới khi chatbot AI kết nối Internet

THẾ VINH

07:51 16/04/2023

OpenAI đã thuê một đội đặc nhiệm gồm các chuyên gia hàng đầu cố gắng "bẻ khoá" GPT-4 để đánh giá rủi ro tiềm ẩn của công cụ này đối với con người trong tương lai.

Sau khi được cấp quyền truy cập vào GPT-4, hệ thống trí tuệ nhân tạo đằng sau ChatGPT nổi tiếng, Andrew White đã yêu cầu AI này tạo ra một tác nhân thần kinh hoàn toàn mới.

Giáo sư kỹ thuật hóa học tại Đại học Rochester này nằm trong số 50 học giả và chuyên gia được thuê để thử nghiệm hệ thống vào năm ngoái bởi OpenAI, công ty do Microsoft hậu thuẫn đứng sau GPT-4. Trong vòng sáu tháng, đội ngũ thử nghiệm (đội đỏ) sẽ "thăm dò định tính thử đối đầu" mô hình mới, với mục tiêu "bẻ khoá" nó.

Đội xử lý "độc hại"

White nói với Financial Times (FT) rằng, ông đã sử dụng GPT-4 để đề xuất một hợp chất có thể hoạt động như vũ khí hóa học và cung cấp cho mô hình nguồn thông tin mới, chẳng hạn như các bài báo khoa học và danh mục các nhà sản xuất hóa chất. Chatbot sau đó thậm chí đã tìm thấy một nơi có thể tạo ra hợp chất theo yêu cầu.

"Tôi nghĩ công nghệ này sẽ trang bị cho mọi người một công cụ thực hiện hóa học nhanh và chính xác hơn," White cho biết. "Nhưng cũng có rủi ro đáng kể khi một số đối tượng có thể cố tạo ra những chất nguy hiểm".

dff20707-1167-4504-812c-9e8be487 — FT đã nói chuyện với hơn chục thành viên của đội Đỏ GPT-4. Họ là sự kết hợp của các chuyên gia cổ cồn trắng (white-collar): học giả, giáo viên, luật sư, nhà phân tích rủi ro và nhà nghiên cứu bảo mật, và phần lớn có trụ sở tại Mỹ và châu Âu.

Những phát hiện đáng báo động của "đội Đỏ" cho phép OpenAI kịp thời ngăn chặn những kết quả như vậy xuất hiện khi công nghệ này được phát hành rộng rãi hơn ra công chúng vào tháng trước.

Đội thử nghiệm được thiết kế để giải quyết những lo ngại phổ biến gây ra bởi việc triển khai các hệ thống AI mạnh mẽ trong xã hội. Công việc của nhóm là đặt những câu hỏi thăm dò hoặc nguy hiểm để kiểm tra công cụ có thể đáp ứng các truy vấn của con người bằng các câu trả lời chi tiết và "bóng gió" hay không.

OpenAI muốn tìm kiếm các vấn đề như độc tính, định kiến và khuynh hướng ngôn ngữ trong mô hình. Vì vậy, đội đỏ đã kiểm tra sự giả dối, thao túng ngôn từ và kiến thức khoa học nguy hiểm. Họ cũng xem xét khả năng hỗ trợ và tiếp tay cho đạo văn, hoạt động bất hợp pháp như tội phạm tài chính và tấn công mạng, cũng như cách nó có thể làm tổn hại đến an ninh quốc gia và thông tin liên lạc trên chiến trường.

Phát hiện của "đội Đỏ" được phản hồi lại cho OpenAI, công ty đã sử dụng chúng để giảm thiểu và "đào tạo lại" GPT-4 trước khi đưa ra công chúng rộng rãi hơn. Mỗi chuyên gia đã dành từ 10 đến 40 giờ để thử nghiệm mô hình trong vài tháng. Phần lớn những người được phỏng vấn được trả khoảng 100 USD mỗi giờ cho công việc họ làm.

Nguồn tin của FT chia sẻ về những lo ngại chung do sự phát triển nhanh chóng của các mô hình ngôn ngữ và đặc biệt là những rủi ro khi kết nối chúng với các nguồn kiến thức bên ngoài thông qua các phần bổ trợ (plug-in).

"Hiện tại, hệ thống đã bị đóng băng, có nghĩa là nó không thể nạp thêm kiến thức nữa hoặc không có bộ nhớ", José Hernández-Orallo, thành viên của "đội Đỏ" GPT-4 và là giáo sư tại Viện Nghiên cứu Trí tuệ Nhân tạo Valencian cho biết. "Nhưng nếu chúng ta cho phép nó truy cập Internet thì sao? Đó có thể là một hệ thống rất mạnh được kết nối với thế giới."

Rủi ro lớn lên từng ngày

OpenAI cho biết họ rất coi trọng vấn đề an toàn, đã thử nghiệm các plug-in trước khi ra mắt và sẽ cập nhật GPT-4 thường xuyên khi có nhiều người sử dụng hơn.

a5617ca-1671320365088-chatgpt-humaine-dark-1409 — Nếu được kết nối Internet để "tự học", các hệ thống AI sẽ khiến con người mất kiểm soát với thế giới?

Roya Pakzad, một nhà nghiên cứu về công nghệ và nhân quyền, đã sử dụng lời nhắc bằng tiếng Anh và tiếng Farsi (Ba-Tư) để kiểm tra mô hình về các phản ứng theo giới tính, sở thích chủng tộc và thành kiến tôn giáo, đặc biệt liên quan đến khăn trùm đầu.

Pakzad thừa nhận lợi ích của công nghệ với những người tiếng Anh không phải ngôn ngữ mẹ đẻ, nhưng nhận thấy rằng mô hình này có định kiến công khai về các cộng đồng bị gạt ra ngoài lề xã hội, ngay cả trong các phiên bản sau này.

Chuyên gia này cũng phát hiện ra tình trạng ảo giác - khi chatbot phản hồi bằng thông tin bịa đặt - còn tồi tệ hơn khi thử nghiệm mô hình với ngôn ngữ Farsi, nơi Pakzad tìm thấy tỷ lệ tên, số và sự kiện bịa đặt cao hơn so với tiếng Anh.

Boru Gollu, một luật sư ở Nairobi, người châu Phi duy nhất thử nghiệm, cũng lưu ý đến giọng điệu phân biệt đối xử của hệ thống. "Có thời điểm khi đang thử nghiệm, mô hình hành xử như một người da trắng nói chuyện với tôi", Gollu nói. "Bạn hỏi về một nhóm cụ thể và nó sẽ cho bạn một ý kiến thiên vị hoặc một kiểu phản hồi rất có tính định kiến."

Đối với góc độ an ninh quốc gia, cũng có những ý kiến khác nhau về mức độ an toàn của mô hình mới. Lauren Kahn, một nhà nghiên cứu tại Hội đồng Quan hệ Đối ngoại, tỏ ra bất ngờ trước mức độ chi tiết kế hoạch mà AI trình bày trong tình huống giả định tấn công mạng vào các hệ thống quân sự.

Trong khi đó, Dan Hendrycks, một chuyên gia về an toàn AI của "đội Đỏ" cho biết các plug-in có nguy cơ tạo ra một thế giới mà con người "không thể kiểm soát được".

"Sẽ ra sao nếu một chatbot có thể đăng thông tin cá nhân người khác, truy cập tài khoản ngân hàng hoặc cử cảnh sát đến nơi ở của người dùng? Nhìn chung, chúng ta cần các đánh giá an toàn chặt chẽ hơn nữa trước khi cho phép AI sử dụng sức mạnh Internet", Dan khẳng định.

Heather Frase, người làm việc tại Trung tâm Công nghệ An ninh và Mới nổi của Đại học Georgetown, người đã thử nghiệm GPT-4 về khả năng hỗ trợ tội phạm, cho biết rủi ro sẽ tiếp tục gia tăng khi có nhiều người sử dụng công nghệ này.

Cô cho rằng nên tạo một sổ cái công khai để báo cáo các sự cố phát sinh từ các mô hình ngôn ngữ lớn, tương tự như an ninh mạng hoặc hệ thống báo cáo gian lận của người tiêu dùng.

(Theo Vietnamnet)

Bài liên quan

Ông Nguyễn Tử Quảng ký tên cùng Elon Musk kêu gọi tạm ngừng phát triển ChatGPT phiên bản 4

OpenAI ra mắt 'siêu AI' GPT-4 giúp ChatGPT nhận diện, phân tích hình ảnh

Windows 11 tích hợp ChatGPT

Gần 500 doanh nghiệp TP.HCM đã dùng ChatGPT thay thế nhân sự

Tags:

Tags:

Cùng chuyên mục

Khi dữ liệu trở thành 'mỏ vàng' mới của ngành môi trường

Hàng triệu điểm dữ liệu về không khí, nguồn nước, năng lượng và phát thải đang được tạo ra mỗi ngày. Nhưng giá trị thực sự không nằm ở việc thu thập dữ liệu, mà ở khả năng biến dữ liệu thành quyết định. Trong cuộc đua chuyển đổi xanh, AI đang nổi lên như "bộ não" mới của doanh nghiệp và đô thị, giúp dự báo rủi ro, tối ưu tài nguyên và thay đổi cách quản lý môi trường truyền thống.

Công nghệ - 02/07/2026 17:29

Chủ tịch FPT: Công nghệ là cầu nối cho giai đoạn phát triển mới của ASEAN

Trong khuôn khổ chuyến thăm chính thức Việt Nam của Thủ tướng Vương quốc Thái Lan Anutin Charnvirakul, trước sự chứng kiến của Thủ tướng Thái, FPT đã ký kết và khởi động loạt hợp tác chiến lược với Charoen Pokphand Foods Public Company Limited (CPF) và Amata Group, hai tập đoàn dẫn đầu trong lĩnh vực nông nghiệp – thực phẩm và phát triển khu công nghiệp & đô thị tại châu Á. Qua đó, khẳng định vai trò đối tác công nghệ và chuyển đổi AI toàn diện cho các tổ chức, doanh nghiệp trên quy mô toàn cầu.

Công nghệ - 10/06/2026 08:01

FPT ký 6 hợp tác chuyển đổi AI với tập đoàn lớn tại Thái Lan và Singapore

Trong khuôn khổ Diễn đàn Doanh nghiệp Việt Nam - Thái Lan tại Bangkok và Diễn đàn Kết nối công nghệ Việt Nam - Singapore, trước sự chứng kiến của Tổng Bí thư, Chủ tịch nước Tô Lâm cùng lãnh đạo cấp cao Thái Lan và Singapore, FPT đã ký kết 6 thỏa thuận hợp tác chiến lược về chuyển đổi AI và chuyển đổi số với các tập đoàn lớn trong lĩnh vực nông nghiệp - thực phẩm, sản xuất, ngân hàng, năng lượng, logistics và dịch vụ mặt đất.

Công nghệ - 30/05/2026 07:22

Viettel High Tech mở rộng hợp tác công nghệ quốc phòng với hàng loạt đối tác Thổ Nhĩ Kỳ

Hàng loạt hoạt động hợp tác giữa Tổng Công ty Công nghiệp Công nghệ cao (Viettel High Tech) và các doanh nghiệp công nghệ quốc phòng, viễn thông hàng đầu Thổ Nhĩ Kỳ đã diễn ra tại Triển lãm Quốc phòng và Hàng không Vũ trụ SAHA 2026 diễn ra ở Istanbul.

Công nghệ - 13/05/2026 10:04

Tổng Giám đốc FPT: 5 thói quen lãnh đạo cần loại bỏ để vượt qua 'cánh cửa hẹp' AI

Tại Hội nghị Cisco CxO Symposium 2026 Việt Nam, ông Nguyễn Văn Khoa - Tổng Giám đốc Tập đoàn FPT đã chia sẻ góc nhìn thực tiễn về cách doanh nghiệp tận dụng trí tuệ nhân tạo (AI) trong quản trị và vận hành, nhấn mạnh vai trò quyết định của lãnh đạo và dữ liệu trong kỷ nguyên mới.

Công nghệ - 09/05/2026 14:18

Viettel Post trở thành đối tác vận hành mạng lưới toàn quốc của FedEx tại Việt Nam

Sự kết hợp giữa tiêu chuẩn vận hành toàn cầu của FedEx và năng lực triển khai thực tế tại Việt Nam của Viettel Post sẽ tạo ra một hệ thống logistics xuyên biên giới có quy mô lớn và tiêu chuẩn quốc tế.

Công nghệ - 27/04/2026 07:54

FPT khẳng định vai trò đối tác AI chiến lược, thúc đẩy hợp tác Việt Nam - Hàn Quốc

Trong khuôn khổ Diễn đàn Kinh tế Việt Nam - Hàn Quốc, Tập đoàn FPT đã tham gia và triển khai nhiều hoạt động hợp tác trong lĩnh vực công nghệ và AI. FPT tiếp tục khẳng định vị thế là đối tác công nghệ và trí tuệ nhân tạo (AI) chiến lược của doanh nghiệp Hàn Quốc. Sự kiện diễn ra nhân chuyến thăm cấp Nhà nước tới Việt Nam của Tổng thống Hàn Quốc Lee Jae Myung và Lãnh đạo Hàn Quốc để thực hiện hoạt động cấp cao giữa hai nhà nước.

Công nghệ - 25/04/2026 06:45

FPT ký hợp đồng AI hàng chục triệu USD với tập đoàn vật liệu hàng đầu thế giới

FPT vừa ký kết hợp đồng trị giá hàng chục triệu USD với một tập đoàn sản xuất vật liệu hàng đầu thế giới, đánh dấu bước tiến mới trong chiến lược mở rộng cung cấp dịch vụ AI tại thị trường châu Âu.

Công nghệ - 17/04/2026 10:53

Việt Nam chính thức có nhà máy sản xuất pin lưu trữ năng lượng đáp ứng tiêu chuẩn quốc tế

Với công suất thiết kế 5GWh mỗi năm, mức độ tự động hóa trên 90%, Nhà máy sản xuất pin lưu trữ năng lượng GG Power là một minh chứng cho khả năng người Việt Nam hoàn toàn có đủ năng lực để tham gia sâu vào lĩnh vực công nghệ năng lượng cao.

Công nghệ - 14/04/2026 06:50

Đọc nhiều

Chứng khoán

Ngân hàng

Lãi suất tiền gửi lên tới 9%: Cuộc cạnh tranh huy động vốn đang nóng trở lại?

Giá xăng đồng loạt giảm, giá dầu diesel lên 21.745 đồng/lít

Bộ trưởng Trần Hồng Minh 'chốt' mốc hoàn thành tuyến chính cao tốc La Sơn - Hòa Liên

'Thể chế minh bạch quyết định sức hút của trung tâm tài chính'

Giá dầu lên cao khi ông Trump dọa không kích mới nhằm vào Iran

TP.HCM ưu tiên sống cân bằng, Hà Nội vẫn chọn lương cao

Phó Chủ tịch PNJ: 'Đôi khi doanh nghiệp phải chấp nhận từ bỏ những mô hình cũ'

Phố Wall diễn biến trái chiều, giá vàng và Bitcoin chịu sức ép

Vì sao cựu Chủ tịch UBND tỉnh Bạc Liêu bị khởi tố?

Thủ tướng: Nghiên cứu bổ sung cơ chế đột phá cho nhà ở cho thuê

Viễn cảnh con người mất kiểm soát thế giới khi chatbot AI kết nối Internet

OpenAI đã thuê một đội đặc nhiệm gồm các chuyên gia hàng đầu cố gắng "bẻ khoá" GPT-4 để đánh giá rủi ro tiềm ẩn của công cụ này đối với con người trong tương lai.

Nếu được kết nối Internet để "tự học", các hệ thống AI sẽ khiến con người mất kiểm soát với thế giới?

Khi dữ liệu trở thành 'mỏ vàng' mới của ngành môi trường

Chủ tịch FPT: Công nghệ là cầu nối cho giai đoạn phát triển mới của ASEAN

FPT ký 6 hợp tác chuyển đổi AI với tập đoàn lớn tại Thái Lan và Singapore

Viettel High Tech mở rộng hợp tác công nghệ quốc phòng với hàng loạt đối tác Thổ Nhĩ Kỳ

Tổng Giám đốc FPT: 5 thói quen lãnh đạo cần loại bỏ để vượt qua 'cánh cửa hẹp' AI

Viettel Post trở thành đối tác vận hành mạng lưới toàn quốc của FedEx tại Việt Nam

FPT khẳng định vai trò đối tác AI chiến lược, thúc đẩy hợp tác Việt Nam - Hàn Quốc

FPT ký hợp đồng AI hàng chục triệu USD với tập đoàn vật liệu hàng đầu thế giới

Việt Nam chính thức có nhà máy sản xuất pin lưu trữ năng lượng đáp ứng tiêu chuẩn quốc tế

Ông chủ phía sau dự án bệnh viện gần 5.000 tỷ đồng 'đắp chiếu' ở Đà Nẵng

Kinh tế TP.HCM đang dần vận hành bằng những động lực mới

Kỷ lục chưa từng có về số doanh nghiệp giải thể

Nghệ An trước vận hội mới - Bài cuối: Khát vọng cực tăng trưởng mới

Các tập đoàn toàn cầu không còn đến Việt Nam vì ưu đãi

Thị trường tháng 9: Điểm sáng nào cho nhà đầu tư?

InvestingPro chính thức phân phối chứng chỉ quỹ mở do VCBF quản lý

GELEX lãi trước thuế 2.270 tỷ đồng sau 9 tháng

Áp lực lãi suất gia tăng trong bối cảnh biến động toàn cầu

TPBank thắp sáng Giáng sinh bằng trải nghiệm số và những khoảnh khắc gần gũi

Bảo hiểm - công cụ tài chính giúp người dân và doanh nghiệp mùa bão lũ

Viễn cảnh con người mất kiểm soát thế giới khi chatbot AI kết nối Internet

OpenAI đã thuê một đội đặc nhiệm gồm các chuyên gia hàng đầu cố gắng "bẻ khoá" GPT-4 để đánh giá rủi ro tiềm ẩn của công cụ này đối với con người trong tương lai.

Nếu được kết nối Internet để "tự học", các hệ thống AI sẽ khiến con người mất kiểm soát với thế giới?

Đáng đọc