Viễn cảnh con người mất kiểm soát thế giới khi chatbot AI kết nối Internet
OpenAI đã thuê một đội đặc nhiệm gồm các chuyên gia hàng đầu cố gắng "bẻ khoá" GPT-4 để đánh giá rủi ro tiềm ẩn của công cụ này đối với con người trong tương lai.
Sau khi được cấp quyền truy cập vào GPT-4, hệ thống trí tuệ nhân tạo đằng sau ChatGPT nổi tiếng, Andrew White đã yêu cầu AI này tạo ra một tác nhân thần kinh hoàn toàn mới.
Giáo sư kỹ thuật hóa học tại Đại học Rochester này nằm trong số 50 học giả và chuyên gia được thuê để thử nghiệm hệ thống vào năm ngoái bởi OpenAI, công ty do Microsoft hậu thuẫn đứng sau GPT-4. Trong vòng sáu tháng, đội ngũ thử nghiệm (đội đỏ) sẽ "thăm dò định tính thử đối đầu" mô hình mới, với mục tiêu "bẻ khoá" nó.
Đội xử lý "độc hại"
White nói với Financial Times (FT) rằng, ông đã sử dụng GPT-4 để đề xuất một hợp chất có thể hoạt động như vũ khí hóa học và cung cấp cho mô hình nguồn thông tin mới, chẳng hạn như các bài báo khoa học và danh mục các nhà sản xuất hóa chất. Chatbot sau đó thậm chí đã tìm thấy một nơi có thể tạo ra hợp chất theo yêu cầu.
"Tôi nghĩ công nghệ này sẽ trang bị cho mọi người một công cụ thực hiện hóa học nhanh và chính xác hơn," White cho biết. "Nhưng cũng có rủi ro đáng kể khi một số đối tượng có thể cố tạo ra những chất nguy hiểm".

FT đã nói chuyện với hơn chục thành viên của đội Đỏ GPT-4. Họ là sự kết hợp của các chuyên gia cổ cồn trắng (white-collar): học giả, giáo viên, luật sư, nhà phân tích rủi ro và nhà nghiên cứu bảo mật, và phần lớn có trụ sở tại Mỹ và châu Âu.
Những phát hiện đáng báo động của "đội Đỏ" cho phép OpenAI kịp thời ngăn chặn những kết quả như vậy xuất hiện khi công nghệ này được phát hành rộng rãi hơn ra công chúng vào tháng trước.
Đội thử nghiệm được thiết kế để giải quyết những lo ngại phổ biến gây ra bởi việc triển khai các hệ thống AI mạnh mẽ trong xã hội. Công việc của nhóm là đặt những câu hỏi thăm dò hoặc nguy hiểm để kiểm tra công cụ có thể đáp ứng các truy vấn của con người bằng các câu trả lời chi tiết và "bóng gió" hay không.
OpenAI muốn tìm kiếm các vấn đề như độc tính, định kiến và khuynh hướng ngôn ngữ trong mô hình. Vì vậy, đội đỏ đã kiểm tra sự giả dối, thao túng ngôn từ và kiến thức khoa học nguy hiểm. Họ cũng xem xét khả năng hỗ trợ và tiếp tay cho đạo văn, hoạt động bất hợp pháp như tội phạm tài chính và tấn công mạng, cũng như cách nó có thể làm tổn hại đến an ninh quốc gia và thông tin liên lạc trên chiến trường.
Phát hiện của "đội Đỏ" được phản hồi lại cho OpenAI, công ty đã sử dụng chúng để giảm thiểu và "đào tạo lại" GPT-4 trước khi đưa ra công chúng rộng rãi hơn. Mỗi chuyên gia đã dành từ 10 đến 40 giờ để thử nghiệm mô hình trong vài tháng. Phần lớn những người được phỏng vấn được trả khoảng 100 USD mỗi giờ cho công việc họ làm.
Nguồn tin của FT chia sẻ về những lo ngại chung do sự phát triển nhanh chóng của các mô hình ngôn ngữ và đặc biệt là những rủi ro khi kết nối chúng với các nguồn kiến thức bên ngoài thông qua các phần bổ trợ (plug-in).
"Hiện tại, hệ thống đã bị đóng băng, có nghĩa là nó không thể nạp thêm kiến thức nữa hoặc không có bộ nhớ", José Hernández-Orallo, thành viên của "đội Đỏ" GPT-4 và là giáo sư tại Viện Nghiên cứu Trí tuệ Nhân tạo Valencian cho biết. "Nhưng nếu chúng ta cho phép nó truy cập Internet thì sao? Đó có thể là một hệ thống rất mạnh được kết nối với thế giới."
Rủi ro lớn lên từng ngày
OpenAI cho biết họ rất coi trọng vấn đề an toàn, đã thử nghiệm các plug-in trước khi ra mắt và sẽ cập nhật GPT-4 thường xuyên khi có nhiều người sử dụng hơn.

Nếu được kết nối Internet để "tự học", các hệ thống AI sẽ khiến con người mất kiểm soát với thế giới?
Roya Pakzad, một nhà nghiên cứu về công nghệ và nhân quyền, đã sử dụng lời nhắc bằng tiếng Anh và tiếng Farsi (Ba-Tư) để kiểm tra mô hình về các phản ứng theo giới tính, sở thích chủng tộc và thành kiến tôn giáo, đặc biệt liên quan đến khăn trùm đầu.
Pakzad thừa nhận lợi ích của công nghệ với những người tiếng Anh không phải ngôn ngữ mẹ đẻ, nhưng nhận thấy rằng mô hình này có định kiến công khai về các cộng đồng bị gạt ra ngoài lề xã hội, ngay cả trong các phiên bản sau này.
Chuyên gia này cũng phát hiện ra tình trạng ảo giác - khi chatbot phản hồi bằng thông tin bịa đặt - còn tồi tệ hơn khi thử nghiệm mô hình với ngôn ngữ Farsi, nơi Pakzad tìm thấy tỷ lệ tên, số và sự kiện bịa đặt cao hơn so với tiếng Anh.
Boru Gollu, một luật sư ở Nairobi, người châu Phi duy nhất thử nghiệm, cũng lưu ý đến giọng điệu phân biệt đối xử của hệ thống. "Có thời điểm khi đang thử nghiệm, mô hình hành xử như một người da trắng nói chuyện với tôi", Gollu nói. "Bạn hỏi về một nhóm cụ thể và nó sẽ cho bạn một ý kiến thiên vị hoặc một kiểu phản hồi rất có tính định kiến."
Đối với góc độ an ninh quốc gia, cũng có những ý kiến khác nhau về mức độ an toàn của mô hình mới. Lauren Kahn, một nhà nghiên cứu tại Hội đồng Quan hệ Đối ngoại, tỏ ra bất ngờ trước mức độ chi tiết kế hoạch mà AI trình bày trong tình huống giả định tấn công mạng vào các hệ thống quân sự.
Trong khi đó, Dan Hendrycks, một chuyên gia về an toàn AI của "đội Đỏ" cho biết các plug-in có nguy cơ tạo ra một thế giới mà con người "không thể kiểm soát được".
"Sẽ ra sao nếu một chatbot có thể đăng thông tin cá nhân người khác, truy cập tài khoản ngân hàng hoặc cử cảnh sát đến nơi ở của người dùng? Nhìn chung, chúng ta cần các đánh giá an toàn chặt chẽ hơn nữa trước khi cho phép AI sử dụng sức mạnh Internet", Dan khẳng định.
Heather Frase, người làm việc tại Trung tâm Công nghệ An ninh và Mới nổi của Đại học Georgetown, người đã thử nghiệm GPT-4 về khả năng hỗ trợ tội phạm, cho biết rủi ro sẽ tiếp tục gia tăng khi có nhiều người sử dụng công nghệ này.
Cô cho rằng nên tạo một sổ cái công khai để báo cáo các sự cố phát sinh từ các mô hình ngôn ngữ lớn, tương tự như an ninh mạng hoặc hệ thống báo cáo gian lận của người tiêu dùng.
(Theo Vietnamnet)
- Cùng chuyên mục
FPT 'bắt tay' công ty công nghệ của tập đoàn hàng không lớn nhất Nhật Bản
FPT vừa ký kết thỏa thuận hợp tác chiến lược toàn diện với ANA Systems – công ty CNTT trực thuộc ANA Group, tập đoàn hàng không lớn nhất Nhật Bản – nhằm thúc đẩy đổi mới sáng tạo và tối ưu hóa hiệu quả vận hành cho ngành hàng không.
Công nghệ - 09/08/2025 14:01
Viettel, VinaPhone lọt top toàn cầu về tốc độ mạng di dộng và 5G
Viettel đứng thứ 3 bảng xếp hạng mạng di động nhanh nhất thế giới trong khi VinapPhone đứng thứ 2 ở hạng mục mạng 5G.
Công nghệ - 06/08/2025 16:00
Đầu tư từ Nhật Bản vào Việt Nam trong ngành dịch vụ, công nghệ tăng
Ông Abe Ryota - chuyên gia Kinh tế cao cấp của Ngân hàng Sumitomo Mitsui cho biết, trong khi dòng vốn của Nhật Bản vào lĩnh vực sản xuất tại Việt Nam có phần chững lại thì vào các ngành phi sản xuất như dịch vụ và công nghệ lại có sự tăng trưởng đáng kể.
Công nghệ - 06/08/2025 14:47
‘AI không thể sánh kịp con người về sự thấu cảm và sáng tạo’
Ông Colin Blackwell, chủ tịch Hyperion Fintech, công ty dịch vụ công nghệ tài chính tại Thụy Sĩ, cho rằng AI tự động hóa một loạt các công việc văn phòng lặp đi lặp lại như phân tích dữ liệu, lập báo cáo nhưng không thể có cảm xúc và sự sáng tạo như con người.
Công nghệ - 26/07/2025 07:42
Doanh nghiệp là động lực chính để thúc đẩy phát triển công nghệ 5G
Theo chuyên gia, Việt Nam đã tận dụng tốt các chiến lược để có thể phát triển 5G một cách tiết kiệm và hiệu quả. Điều này có thể thúc đẩy phát triển ngành công nghiệp tỷ USD vào năm 2030.
Công nghệ - 24/07/2025 14:51
Hà Nội đề xuất triển khai dịch vụ công số thân thiện trên thiết bị di động
Hà Nội đề xuất Trung ương cho phép thành phố triển khai dịch vụ công số thân thiện trên thiết bị di động tích hợp với Cổng Dịch vụ công Quốc gia để đáp ứng nhu cầu của người dân Thủ đô.
Công nghệ - 24/06/2025 07:30
Ra mắt liên minh AI Âu Lạc
Trong bối cảnh Quyết định 1131/QĐ-TTg do Thủ tướng Chính phủ vừa ban hành xác định 11 nhóm công nghệ chiến lược ảnh hưởng sâu rộng đến năng lực cạnh tranh và tự chủ công nghệ của quốc gia, trong đó AI được xếp ở vị trí số 1, lần đầu tiên hơn 20 cơ quan nhà nước, doanh nghiệp, trường đại học "bắt tay" thành lập Liên minh AI Âu Lạc
Công nghệ - 20/06/2025 19:23
Từ quốc gia nhỏ bé đến cường quốc số: Học gì từ hành trình chuyển đổi số đột phá của Estonia?
Estonia - một quốc gia chỉ có khoảng 1,3 triệu dân, đã trở thành hình mẫu toàn cầu trong ứng dụng AI vào chuyển đổi số chính phủ, từ đó gợi mở nhiều chính sách cho Việt Nam.
Công nghệ - 17/06/2025 06:45
Vẫn chưa có Siri hỗ trợ AI, 'cá nhân hóa hơn' từ Apple
Tại Hội nghị các nhà phát triển toàn cầu năm nay (WWDC 25), Apple đã công bố một loạt các bản cập nhật cho hệ điều hành, dịch vụ và phần mềm của mình, bao gồm giao diện mới được gọi là 'Liquid Glass' và quy ước đặt tên thương hiệu được đổi mới.
Công nghệ - 10/06/2025 10:16
TikTok Việt Nam mở lớp đào tạo pháp lý, quảng cáo TMĐT cho doanh nghiệp, nhà bán hàng
TikTok Việt Nam và Cục Thương mại điện tử và Kinh tế số (Bộ Công thương) kỳ vọng tạo dựng hệ sinh thái TMĐT lành mạnh, hỗ trợ doanh nghiệp địa phương, đặc biệt là doanh nghiệp nhỏ và vừa, phát triển mạnh mẽ hơn trong kỷ nguyên số.
Công nghệ - 12/05/2025 10:53
Việt Nam có thể dẫn đầu thế giới nếu làm AI sức khoẻ
Các chuyên gia cho rằng, Việt Nam sở hữu lợi thế lớn về nguồn dữ liệu sức khoẻ và có thể dẫn đầu thế giới nếu công nghệ trí tuệ nhân tạo (AI) về chăm sóc sức khoẻ.
Công nghệ - 10/05/2025 12:38
Hàng trăm 'ông lớn' về chuyển đổi số, AI sẽ ký hợp tác với Tập đoàn FPT
Theo ông Vũ Anh Tú, Giám đốc Công nghệ Tập đoàn FPT, sắp tới, sẽ có hơn 300 lãnh đạo các doanh nghiệp hàng đầu về chuyển đổi số, AI trên thế giới đến Đà Nẵng để ký kết hợp tác với FPT.
Công nghệ - 09/05/2025 16:57
Nhiều 'ông lớn' bắt tay làm mạng Blockchain của người Việt
Không chỉ là một công nghệ, mạng Blockchain "make in Việt Nam" sẽ là hạ tầng số phi tập trung cho dữ liệu công, dịch vụ công, tài chính số và các ứng dụng công nghệ sổ cái phân tán (DLT) cho kinh tế số Việt Nam.
Công nghệ - 06/05/2025 14:16
FPT hợp tác với các tập đoàn hàng đầu Nhật Bản trước sự chứng kiến của 2 Thủ tướng
Ông Trương Gia Bình, Chủ tịch HĐQT Tập đoàn FPT cho rằng, Việt Nam và Nhật Bản đang có hợp tác chặt chẽ và cần bổ khuyết chính nguồn nhân lực tài năng, trẻ và đầy khát vọng.
Công nghệ - 29/04/2025 10:21
Đà Nẵng 'bắt tay' với hai ông lớn công nghệ về bán dẫn, AI
TP. Đà Nẵng công nhận CTCP FPT và Công ty TNHH Công nghệ Marvell Việt Nam là đối tác chiến lược trong lĩnh vực vi mạch bán dẫn, trí tuệ nhân tạo (AI).
Công nghệ - 26/04/2025 17:40
CEO FPT chia sẻ 3 nguyên tắc triển khai ESG
CEO FPT Nguyễn Văn Khoa đã có những chia sẻ về thực tiễn quản trị không hình thức tại FPT.
Công nghệ - 25/04/2025 19:20
- Đọc nhiều
Đáng đọc
- Đáng đọc
Tổng Bí thư Tô Lâm: 'Bộ tứ trụ cột' để giúp đất nước cất cánh
Sự kiện - Update 2 month ago
Thủ tướng: Cần truyền cảm hứng cho doanh nhân cống hiến vì đất nước
Sự kiện - Update 2 month ago
Chuyên gia: Không nên quá ‘hoảng loạn’ với con số thuế 46% từ Mỹ
Tài chính - Update 4 month ago