Viễn cảnh con người mất kiểm soát thế giới khi chatbot AI kết nối Internet
OpenAI đã thuê một đội đặc nhiệm gồm các chuyên gia hàng đầu cố gắng "bẻ khoá" GPT-4 để đánh giá rủi ro tiềm ẩn của công cụ này đối với con người trong tương lai.
Sau khi được cấp quyền truy cập vào GPT-4, hệ thống trí tuệ nhân tạo đằng sau ChatGPT nổi tiếng, Andrew White đã yêu cầu AI này tạo ra một tác nhân thần kinh hoàn toàn mới.
Giáo sư kỹ thuật hóa học tại Đại học Rochester này nằm trong số 50 học giả và chuyên gia được thuê để thử nghiệm hệ thống vào năm ngoái bởi OpenAI, công ty do Microsoft hậu thuẫn đứng sau GPT-4. Trong vòng sáu tháng, đội ngũ thử nghiệm (đội đỏ) sẽ "thăm dò định tính thử đối đầu" mô hình mới, với mục tiêu "bẻ khoá" nó.
Đội xử lý "độc hại"
White nói với Financial Times (FT) rằng, ông đã sử dụng GPT-4 để đề xuất một hợp chất có thể hoạt động như vũ khí hóa học và cung cấp cho mô hình nguồn thông tin mới, chẳng hạn như các bài báo khoa học và danh mục các nhà sản xuất hóa chất. Chatbot sau đó thậm chí đã tìm thấy một nơi có thể tạo ra hợp chất theo yêu cầu.
"Tôi nghĩ công nghệ này sẽ trang bị cho mọi người một công cụ thực hiện hóa học nhanh và chính xác hơn," White cho biết. "Nhưng cũng có rủi ro đáng kể khi một số đối tượng có thể cố tạo ra những chất nguy hiểm".
FT đã nói chuyện với hơn chục thành viên của đội Đỏ GPT-4. Họ là sự kết hợp của các chuyên gia cổ cồn trắng (white-collar): học giả, giáo viên, luật sư, nhà phân tích rủi ro và nhà nghiên cứu bảo mật, và phần lớn có trụ sở tại Mỹ và châu Âu.
Những phát hiện đáng báo động của "đội Đỏ" cho phép OpenAI kịp thời ngăn chặn những kết quả như vậy xuất hiện khi công nghệ này được phát hành rộng rãi hơn ra công chúng vào tháng trước.
Đội thử nghiệm được thiết kế để giải quyết những lo ngại phổ biến gây ra bởi việc triển khai các hệ thống AI mạnh mẽ trong xã hội. Công việc của nhóm là đặt những câu hỏi thăm dò hoặc nguy hiểm để kiểm tra công cụ có thể đáp ứng các truy vấn của con người bằng các câu trả lời chi tiết và "bóng gió" hay không.
OpenAI muốn tìm kiếm các vấn đề như độc tính, định kiến và khuynh hướng ngôn ngữ trong mô hình. Vì vậy, đội đỏ đã kiểm tra sự giả dối, thao túng ngôn từ và kiến thức khoa học nguy hiểm. Họ cũng xem xét khả năng hỗ trợ và tiếp tay cho đạo văn, hoạt động bất hợp pháp như tội phạm tài chính và tấn công mạng, cũng như cách nó có thể làm tổn hại đến an ninh quốc gia và thông tin liên lạc trên chiến trường.
Phát hiện của "đội Đỏ" được phản hồi lại cho OpenAI, công ty đã sử dụng chúng để giảm thiểu và "đào tạo lại" GPT-4 trước khi đưa ra công chúng rộng rãi hơn. Mỗi chuyên gia đã dành từ 10 đến 40 giờ để thử nghiệm mô hình trong vài tháng. Phần lớn những người được phỏng vấn được trả khoảng 100 USD mỗi giờ cho công việc họ làm.
Nguồn tin của FT chia sẻ về những lo ngại chung do sự phát triển nhanh chóng của các mô hình ngôn ngữ và đặc biệt là những rủi ro khi kết nối chúng với các nguồn kiến thức bên ngoài thông qua các phần bổ trợ (plug-in).
"Hiện tại, hệ thống đã bị đóng băng, có nghĩa là nó không thể nạp thêm kiến thức nữa hoặc không có bộ nhớ", José Hernández-Orallo, thành viên của "đội Đỏ" GPT-4 và là giáo sư tại Viện Nghiên cứu Trí tuệ Nhân tạo Valencian cho biết. "Nhưng nếu chúng ta cho phép nó truy cập Internet thì sao? Đó có thể là một hệ thống rất mạnh được kết nối với thế giới."
Rủi ro lớn lên từng ngày
OpenAI cho biết họ rất coi trọng vấn đề an toàn, đã thử nghiệm các plug-in trước khi ra mắt và sẽ cập nhật GPT-4 thường xuyên khi có nhiều người sử dụng hơn.
Nếu được kết nối Internet để "tự học", các hệ thống AI sẽ khiến con người mất kiểm soát với thế giới?
Roya Pakzad, một nhà nghiên cứu về công nghệ và nhân quyền, đã sử dụng lời nhắc bằng tiếng Anh và tiếng Farsi (Ba-Tư) để kiểm tra mô hình về các phản ứng theo giới tính, sở thích chủng tộc và thành kiến tôn giáo, đặc biệt liên quan đến khăn trùm đầu.
Pakzad thừa nhận lợi ích của công nghệ với những người tiếng Anh không phải ngôn ngữ mẹ đẻ, nhưng nhận thấy rằng mô hình này có định kiến công khai về các cộng đồng bị gạt ra ngoài lề xã hội, ngay cả trong các phiên bản sau này.
Chuyên gia này cũng phát hiện ra tình trạng ảo giác - khi chatbot phản hồi bằng thông tin bịa đặt - còn tồi tệ hơn khi thử nghiệm mô hình với ngôn ngữ Farsi, nơi Pakzad tìm thấy tỷ lệ tên, số và sự kiện bịa đặt cao hơn so với tiếng Anh.
Boru Gollu, một luật sư ở Nairobi, người châu Phi duy nhất thử nghiệm, cũng lưu ý đến giọng điệu phân biệt đối xử của hệ thống. "Có thời điểm khi đang thử nghiệm, mô hình hành xử như một người da trắng nói chuyện với tôi", Gollu nói. "Bạn hỏi về một nhóm cụ thể và nó sẽ cho bạn một ý kiến thiên vị hoặc một kiểu phản hồi rất có tính định kiến."
Đối với góc độ an ninh quốc gia, cũng có những ý kiến khác nhau về mức độ an toàn của mô hình mới. Lauren Kahn, một nhà nghiên cứu tại Hội đồng Quan hệ Đối ngoại, tỏ ra bất ngờ trước mức độ chi tiết kế hoạch mà AI trình bày trong tình huống giả định tấn công mạng vào các hệ thống quân sự.
Trong khi đó, Dan Hendrycks, một chuyên gia về an toàn AI của "đội Đỏ" cho biết các plug-in có nguy cơ tạo ra một thế giới mà con người "không thể kiểm soát được".
"Sẽ ra sao nếu một chatbot có thể đăng thông tin cá nhân người khác, truy cập tài khoản ngân hàng hoặc cử cảnh sát đến nơi ở của người dùng? Nhìn chung, chúng ta cần các đánh giá an toàn chặt chẽ hơn nữa trước khi cho phép AI sử dụng sức mạnh Internet", Dan khẳng định.
Heather Frase, người làm việc tại Trung tâm Công nghệ An ninh và Mới nổi của Đại học Georgetown, người đã thử nghiệm GPT-4 về khả năng hỗ trợ tội phạm, cho biết rủi ro sẽ tiếp tục gia tăng khi có nhiều người sử dụng công nghệ này.
Cô cho rằng nên tạo một sổ cái công khai để báo cáo các sự cố phát sinh từ các mô hình ngôn ngữ lớn, tương tự như an ninh mạng hoặc hệ thống báo cáo gian lận của người tiêu dùng.
(Theo Vietnamnet)
- Cùng chuyên mục
FPT tham vọng xây dựng thủ phủ UAV tại Việt Nam
"Chúng tôi đang mơ ước xây dựng một thủ phủ máy bay không người lái tại Việt Nam", ông Trương Gia Bình, chủ tịch HĐQT Tập đoàn FPT chia sẻ.
Công nghệ - 10/12/2025 13:30
FPT sở hữu cổ phần của công ty tư vấn - dịch vụ CNTT hàng đầu Hàn Quốc
FPT thông qua công ty thành viên tại Hàn Quốc đã ký kết Thỏa thuận Đầu tư Chiến lược và Thỏa thuận Dịch vụ Tổng thể (MSA) với Blueward, công ty tư vấn - dịch vụ CNTT độc lập hàng đầu Hàn Quốc trong lĩnh vực SAP/ERP. Theo đó, FPT sẽ sở hữu tối đa 10% cổ phần của Blueward. Khoản đầu tư này dự kiến sẽ hoàn tất trước thời điểm Blueward IPO vào năm 2028.
Công nghệ - 08/12/2025 15:23
Năm 2026, TP.HCM muốn dành hơn 5,8 nghìn tỷ cho khoa học công nghệ
Sở KH&CN TP.HCM cho biết, năm 2026, thành phố đang đăng ký nhu cầu vốn cho khoa học và công nghệ là 5.879,5 tỷ đồng. Năm nay, thành phố bố trí hơn 5.373 tỷ đồng cho khoa học công nghệ, đổi mới sáng tạo và chuyển đổi số, song tỷ lệ giải ngân mới đạt gần một nửa.
Công nghệ - 02/12/2025 12:17
Doanh nghiệp Việt từng bước làm chủ công nghệ lõi về pin lưu trữ năng lượng
Với việc hợp tác với Goldwind, GG Industries - một doanh nghiệp Việt Nam có trụ sở ở Hưng Yên hướng tới từng bước làm chủ công nghệ lõi về pin lưu trữ năng lượng.
Công nghệ - 02/12/2025 10:08
MBA định hướng tư duy quản trị số chuẩn Mỹ
Lần đầu tiên tại Việt Nam, chương trình đào tạo "Thạc sĩ Quản trị kinh doanh" (MBA) định hướng tư duy quản trị số chuẩn Mỹ của Đại học Colorado Denver (CU Denver) được chuyển giao trọn vẹn để triển khai trong nước.
Công nghệ - 26/11/2025 17:25
Nền kinh tế số của Việt Nam có tốc độ phát triển nhanh thứ hai trong khu vực Đông Nam Á
Với mức tăng trưởng 17% so với cùng kỳ năm trước, Việt Nam trở thành nền kinh tế số với tốc độ phát triển nhanh thứ hai trong khu vực Đông Nam Á.
Công nghệ - 25/11/2025 14:06
Quảng Ninh thu hút hơn 16.000 tỷ đồng vào các dự án công nghệ cao
Hội nghị Xúc tiến đầu tư phát triển khoa học công nghệ, đổi mới sáng tạo và chuyển đổi số tỉnh Quảng Ninh năm 2025 đã thu hút nhiều sự quan tâm của các nhà đầu tư, khẳng định sức hút đầu tư ngày càng lớn của Quảng Ninh.
Công nghệ - 24/11/2025 18:16
Công nghệ phát hiện âm thanh bất thường của FPT được bảo hộ tại Mỹ
Nhờ tính mới và khả năng ứng dụng cao, công nghệ đột phá về mạng nơ-ron trong hệ thống phát hiện âm thanh bất thường của FPT đã được cấp bằng sáng chế tại Mỹ, khẳng định cam kết tiên phong đổi mới sáng tạo AI và góp phần nâng cao vị thế của Việt Nam trên bản đồ AI toàn cầu.
Công nghệ - 10/11/2025 11:23
Kết nối chính sách, công nghệ, đầu tư trong lĩnh vực năng lượng
"Tuần lễ năng lượng Việt Nam 2025 là một sự kiện đang đi đúng định hướng của các Nghị quyết quan trọng của Việt Nam, khi đặt trọng tâm vào việc kết nối chính sách - công nghệ - đầu tư, thúc đẩy hợp tác giữa khu vực quản lý nhà nước, các tổ chức quốc tế và cộng đồng doanh nghiệp", ông Trịnh Quốc Vũ Phó Cục trưởng Cục Điện lực, Bộ Công Thương cho biết.
Công nghệ - 06/11/2025 15:52
Hai dự án AI của Việt Nam đoạt giải thưởng Intel
Your Voice - ứng dụng AI giúp phá vỡ rào cản giao tiếp giữa người khiếm thính với cộng đồng; cùng Hap, thiết bị hỗ trợ định hướng cho người khiếm thị bằng AI và phản hồi xúc giác được Intel vinh danh.
Công nghệ - 24/10/2025 14:08
Việt Nam đứng đầu châu Á - Thái Bình Dương về thu hút đầu tư vào AI, IoT, robot
55% doanh nghiệp đang cân nhắc đầu tư vào Trung Quốc đang nhắm đến các lĩnh vực công nghệ tiên tiến như AI, IoT và robot, xếp ngay sau Việt Nam trong số các thị trường APAC.
Công nghệ - 24/10/2025 14:06
Đà Nẵng: Khởi công Trung tâm Logistics có tổng vốn đầu tư hơn 722 tỷ đồng
Dự án Trung tâm Logistics Đà Nẵng có tổng vốn đầu tư hơn 722 tỷ đồng hướng tới mục tiêu nâng cao năng lực vận hành logistics miền Trung - Tây Nguyên, tích hợp công nghệ tự động hóa hiện đại, vận hành dữ liệu số và hướng tới tiêu chuẩn xanh, bền vững.
Công nghệ - 17/10/2025 14:19
FPT và các doanh nghiệp Mỹ hợp tác phát triển giải pháp AI cho ngành bảo hiểm và quỹ đầu tư
FPT vừa ký thỏa thuận hợp tác với hai công ty công nghệ Mỹ là CR Labs.ai và Carlton Richards. Liên minh này hướng đến việc khai thác tối đa sức mạnh của công nghệ AI tại các công ty bảo hiểm và quỹ đầu tư cổ phần tư nhân, đồng thời đảm bảo những tiêu chuẩn cao nhất về bảo mật, tuân thủ và khả năng mở rộng.
Công nghệ - 09/10/2025 08:07
‘Việt Nam là một trong những trung tâm robot đầy hứa hẹn của khu vực châu Á’
Theo TS. Nguyễn Hải Nguyên, giảng viên ngành Kỹ thuật robot và cơ điện tử tại Đại học RMIT Việt Nam, Việt Nam đang lặng lẽ khẳng định vị thế là một trong những trung tâm robot đầy hứa hẹn của khu vực châu Á.
Công nghệ - 03/10/2025 11:02
Đà Nẵng đẩy mạnh xúc tiến, hút 'ông lớn' công nghệ vi mạch
Đà Nẵng đang đẩy mạnh kết nối quốc tế và thu hút các tập đoàn lớn trong lĩnh vực vi mạch, bán dẫn, khẳng định quyết tâm trở thành trung tâm công nghệ cao của Việt Nam.
Công nghệ - 03/10/2025 10:02
Hà Nội sắp có Sàn Giao dịch công nghệ và Trung tâm Đổi mới sáng tạo
Sàn Giao dịch công nghệ Hà Nội hoạt động theo mô hình "Đầu tư công, quản trị tư", đó là nhà nước đầu tư hạ tầng và tổ chức hợp đồng thuê thầu, tuyển chọn doanh nghiệp vận hành khai thác và cung ứng dịch vụ. Còn Trung tâm đổi mới sáng tạo Hà Nội là doanh nghiệp theo mô hình công ty cổ phần (trong đó vốn nhà nước chiếm cổ phần chi phối) do UBND TP. Hà Nội thành lập theo quy định của pháp luật.
Công nghệ - 30/09/2025 11:35
- Đọc nhiều
-
1
Be Group nói gì về tài xế công nghệ kiếm 1,6 tỷ/năm gây sốt cõi mạng
-
2
[Gặp gỡ thứ Tư] 'Bất kỳ tài xế công nghệ nào cũng có thể kiếm hơn 1,6 tỷ/năm'
-
3
Doanh nghiệp ở Nghệ An đầu tư hơn 4.200 tỷ làm nhà máy điện gió tại Lào
-
4
Vì sao Vingroup rút lui không làm đường sắt tốc độ cao?
-
5
Giá vàng thế giới tiếp tục lập đỉnh
Đáng đọc
- Đáng đọc
Lập 'Quỹ tái thiết miền Trung', tại sao không?
Sự kiện - Update 3 week ago
Gần 1 tỷ USD trái phiếu 'chảy về' một Group
Tài chính - Update 2 month ago
'Cơn sốt' vàng bao giờ chấm dứt?
Thị trường - 2 month





















