Viễn cảnh con người mất kiểm soát thế giới khi chatbot AI kết nối Internet
OpenAI đã thuê một đội đặc nhiệm gồm các chuyên gia hàng đầu cố gắng "bẻ khoá" GPT-4 để đánh giá rủi ro tiềm ẩn của công cụ này đối với con người trong tương lai.
Sau khi được cấp quyền truy cập vào GPT-4, hệ thống trí tuệ nhân tạo đằng sau ChatGPT nổi tiếng, Andrew White đã yêu cầu AI này tạo ra một tác nhân thần kinh hoàn toàn mới.
Giáo sư kỹ thuật hóa học tại Đại học Rochester này nằm trong số 50 học giả và chuyên gia được thuê để thử nghiệm hệ thống vào năm ngoái bởi OpenAI, công ty do Microsoft hậu thuẫn đứng sau GPT-4. Trong vòng sáu tháng, đội ngũ thử nghiệm (đội đỏ) sẽ "thăm dò định tính thử đối đầu" mô hình mới, với mục tiêu "bẻ khoá" nó.
Đội xử lý "độc hại"
White nói với Financial Times (FT) rằng, ông đã sử dụng GPT-4 để đề xuất một hợp chất có thể hoạt động như vũ khí hóa học và cung cấp cho mô hình nguồn thông tin mới, chẳng hạn như các bài báo khoa học và danh mục các nhà sản xuất hóa chất. Chatbot sau đó thậm chí đã tìm thấy một nơi có thể tạo ra hợp chất theo yêu cầu.
"Tôi nghĩ công nghệ này sẽ trang bị cho mọi người một công cụ thực hiện hóa học nhanh và chính xác hơn," White cho biết. "Nhưng cũng có rủi ro đáng kể khi một số đối tượng có thể cố tạo ra những chất nguy hiểm".
Những phát hiện đáng báo động của "đội Đỏ" cho phép OpenAI kịp thời ngăn chặn những kết quả như vậy xuất hiện khi công nghệ này được phát hành rộng rãi hơn ra công chúng vào tháng trước.
Đội thử nghiệm được thiết kế để giải quyết những lo ngại phổ biến gây ra bởi việc triển khai các hệ thống AI mạnh mẽ trong xã hội. Công việc của nhóm là đặt những câu hỏi thăm dò hoặc nguy hiểm để kiểm tra công cụ có thể đáp ứng các truy vấn của con người bằng các câu trả lời chi tiết và "bóng gió" hay không.
OpenAI muốn tìm kiếm các vấn đề như độc tính, định kiến và khuynh hướng ngôn ngữ trong mô hình. Vì vậy, đội đỏ đã kiểm tra sự giả dối, thao túng ngôn từ và kiến thức khoa học nguy hiểm. Họ cũng xem xét khả năng hỗ trợ và tiếp tay cho đạo văn, hoạt động bất hợp pháp như tội phạm tài chính và tấn công mạng, cũng như cách nó có thể làm tổn hại đến an ninh quốc gia và thông tin liên lạc trên chiến trường.
Phát hiện của "đội Đỏ" được phản hồi lại cho OpenAI, công ty đã sử dụng chúng để giảm thiểu và "đào tạo lại" GPT-4 trước khi đưa ra công chúng rộng rãi hơn. Mỗi chuyên gia đã dành từ 10 đến 40 giờ để thử nghiệm mô hình trong vài tháng. Phần lớn những người được phỏng vấn được trả khoảng 100 USD mỗi giờ cho công việc họ làm.
Nguồn tin của FT chia sẻ về những lo ngại chung do sự phát triển nhanh chóng của các mô hình ngôn ngữ và đặc biệt là những rủi ro khi kết nối chúng với các nguồn kiến thức bên ngoài thông qua các phần bổ trợ (plug-in).
"Hiện tại, hệ thống đã bị đóng băng, có nghĩa là nó không thể nạp thêm kiến thức nữa hoặc không có bộ nhớ", José Hernández-Orallo, thành viên của "đội Đỏ" GPT-4 và là giáo sư tại Viện Nghiên cứu Trí tuệ Nhân tạo Valencian cho biết. "Nhưng nếu chúng ta cho phép nó truy cập Internet thì sao? Đó có thể là một hệ thống rất mạnh được kết nối với thế giới."
Rủi ro lớn lên từng ngày
OpenAI cho biết họ rất coi trọng vấn đề an toàn, đã thử nghiệm các plug-in trước khi ra mắt và sẽ cập nhật GPT-4 thường xuyên khi có nhiều người sử dụng hơn.
Roya Pakzad, một nhà nghiên cứu về công nghệ và nhân quyền, đã sử dụng lời nhắc bằng tiếng Anh và tiếng Farsi (Ba-Tư) để kiểm tra mô hình về các phản ứng theo giới tính, sở thích chủng tộc và thành kiến tôn giáo, đặc biệt liên quan đến khăn trùm đầu.
Pakzad thừa nhận lợi ích của công nghệ với những người tiếng Anh không phải ngôn ngữ mẹ đẻ, nhưng nhận thấy rằng mô hình này có định kiến công khai về các cộng đồng bị gạt ra ngoài lề xã hội, ngay cả trong các phiên bản sau này.
Chuyên gia này cũng phát hiện ra tình trạng ảo giác - khi chatbot phản hồi bằng thông tin bịa đặt - còn tồi tệ hơn khi thử nghiệm mô hình với ngôn ngữ Farsi, nơi Pakzad tìm thấy tỷ lệ tên, số và sự kiện bịa đặt cao hơn so với tiếng Anh.
Boru Gollu, một luật sư ở Nairobi, người châu Phi duy nhất thử nghiệm, cũng lưu ý đến giọng điệu phân biệt đối xử của hệ thống. "Có thời điểm khi đang thử nghiệm, mô hình hành xử như một người da trắng nói chuyện với tôi", Gollu nói. "Bạn hỏi về một nhóm cụ thể và nó sẽ cho bạn một ý kiến thiên vị hoặc một kiểu phản hồi rất có tính định kiến."
Đối với góc độ an ninh quốc gia, cũng có những ý kiến khác nhau về mức độ an toàn của mô hình mới. Lauren Kahn, một nhà nghiên cứu tại Hội đồng Quan hệ Đối ngoại, tỏ ra bất ngờ trước mức độ chi tiết kế hoạch mà AI trình bày trong tình huống giả định tấn công mạng vào các hệ thống quân sự.
Trong khi đó, Dan Hendrycks, một chuyên gia về an toàn AI của "đội Đỏ" cho biết các plug-in có nguy cơ tạo ra một thế giới mà con người "không thể kiểm soát được".
"Sẽ ra sao nếu một chatbot có thể đăng thông tin cá nhân người khác, truy cập tài khoản ngân hàng hoặc cử cảnh sát đến nơi ở của người dùng? Nhìn chung, chúng ta cần các đánh giá an toàn chặt chẽ hơn nữa trước khi cho phép AI sử dụng sức mạnh Internet", Dan khẳng định.
Heather Frase, người làm việc tại Trung tâm Công nghệ An ninh và Mới nổi của Đại học Georgetown, người đã thử nghiệm GPT-4 về khả năng hỗ trợ tội phạm, cho biết rủi ro sẽ tiếp tục gia tăng khi có nhiều người sử dụng công nghệ này.
Cô cho rằng nên tạo một sổ cái công khai để báo cáo các sự cố phát sinh từ các mô hình ngôn ngữ lớn, tương tự như an ninh mạng hoặc hệ thống báo cáo gian lận của người tiêu dùng.
(Theo Vietnamnet)
- Cùng chuyên mục
Vingroup thành lập công ty nghiên cứu phát triển người máy vốn 1.000 tỷ đồng
Tập đoàn Vingroup thông báo chính thức thành lập Công ty Cổ phần Nghiên cứu Phát triển và Ứng dụng người máy VinRobotics với vốn điều lệ 1.000 tỷ đồng. Mục tiêu của VinRobotics là góp phần nâng cao hiệu quả sản xuất, tối ưu hóa quy trình trong các lĩnh vực công nghiệp, dịch vụ và đời sống.
Công nghệ - 21/11/2024 15:58
Hà Nội tích cực xây dựng thành phố thông minh
TP. Hà Nội đã đề ra phương châm hành động "1 mục tiêu - 3 nguyên tắc - 6 phấn đấu" để quyết tâm phấn đấu xây dựng phát triển Thủ đô Hà trở thành đô thị thông minh, hiện đại...
Công nghệ - 14/11/2024 15:27
AI có thể vượt qua con người trong 10 năm tới
Theo chuyên gia, AI đã tiến hoá đến bước suy luận và có thể phân tích thị giác con người. Điều này có thể khiến AI vượt qua con người chỉ trong khoảng 10 năm tới, với bước phát triển như hiện tại.
Công nghệ - 12/11/2024 14:44
Tổ hợp công nghệ tế bào gốc HSC-HOSTEP: Bước tiến mới cho công nghệ tế bào gốc tại Việt Nam
"Lễ khởi công tổ hợp công nghệ tế bào gốc HSC- HOSTEP đánh dấu một bước tiến lớn trong lịch sử phát triển công nghệ sinh học tại Khu Công nghệ cao Hòa Lạc và trong lĩnh vực công nghệ sinh học - công nghệ y sinh của Việt Nam".
Công nghệ - 08/11/2024 11:56
Viettel hợp tác với công ty phân tích dữ liệu và AI tạo sinh hàng đầu của UAE
Lễ ký kết giữa Viettel và Presight diễn ra tại TP Dubai trong khuôn khổ buổi làm việc của Thủ tướng Phạm Minh Chính với doanh nghiệp hai nước.
Công nghệ - 30/10/2024 17:30
Đại học Kinh tế TP.HCM tích hợp công nghệ AI vào biểu diễn nghệ thuật
Đại học Kinh tế TP.HCM tích hợp trí tuệ nhân tạo (AI) vào buổi trình diễn nghệ thuật Tangible Performance mới đây, thể hiện sự giao thoa giữa nghệ thuật - công nghệ hướng tới phát triển bền vững, mang đến cái nhìn mới của sự biểu hiện sáng tạo và tác động của nó đến thế hệ tương lai
Công nghệ - 24/10/2024 13:44
Biết cách khai thác sức mạnh của AI sẽ vượt trội về năng suất
Theo Giám đốc Sản phẩm và Công nghệ của Navigos Group, những người biết cách khai thác sức mạnh của AI sẽ vượt trội về năng suất so với những người vẫn theo đuổi phương pháp làm việc truyền thống.
Công nghệ - 11/10/2024 13:46
AI Marketing lần đầu xuất hiện tại cuộc thi marketing
Giải thưởng SMARTIES do MMA Global tổ chức đã vinh danh hàng trăm chiến dịch marketing xuất sắc nhất mỗi năm, có sức tác động trực tiếp và đóng góp quan trọng vào sự phát triển, định hình tương lai ngành tiếp thị. Năm nay, lần đầu tiên xuất hiện hạng mục AI Marketing.
Công nghệ - 03/10/2024 13:16
PVOIL ra mắt ứng dụng cho phép mua xăng trước trả tiền sau
PVOIL ra mắt ứng dụng mua xăng dầu dành cho khách hàng cá nhân với tên gọi PVOIL 4U, có tính năng mua trước trả tiền sau nhắm tới đối tượng khách hàng thường xuyên là các tài xế lái xe.
Công nghệ - 30/09/2024 21:13
Cách các doanh nghiệp tận dụng livestream để tăng doanh số
Bông Bạch Tuyết, L'ORéal, Grabfood... là những thương hiệu điển hình cho việc tận dụng lợi thế thương mại điện tử, livestream để tăng doanh số.
Công nghệ - 27/09/2024 14:38
HueWaco tham gia tuần lễ nước Quốc tế tại Đài Loan
HueWACO đã đến thăm và làm việc với Cục nước Đài Bắc (TWD), đại diện hai đơn vị đã cùng thảo luận, trao đổi và chia sẻ về các vấn đề trong lĩnh vực cấp nước.
Công nghệ - 16/09/2024 14:35
FPT mở văn phòng tại Thụy Điển, thúc đẩy tăng trưởng thị trường Bắc Âu
Văn phòng mới của FPT tại Thụy Điển nằm trong Công viên Khoa học Lindholmen, một trong những trung tâm đổi mới sáng tạo hàng đầu của Thụy Điển quy tụ hệ sinh thái sôi động gồm hơn 375 doanh nghiệp hàng đầu.
Công nghệ - 09/09/2024 10:59
Những cú 'sẩy chân' của các hãng xe công nghệ tại Việt Nam
Lần lượt các hãng xe công nghệ như Uber, GoViet, Baemin rồi mới đây là Gojek phải nói lời chia tay với thị trường Việt Nam sau vài năm thử sức.
Công nghệ - 05/09/2024 11:43
FPT 'bắt tay' FCC Partners lập Quỹ Đầu tư Công nghiệp Bán dẫn Việt Nam
FPT và FCC Partners kỳ vọng Quỹ Đầu tư Phát triển Công nghiệp Bán dẫn Việt Nam sẽ góp phần tăng trưởng ngành bán dẫn tại Việt Nam thông qua phát triển nguồn nhân lực, thu hút đầu tư nước ngoài ngành vi mạch bán dẫn, hỗ trợ các doanh nghiệp khởi nghiệp và thúc đẩy đổi mới sáng tạo.
Công nghệ - 08/08/2024 16:43
20% vốn Nhật Bản chảy vào lĩnh vực công nghệ thông tin Việt Nam
"Hàng năm có một số lượng đầu tư trực tiếp nhất định từ Nhật Bản vào Việt Nam trong lĩnh vực công nghệ thông tin (CNTT). Tính đến năm 2023 có 59 khoản đầu tư, tương đương 20%", ông Noriya Tarutani, Phó Giám đốc Ban Đổi mới sáng tạo của JETRO cho biết tại Vietnam IT Day 2024.
Công nghệ - 07/08/2024 11:51
Phần mềm miễn phí giúp phát hiện lừa đảo qua mạng
Người dùng có thể tải miễn phí ứng dụng chống lừa đảo nTrust từ Google Play với hệ điều hành Android và App Store với hệ điều hành iOS.
Công nghệ - 30/07/2024 17:24
- Đọc nhiều
-
1
Bóng nhà chủ VNDirect đằng sau các đợt tăng vốn của CIENCO4
-
2
Tiềm lực của chủ đầu tư dự án Khu công nghiệp Thanh Bình 2
-
3
Đường Đồng Khởi đắt đỏ thứ 14 toàn cầu
-
4
Bức tranh kinh doanh trái chiều tại 2 cảng lớn ở Bình Định
-
5
Dự án điện khí 5,4 tỷ USD ở Huế được bổ sung vào quy hoạch lưới điện 220kV
Đáng đọc
- Đáng đọc
Bộ Tài chính Mỹ: Việt Nam không thao túng tiền tệ
Thị trường - Update 1 week ago
Tỷ phú muốn 'rót' tiền vào dự án của bà Trương Mỹ Lan là ai?
Đầu tư - Update 5 day ago
Đại gia Rolls Royce Ninh Bình vừa bị khởi tố là ai?
Tài chính - Update 2 week ago
Đại gia Nguyễn Cao Trí 'thao túng' cựu cán bộ Thanh tra Chính phủ ra sao?
Pháp luật - Update 3 week ago