Xây dựng nền tảng cho AI tại Việt Nam với dữ liệu tiếng Việt mã nguồn mở

THANH THANH
12:03 14/03/2025

Các mô hình AI hỗ trợ tiếng Việt một cách tự nhiên và toàn diện ngay từ trong lõi để mở khoá tiềm năng các ứng dụng AI tại Việt nam

Trong khuôn khổ Hội nghị Quốc tế về Trí tuệ Nhân tạo và Bán dẫn (AISC) 2025 vào sáng 14/3, tại Trung tâm Đổi mới sáng tạo quốc gia (NIC), Tập đoàn Meta phối hợp với NIC chính thức khởi động Chương trình Thách thức Đổi mới sáng tạo 2025, đánh dấu năm triển khai thứ ba của chương trình với mục tiêu thúc đẩy phát triển lĩnh vực trí tuệ nhân tạo (AI) tại Việt Nam.

Chương trình năm nay tập trung vào Dự án ViGen với nỗ lực tạo ra bộ dữ liệu tiếng Việt mã nguồn mở chất lượng cao để đào tạo, đánh giá và từ đó nâng cao hiệu quả của các mô hình ngôn ngữ lớn (LLMs), giúp các mô hình AI hiểu rõ hơn văn hóa, bối cảnh và cách diễn đạt trong tiếng Việt.

Dự án này được kỳ vọng sẽ nâng cao sự hiện diện của tiếng Việt trong quá trình phát triển AI, đồng thời góp phần thúc đẩy nền kinh tế số phát triển vượt bậc và bền vững.

Dự án ViGen khởi nguồn từ hợp tác ba bên giữa Meta, NIC và tổ chức "AI for Vietnam". Trong đó, NIC đóng vai trò là đơn vị chủ quản, điều phối, bảo đảm dự án phù hợp với các mục tiêu quốc gia của Việt Nam. "AI for Vietnam" là đối tác triển khai dự án với những hỗ trợ về kỹ thuật và tài chính từ Tập đoàn Meta. Các đối tác chiến lược bao gồm NVIDIA, Viettel, và Viện Hàn lâm Khoa học và Công nghệ Việt Nam.

Ông Sarim Aziz, Giám đốc Chính sách Công tại Meta chia sẻ tại sự kiện. Ảnh: Thanh Thanh.

Sứ mệnh của VIC 2025 - dự án ViGen là làm cho các mô hình AI hỗ trợ tiếng Việt một cách tự nhiên và toàn diện ngay từ trong lõi để mở khoá tiềm năng các ứng dụng AI tại Việt nam. ViGen sẽ xây dựng các bộ dữ liệu tiếng Việt nguồn mở với quy mô lớn và chất lượng cao để đào tạo và đánh giá khả năng của các mô hình AI. Dự án ViGen cũng đóng góp vào việc đảm bảo sự phát triển AI ở Việt Nam phù hợp với giá trị văn hoá và tiêu chuẩn đạo đức ở Việt Nam, hướng tới việc xây dựng một hệ sinh thái AI mã nguồn mở phù hợp với bối cách địa phương và có trách nhiệm.

Nhằm hỗ trợ dự án, Meta sẽ đóng góp các bộ dữ liệu mã nguồn mở từ chương trình AI và Dữ liệu vì Lợi ích Cộng đồng của mình, bao gồm những thông tin chi tiết về di chuyển và kết nối xã hội, cũng như dữ liệu đào tạo từ các bản đồ dân số có sự hỗ trợ của AI.

Bên cạnh Dự án ViGen với trọng tâm nâng cao sự hiện diện của tiếng Việt trong phát triển AI thông qua các bộ dữ liệu mã nguồn mở, Meta và Deloitte cũng công bố cuốn cẩm nang dành cho khu vực công mang tên "Đổi mới sáng tạo trong khu vực công ở châu Á - Thái Bình Dương với AI mã nguồn mở: Khai phá tiềm năng đột phá cùng Llama" tại sự kiện khai mạc chương trình "Thách thức đổi mới sáng tạo". Cẩm nang này sẽ cung cấp lộ trình giúp các cơ quan chính phủ tích hợp hiệu quả công nghệ AI mã nguồn mở. Sự kết hợp giữa các sáng kiến này hướng đến mục tiêu xây dựng một chiến lược AI đồng bộ tại Việt Nam, mang lại lợi ích cho cả khu vực công và tư nhân.

"Dự án ViGen và Thử thách Đổi mới Sáng tạo Việt Nam không chỉ nhằm thúc đẩy công nghệ, mà còn hướng tới xây dựng một tương lai AI toàn diện, tôn vinh và tích hợp di sản văn hóa và ngôn ngữ độc đáo của Việt Nam".

GS. Yann LeCun, Phó chủ tịch, Kiến trúc sư trưởng về Trí tuệ Nhân tạo của Tập đoàn Meta

Chia sẻ tại cuộc họp báo, ông Trần Việt Hùng, Nhà sáng lập & CEO, Tổ chức AI for Vietnam cho biết, ở Việt Nam, AI vẫn chưa được ứng dụng hiệu quả mà một trong ngững hạn chế là các ứng dụng sử dụng tiếng Việt rất ít.

"Nếu không nhanh chúng ta sẽ vuột mất cơ hội . Do vậy, việc hỗ trợ tiếng Viêt rất qquan trọng...", ông Hùng nhấn mạnh

ông Trần Việt Hùng, Nhà sáng lập & CEO, Tổ chức AI for Vietnam chia sẻ về dự án ViGen. Ảnh: Thanh Thanh 

Tổ chức AI For Vietnam đã chính thức tham gia vào Liên minh AI toàn cầu. Dự án ViGen - với sự hỗ trợ của NIC và Meta - hoàn toàn phù hợp với sáng kiến dữ liệu mở và tin cậy (OTDI) của Liên minh AI. Cụ thể, Project ViGen sẽ đóng góp cho cộng đồng những bộ dữ liệu lớn và chất lượng cao bằng tiếng Việt nhằm cải thiện hiện trạng tiếng Việt đang bị coi là một ngôn ngữ còn hiện diện hết sức khiêm tốn trong AI. Project ViGen cũng cho thấy sức mạnh và giá trị của những mô hình mã nguồn mở như Llama, cho phép phát triển các giải pháp sáng tạo có tác động tuần cầu có tính đến ngữ cảnh của tiếng Việt.

Ông Võ Xuân Hoài, Phó Giám đốc NIC nhấn mạnh, AI đang chuyển đổi thế giới. Do đó, việc phát triển các tập dữ liệu Việt Nam quy mô lớn, chất lượng cao và mã nguồn mở để đào tạo và đánh giá AI đã trở thành ưu tiên cấp bách.

"Dự án ViGen phù hợp với Nghị quyết 57/NQ-TW của Bộ Chính trị nhằm thúc đẩy đột phá trong khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia. Dự án ViGen đòi hỏi nỗ lực chung từ các nhà hoạch định chính sách, nhóm nghiên cứu, nhà nghiên cứu, nhà phát triển, chuyên gia và người dùng. Cùng nhau, chúng ta sẽ biến AI thành một công cụ mạnh mẽ cho mọi người Việt Nam và đưa Việt Nam trở thành cường quốc AI toàn cầu…", lãnh đạo NIC kỳ vọng.

Theo ông Sarim Aziz, Giám đốc Chính sách Công tại Meta, không chỉ hỗ trợ các doanh nghiệp, Dự án ViGen hay những mô hình AI mã nguồn mở Llama còn hộ trợ cả khu vực công cũng như cả đất nước Việt Nam.

"2025 là một năm bản lề với tiến trình phát triển AI tại Việt Nam. Meta vinh dự được hợp tác cùng NIC và Tổ chức AI for Vietnam Foundation với Dự án ViGen. Thông qua hỗ trợ các nhà nghiên cứu, nhà phát triển và doanh nghiệp Việt Nam tiếp cận những mô hình AI mã nguồn mở như Llama cùng các nguồn lực phù hợp với bối cảnh địa phương, chúng tôi mong muốn giúp họ phát huy tối đa tiềm năng và thúc đẩy các sáng kiến AI mang tính ứng dụng cao, phù hợp với nhu cầu của Việt Nam", đại diện Meta chia sẻ.

Đại diện các bên tham gia Chương trình Thách thức Đổi mới sáng tạo 2025. Ảnh: NIC

Tại sự kiện, Meta, phối hợp cùng Deloitte đã chọn Việt Nam là quốc gia đầu tiên trong khu vực châu Á - Thái Bình Dương ra mắt cẩm nang mang tên "Đổi mới sáng tạo trong khu vực công ở châu Á - Thái Bình Dương với AI mã nguồn mở: Khai phá tiềm năng đột phá cùng Llama".
Cẩm nang này cung cấp các phương pháp tối ưu trong việc ứng dụng AI mã nguồn mở và đánh giá các ứng dụng thực tiễn của mô hình Llama trong các lĩnh vực quan trọng của khu vực công, bao gồm tương tác với người dân, quản lý hành chính công, tuân thủ chính sách, giáo dục, y tế, và an ninh công cộng.
Đặc biệt, cẩm nang giới thiệu hai ứng dụng thực tiễn đầy ấn tượng của mô hình Llama tại Việt Nam: Bộ Khoa học và Công nghệ đã hợp tác cùng MISA để thử nghiệm một trợ lý ảo, giúp giảm 98% thời gian tra cứu thông tin cho cán bộ, qua đó tăng hiệu suất làm việc và tiết kiệm thời gian; trong dự án với Bộ Tư Pháp, Viettel đã tận dụng Llama để triển khai trợ lý pháp lý ảo, giúp rút ngắn thời gian nghiên cứu văn bản pháp luật khoảng 30%.

  • Cùng chuyên mục
‘Việt Nam không có ý định tạo ra bất cứ cản trở nào gây phương hại đến người lao động, an ninh quốc gia Hoa Kỳ’

‘Việt Nam không có ý định tạo ra bất cứ cản trở nào gây phương hại đến người lao động, an ninh quốc gia Hoa Kỳ’

Điều này được Bộ trưởng Công Thương Nguyễn Hồng Diên khẳng định khi làm việc với Trưởng Đại diện Thương mại Hoa Kỳ Jamieson Greer tại Washington D.C.

Sự kiện - 14/03/2025 11:05

Hà Nội muốn biến sông Tô Lịch thành không gian xanh phục vụ cộng đồng

Hà Nội muốn biến sông Tô Lịch thành không gian xanh phục vụ cộng đồng

Hà Nội thiết kế cải tạo sông Tô Lịch với mục tiêu biến sông Tô Lịch thành không gian xanh, điểm nhấn cảnh quan và sinh thái phục vụ cộng đồng.

Sự kiện - 14/03/2025 06:56

Thủ tướng: Việt Nam luôn coi Mỹ là đối tác có tầm quan trọng chiến lược

Thủ tướng: Việt Nam luôn coi Mỹ là đối tác có tầm quan trọng chiến lược

Thủ tướng nhấn mạnh Chính phủ Việt Nam luôn quan tâm tạo điều kiện cho các hoạt động của doanh nghiệp, nhà đầu tư Mỹ tại Việt Nam.

Sự kiện - 14/03/2025 06:33

Phó Thủ tướng chỉ đạo gỡ vướng cao tốc hơn 2.000 tỷ qua Đà Nẵng

Phó Thủ tướng chỉ đạo gỡ vướng cao tốc hơn 2.000 tỷ qua Đà Nẵng

Dự án cao tốc Hòa Liên - Túy Loan (qua địa bàn TP. Đà Nẵng) dù đã đạt 100% mặt bằng tuyến chính, tuy nhiên, đơn vị thi công đang gặp khó tại đường gom song hành và nguồn vật liệu đá.

Sự kiện - 13/03/2025 11:11

Pháp muốn tham gia các dự án điện hạt nhân của Việt Nam

Pháp muốn tham gia các dự án điện hạt nhân của Việt Nam

Việt Nam sẽ ưu tiên lựa chọn đối tác khi mà chứng minh và cam kết chuyển giao công nghệ trong quá trình phát triển điện hạt nhân ở Việt Nam.

Sự kiện - 13/03/2025 08:48

Báo Nông nghiệp và Môi trường - DLG thiết lập quan hệ đối tác chiến lược

Báo Nông nghiệp và Môi trường - DLG thiết lập quan hệ đối tác chiến lược

Biên bản ghi nhớ hợp tác giữa Báo Nông nghiệp và Môi trường (NN&MT) và Hiệp hội Nông nghiệp Đức (DLG), hứa hẹn sẽ mang lại nhiều giá trị cho ngành nông nghiệp của Việt Nam và Đức.

Sự kiện - 12/03/2025 17:56

Doanh nghiệp Singapore muốn tăng đầu tư vào ngành điện, bất động sản tại Việt Nam

Doanh nghiệp Singapore muốn tăng đầu tư vào ngành điện, bất động sản tại Việt Nam

Một số doanh nghiệp của Singapore bày tỏ mong muốn đầu tư vào Việt Nam trong các lĩnh vực như kinh tế số, năng lượng tái tạo, khu công nghiệp, tài chính xanh.

Sự kiện - 12/03/2025 06:27

Chủ tịch Quốc hội: Tới đây sửa Hiến pháp, sáp nhập tỉnh, sắp xếp 60-70% xã

Chủ tịch Quốc hội: Tới đây sửa Hiến pháp, sáp nhập tỉnh, sắp xếp 60-70% xã

Chủ tịch Quốc hội Trần Thanh Mẫn lưu ý khối lượng công việc sắp tới rất lớn khi nghiên cứu sửa Hiến pháp và các luật liên quan; sắp xếp tỉnh, xã và bỏ cấp huyện.

Sự kiện - 11/03/2025 14:14

VAFIE dự triển lãm quốc tế về máy công cụ ở Trung Quốc

VAFIE dự triển lãm quốc tế về máy công cụ ở Trung Quốc

Chủ tịch Hiệp hội Doanh nghiệp đầu tư nước ngoài - GS-TSKH. Nguyễn Mai cùng đoàn doanh nghiệp Việt Nam tham dự Triển lãm và Diễn đàn quốc tế về máy công cụ tại Trung Quốc.

Sự kiện - 11/03/2025 12:38

Tạm dừng bổ nhiệm, luân chuyển cán bộ tới khi hoàn thành sáp nhập, hợp nhất một số tỉnh

Tạm dừng bổ nhiệm, luân chuyển cán bộ tới khi hoàn thành sáp nhập, hợp nhất một số tỉnh

Kể từ ngày 7/3/2025 cho đến khi hoàn thành sáp nhập, hợp nhất tỉnh, tạm dừng việc tuyển dụng, quy hoạch, điều động, luân chuyển, bổ nhiệm chức danh phó bí thư, chủ tịch hội đồng nhân dân...

Sự kiện - 11/03/2025 10:00

'Bất động sản, đầu tư công sẽ là 2 nhóm cổ phiếu tiềm năng trong năm 2025'

'Bất động sản, đầu tư công sẽ là 2 nhóm cổ phiếu tiềm năng trong năm 2025'

Chuyên gia cho rằng, bất động sản và đầu tư công sẽ là 2 nhóm cổ phiếu tiềm năng trong năm 2025, khi hưởng lợi trực tiếp từ xu hướng phục hồi kinh tế và chính sách hỗ trợ từ Chính phủ.

Sự kiện - 11/03/2025 09:44

Vì sao ngành đường sắt Việt Nam chậm phát triển?

Vì sao ngành đường sắt Việt Nam chậm phát triển?

Cho ý kiến về dự án Luật Đường sắt (sửa đổi), Chủ tịch Quốc hội Trần Thanh Mẫn cho rằng, cần làm rõ nguyên nhân dẫn đến sự chậm phát triển của đường sắt Việt Nam do thiếu nguồn lực hay chưa quan tâm đúng mức. Từ đó, luật sửa đổi cần tập trung vào các chính sách, tạo ra sự bứt phá cho ngành.

Sự kiện - 10/03/2025 17:13

Tổng Bí thư Tô Lâm kêu gọi doanh nghiệp Việt Nam, Indonesia mở rộng đầu tư vào bán dẫn, AI, IoT

Tổng Bí thư Tô Lâm kêu gọi doanh nghiệp Việt Nam, Indonesia mở rộng đầu tư vào bán dẫn, AI, IoT

Tổng Bí thư Tô Lâm mong muốn các doanh nghiệp Indonesia vươn lên trở thành một trong các nhà đầu tư lớn nhất tại Việt Nam.

Sự kiện - 10/03/2025 15:15

Ông Đặng Hữu Phúc giữ chức Giám đốc Sở Công Thương TP. Huế

Ông Đặng Hữu Phúc giữ chức Giám đốc Sở Công Thương TP. Huế

Ông Đặng Hữu Phúc, nguyên Giám đốc Sở Lao động - Thương binh và Xã hội được UBND TP. Huế điều động giữ chức Giám đốc Sở Công Thương.

Sự kiện - 10/03/2025 10:38