Xây dựng nền tảng cho AI tại Việt Nam với dữ liệu tiếng Việt mã nguồn mở
Các mô hình AI hỗ trợ tiếng Việt một cách tự nhiên và toàn diện ngay từ trong lõi để mở khoá tiềm năng các ứng dụng AI tại Việt nam
Trong khuôn khổ Hội nghị Quốc tế về Trí tuệ Nhân tạo và Bán dẫn (AISC) 2025 vào sáng 14/3, tại Trung tâm Đổi mới sáng tạo quốc gia (NIC), Tập đoàn Meta phối hợp với NIC chính thức khởi động Chương trình Thách thức Đổi mới sáng tạo 2025, đánh dấu năm triển khai thứ ba của chương trình với mục tiêu thúc đẩy phát triển lĩnh vực trí tuệ nhân tạo (AI) tại Việt Nam.
Chương trình năm nay tập trung vào Dự án ViGen với nỗ lực tạo ra bộ dữ liệu tiếng Việt mã nguồn mở chất lượng cao để đào tạo, đánh giá và từ đó nâng cao hiệu quả của các mô hình ngôn ngữ lớn (LLMs), giúp các mô hình AI hiểu rõ hơn văn hóa, bối cảnh và cách diễn đạt trong tiếng Việt.
Dự án này được kỳ vọng sẽ nâng cao sự hiện diện của tiếng Việt trong quá trình phát triển AI, đồng thời góp phần thúc đẩy nền kinh tế số phát triển vượt bậc và bền vững.
Dự án ViGen khởi nguồn từ hợp tác ba bên giữa Meta, NIC và tổ chức "AI for Vietnam". Trong đó, NIC đóng vai trò là đơn vị chủ quản, điều phối, bảo đảm dự án phù hợp với các mục tiêu quốc gia của Việt Nam. "AI for Vietnam" là đối tác triển khai dự án với những hỗ trợ về kỹ thuật và tài chính từ Tập đoàn Meta. Các đối tác chiến lược bao gồm NVIDIA, Viettel, và Viện Hàn lâm Khoa học và Công nghệ Việt Nam.

Sứ mệnh của VIC 2025 - dự án ViGen là làm cho các mô hình AI hỗ trợ tiếng Việt một cách tự nhiên và toàn diện ngay từ trong lõi để mở khoá tiềm năng các ứng dụng AI tại Việt nam. ViGen sẽ xây dựng các bộ dữ liệu tiếng Việt nguồn mở với quy mô lớn và chất lượng cao để đào tạo và đánh giá khả năng của các mô hình AI. Dự án ViGen cũng đóng góp vào việc đảm bảo sự phát triển AI ở Việt Nam phù hợp với giá trị văn hoá và tiêu chuẩn đạo đức ở Việt Nam, hướng tới việc xây dựng một hệ sinh thái AI mã nguồn mở phù hợp với bối cách địa phương và có trách nhiệm.
Nhằm hỗ trợ dự án, Meta sẽ đóng góp các bộ dữ liệu mã nguồn mở từ chương trình AI và Dữ liệu vì Lợi ích Cộng đồng của mình, bao gồm những thông tin chi tiết về di chuyển và kết nối xã hội, cũng như dữ liệu đào tạo từ các bản đồ dân số có sự hỗ trợ của AI.
Bên cạnh Dự án ViGen với trọng tâm nâng cao sự hiện diện của tiếng Việt trong phát triển AI thông qua các bộ dữ liệu mã nguồn mở, Meta và Deloitte cũng công bố cuốn cẩm nang dành cho khu vực công mang tên "Đổi mới sáng tạo trong khu vực công ở châu Á - Thái Bình Dương với AI mã nguồn mở: Khai phá tiềm năng đột phá cùng Llama" tại sự kiện khai mạc chương trình "Thách thức đổi mới sáng tạo". Cẩm nang này sẽ cung cấp lộ trình giúp các cơ quan chính phủ tích hợp hiệu quả công nghệ AI mã nguồn mở. Sự kết hợp giữa các sáng kiến này hướng đến mục tiêu xây dựng một chiến lược AI đồng bộ tại Việt Nam, mang lại lợi ích cho cả khu vực công và tư nhân.
"Dự án ViGen và Thử thách Đổi mới Sáng tạo Việt Nam không chỉ nhằm thúc đẩy công nghệ, mà còn hướng tới xây dựng một tương lai AI toàn diện, tôn vinh và tích hợp di sản văn hóa và ngôn ngữ độc đáo của Việt Nam".
Chia sẻ tại cuộc họp báo, ông Trần Việt Hùng, Nhà sáng lập & CEO, Tổ chức AI for Vietnam cho biết, ở Việt Nam, AI vẫn chưa được ứng dụng hiệu quả mà một trong ngững hạn chế là các ứng dụng sử dụng tiếng Việt rất ít.
"Nếu không nhanh chúng ta sẽ vuột mất cơ hội . Do vậy, việc hỗ trợ tiếng Viêt rất qquan trọng...", ông Hùng nhấn mạnh

Tổ chức AI For Vietnam đã chính thức tham gia vào Liên minh AI toàn cầu. Dự án ViGen - với sự hỗ trợ của NIC và Meta - hoàn toàn phù hợp với sáng kiến dữ liệu mở và tin cậy (OTDI) của Liên minh AI. Cụ thể, Project ViGen sẽ đóng góp cho cộng đồng những bộ dữ liệu lớn và chất lượng cao bằng tiếng Việt nhằm cải thiện hiện trạng tiếng Việt đang bị coi là một ngôn ngữ còn hiện diện hết sức khiêm tốn trong AI. Project ViGen cũng cho thấy sức mạnh và giá trị của những mô hình mã nguồn mở như Llama, cho phép phát triển các giải pháp sáng tạo có tác động tuần cầu có tính đến ngữ cảnh của tiếng Việt.
Ông Võ Xuân Hoài, Phó Giám đốc NIC nhấn mạnh, AI đang chuyển đổi thế giới. Do đó, việc phát triển các tập dữ liệu Việt Nam quy mô lớn, chất lượng cao và mã nguồn mở để đào tạo và đánh giá AI đã trở thành ưu tiên cấp bách.
"Dự án ViGen phù hợp với Nghị quyết 57/NQ-TW của Bộ Chính trị nhằm thúc đẩy đột phá trong khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia. Dự án ViGen đòi hỏi nỗ lực chung từ các nhà hoạch định chính sách, nhóm nghiên cứu, nhà nghiên cứu, nhà phát triển, chuyên gia và người dùng. Cùng nhau, chúng ta sẽ biến AI thành một công cụ mạnh mẽ cho mọi người Việt Nam và đưa Việt Nam trở thành cường quốc AI toàn cầu…", lãnh đạo NIC kỳ vọng.
Theo ông Sarim Aziz, Giám đốc Chính sách Công tại Meta, không chỉ hỗ trợ các doanh nghiệp, Dự án ViGen hay những mô hình AI mã nguồn mở Llama còn hộ trợ cả khu vực công cũng như cả đất nước Việt Nam.
"2025 là một năm bản lề với tiến trình phát triển AI tại Việt Nam. Meta vinh dự được hợp tác cùng NIC và Tổ chức AI for Vietnam Foundation với Dự án ViGen. Thông qua hỗ trợ các nhà nghiên cứu, nhà phát triển và doanh nghiệp Việt Nam tiếp cận những mô hình AI mã nguồn mở như Llama cùng các nguồn lực phù hợp với bối cảnh địa phương, chúng tôi mong muốn giúp họ phát huy tối đa tiềm năng và thúc đẩy các sáng kiến AI mang tính ứng dụng cao, phù hợp với nhu cầu của Việt Nam", đại diện Meta chia sẻ.

Tại sự kiện, Meta, phối hợp cùng Deloitte đã chọn Việt Nam là quốc gia đầu tiên trong khu vực châu Á - Thái Bình Dương ra mắt cẩm nang mang tên "Đổi mới sáng tạo trong khu vực công ở châu Á - Thái Bình Dương với AI mã nguồn mở: Khai phá tiềm năng đột phá cùng Llama".
Cẩm nang này cung cấp các phương pháp tối ưu trong việc ứng dụng AI mã nguồn mở và đánh giá các ứng dụng thực tiễn của mô hình Llama trong các lĩnh vực quan trọng của khu vực công, bao gồm tương tác với người dân, quản lý hành chính công, tuân thủ chính sách, giáo dục, y tế, và an ninh công cộng.
Đặc biệt, cẩm nang giới thiệu hai ứng dụng thực tiễn đầy ấn tượng của mô hình Llama tại Việt Nam: Bộ Khoa học và Công nghệ đã hợp tác cùng MISA để thử nghiệm một trợ lý ảo, giúp giảm 98% thời gian tra cứu thông tin cho cán bộ, qua đó tăng hiệu suất làm việc và tiết kiệm thời gian; trong dự án với Bộ Tư Pháp, Viettel đã tận dụng Llama để triển khai trợ lý pháp lý ảo, giúp rút ngắn thời gian nghiên cứu văn bản pháp luật khoảng 30%.
- Cùng chuyên mục
Nguyên Chủ tịch Tập đoàn Cao su Trần Ngọc Thuận bị khai trừ Đảng
Ban Bí thư đã quyết định khai trừ ra khỏi Đảng đối với ông Trần Ngọc Thuận, nguyên Chủ tịch HĐQT Tập đoàn Công nghiệp Cao su Việt Nam.
Sự kiện - 06/06/2025 20:23
Việt - Mỹ ký thêm thỏa thuận nông sản 600 triệu USD
Tiếp tục chuyến công tác ở Mỹ, phái đoàn do Bộ trưởng Nông nghiệp và Môi trường Đỗ Đức Duy dẫn đầu đã ký các thỏa thuận hợp tác thương mại nông sản trị giá 600 triệu USD.
Sự kiện - 06/06/2025 06:45
'Cấm mua, bán dữ liệu cá nhân'
Dự thảo Luật Bảo vệ dữ liệu cá nhân tiếp thu, bổ sung nhiều hành vi nghiêm cấm dữ liệu cá nhân trong đó có cấm mua, bán.
Sự kiện - 05/06/2025 14:21
Thủ tướng chỉ đạo tiếp tục đẩy mạnh cao điểm đấu tranh ngăn chặn, đẩy lùi buôn lậu, gian lận thương mại
Thủ tướng Chính phủ Phạm Minh Chính vừa ký Công điện 82/CĐ-TTg ngày 4/6/2025 về tiếp tục đẩy mạnh cao điểm đấu tranh ngăn chặn, đẩy lùi tình trạng buôn lậu, gian lận thương mại, hàng giả, xâm phạm quyền sở hữu trí tuệ.
Sự kiện - 05/06/2025 08:43
Báo VietNamNet trực thuộc Bộ Dân tộc và Tôn giáo
Chính phủ ban hành Nghị định quy định Báo VietNamNet về trực thuộc Bộ Dân tộc và Tôn giáo.
Sự kiện - 04/06/2025 18:48
Thủ tướng: Vướng về thể chế thì 'khó đến mấy cũng phải tháo gỡ'
Với các khó khăn, vướng mắc về thể chế, pháp luật, tại phiên họp Chính phủ thường kỳ tháng 5, Thủ tướng yêu cầu dứt khoát phải tháo gỡ, "khó mấy cũng phải tháo gỡ", để biến thể chế thành lợi thế cạnh tranh. Đồng thời, dành thêm hơn 20.000 tỷ đồng, bảo đảm đủ ít nhất 3% ngân sách cho khoa học công nghệ.
Sự kiện - 04/06/2025 14:34
Kịch bản nào cho tăng trưởng kinh tế Việt Nam đến năm 2045?
Bám sát mục tiêu tăng trưởng 2 con số trong giai đoạn 2026-2030, các chuyên gia vừa đưa ra nhận định về các kịch băn tăng trưởng kinh tế Việt Nam đến năm 2045.
Sự kiện - 04/06/2025 10:43
[Gặp gỡ thứ Tư]'Bỏ thuế khoán với hộ kinh doanh - tăng tính công bằng quản lý thuế'
"Việc xóa bỏ hình thức thuế khoán đối với hộ kinh doanh mang nhiều ý nghĩa quan trọng như tăng tính minh bạch và công bằng trong quản lý thuế", Phó cục trưởng Cục Thuế Mai Sơn nhận định.
Sự kiện - 04/06/2025 08:56
Phân biệt rõ hơn giữa đặc khu và đơn vị hành chính - kinh tế đặc biệt
Dự thảo Luật Tổ chức chính quyền địa phương (sửa đổi) đã bổ sung một số tiêu chí cụ thể làm định hướng cho việc thành lập đơn vị này, đồng thời giúp phân biệt rõ hơn giữa đặc khu và đơn vị hành chính - kinh tế đặc biệt.
Sự kiện - 03/06/2025 17:54
Thủ tướng: Lập quỹ Nhà ở quốc gia ngay trong tháng 6
Thủ tướng Phạm Minh Chính giao Bộ Xây dựng chủ trì với các bộ, ngành liên quan khẩn trương rà soát, cắt giảm thủ tục rườm rà liên quan tới nhà ở xã hội; chủ trì nghiên cứu, xây dựng, trình Chính phủ thành lập Quỹ nhà ở quốc gia, hoàn thành trong tháng 6.
Sự kiện - 03/06/2025 07:04
Thủ tướng yêu cầu đẩy mạnh xử lý tài sản sau sắp xếp
Thủ tướng Phạm Minh Chính vừa ký công điện yêu cầu các bộ ngành, địa phương đẩy mạnh công tác triển khai thực hiện phương án xử lý tài sản sau sắp xếp, tổ chức bộ máy, đơn vị hành chính các cấp.
Sự kiện - 02/06/2025 12:00
Tiêu chí nào để lựa chọn tư nhân làm đường sắt tốc độ cao Bắc - Nam?
Một số chuyên gia cho rằng, bất kỳ doanh nghiệp tư nhân nào đáp ứng được các tiêu chí: Công nghệ, kỹ thuật; năng lực tài chính và phương án huy động tài chính khả thi; năng lực quản trị và vận hành; khả năng kiểm soát rủi ro, đều có thể làm dự án Đường sắt tốc độ cao Bắc - Nam.
Sự kiện - 01/06/2025 08:38
Nhiều ý kiến góp ý hoàn thiện Quỹ Nhà ở quốc gia
Một số chuyên gia, doanh nghiệp kiến nghị có thể sử dụng những dự án nhà ở tái định cư hoặc loại hình khác nhưng chưa triển khai, chưa sử dụng hiệu quả, để làm NOXH.
Sự kiện - 31/05/2025 10:05
[Cafe Cuối tuần] Đường sắt tốc độ cao Bắc – Nam: Phép thử lớn cho doanh nghiệp tư nhân Việt
Dự án đường sắt tốc độ cao Bắc – Nam đang được xem là một trong những công trình hạ tầng giao thông chiến lược, mang tính bước ngoặt trong lịch sử phát triển quốc gia. Với tổng vốn đầu tư hàng chục tỷ USD và yêu cầu kỹ thuật, công nghệ khắt khe, đây không chỉ là một dự án giao thông đơn thuần, mà còn là phép thử về năng lực quản trị, phối hợp đa ngành, đa cấp, khả năng huy động nguồn lực và đặc biệt là niềm tin vào sức bật của kinh tế tư nhân Việt Nam.
Sự kiện - 31/05/2025 08:30
Bộ VHTTDL công bố, trao quyết định bổ nhiệm cán bộ
Chiều 30/5 tại Hà Nội, Thứ trưởng Bộ VHTTDL Hồ An Phong đã chủ trì buổi Lễ công bố và trao quyết định bổ nhiệm cán bộ.
Sự kiện - 31/05/2025 08:01
Thủ tướng: Doanh nghiệp Nhà nước phải khắc phục tình trạng đầu tư kém hiệu quả
Thủ tướng Phạm Minh Chính yêu cầu doanh nghiệp Nhà nước tiếp tục nâng cao hiệu quả hoạt động sản xuất kinh doanh, tập trung nguồn lực vào lĩnh vực kinh doanh chính, đầu tư các dự án lớn, trọng tâm, trọng điểm, kiên quyết khắc phục tình trạng đầu tư dàn trải, kém hiệu quả.
Sự kiện - 30/05/2025 17:05
- Đọc nhiều
Đáng đọc
- Đáng đọc
Tổng Bí thư Tô Lâm: 'Bộ tứ trụ cột' để giúp đất nước cất cánh
Sự kiện - Update 2 week ago
Thủ tướng: Cần truyền cảm hứng cho doanh nhân cống hiến vì đất nước
Sự kiện - Update 2 week ago
Chuyên gia: Không nên quá ‘hoảng loạn’ với con số thuế 46% từ Mỹ
Tài chính - Update 2 month ago