Xây dựng nền tảng cho AI tại Việt Nam với dữ liệu tiếng Việt mã nguồn mở

THANH THANH
12:03 14/03/2025

Các mô hình AI hỗ trợ tiếng Việt một cách tự nhiên và toàn diện ngay từ trong lõi để mở khoá tiềm năng các ứng dụng AI tại Việt nam

Trong khuôn khổ Hội nghị Quốc tế về Trí tuệ Nhân tạo và Bán dẫn (AISC) 2025 vào sáng 14/3, tại Trung tâm Đổi mới sáng tạo quốc gia (NIC), Tập đoàn Meta phối hợp với NIC chính thức khởi động Chương trình Thách thức Đổi mới sáng tạo 2025, đánh dấu năm triển khai thứ ba của chương trình với mục tiêu thúc đẩy phát triển lĩnh vực trí tuệ nhân tạo (AI) tại Việt Nam.

Chương trình năm nay tập trung vào Dự án ViGen với nỗ lực tạo ra bộ dữ liệu tiếng Việt mã nguồn mở chất lượng cao để đào tạo, đánh giá và từ đó nâng cao hiệu quả của các mô hình ngôn ngữ lớn (LLMs), giúp các mô hình AI hiểu rõ hơn văn hóa, bối cảnh và cách diễn đạt trong tiếng Việt.

Dự án này được kỳ vọng sẽ nâng cao sự hiện diện của tiếng Việt trong quá trình phát triển AI, đồng thời góp phần thúc đẩy nền kinh tế số phát triển vượt bậc và bền vững.

Dự án ViGen khởi nguồn từ hợp tác ba bên giữa Meta, NIC và tổ chức "AI for Vietnam". Trong đó, NIC đóng vai trò là đơn vị chủ quản, điều phối, bảo đảm dự án phù hợp với các mục tiêu quốc gia của Việt Nam. "AI for Vietnam" là đối tác triển khai dự án với những hỗ trợ về kỹ thuật và tài chính từ Tập đoàn Meta. Các đối tác chiến lược bao gồm NVIDIA, Viettel, và Viện Hàn lâm Khoa học và Công nghệ Việt Nam.

Ông Sarim Aziz, Giám đốc Chính sách Công tại Meta chia sẻ tại sự kiện. Ảnh: Thanh Thanh.

Sứ mệnh của VIC 2025 - dự án ViGen là làm cho các mô hình AI hỗ trợ tiếng Việt một cách tự nhiên và toàn diện ngay từ trong lõi để mở khoá tiềm năng các ứng dụng AI tại Việt nam. ViGen sẽ xây dựng các bộ dữ liệu tiếng Việt nguồn mở với quy mô lớn và chất lượng cao để đào tạo và đánh giá khả năng của các mô hình AI. Dự án ViGen cũng đóng góp vào việc đảm bảo sự phát triển AI ở Việt Nam phù hợp với giá trị văn hoá và tiêu chuẩn đạo đức ở Việt Nam, hướng tới việc xây dựng một hệ sinh thái AI mã nguồn mở phù hợp với bối cách địa phương và có trách nhiệm.

Nhằm hỗ trợ dự án, Meta sẽ đóng góp các bộ dữ liệu mã nguồn mở từ chương trình AI và Dữ liệu vì Lợi ích Cộng đồng của mình, bao gồm những thông tin chi tiết về di chuyển và kết nối xã hội, cũng như dữ liệu đào tạo từ các bản đồ dân số có sự hỗ trợ của AI.

Bên cạnh Dự án ViGen với trọng tâm nâng cao sự hiện diện của tiếng Việt trong phát triển AI thông qua các bộ dữ liệu mã nguồn mở, Meta và Deloitte cũng công bố cuốn cẩm nang dành cho khu vực công mang tên "Đổi mới sáng tạo trong khu vực công ở châu Á - Thái Bình Dương với AI mã nguồn mở: Khai phá tiềm năng đột phá cùng Llama" tại sự kiện khai mạc chương trình "Thách thức đổi mới sáng tạo". Cẩm nang này sẽ cung cấp lộ trình giúp các cơ quan chính phủ tích hợp hiệu quả công nghệ AI mã nguồn mở. Sự kết hợp giữa các sáng kiến này hướng đến mục tiêu xây dựng một chiến lược AI đồng bộ tại Việt Nam, mang lại lợi ích cho cả khu vực công và tư nhân.

"Dự án ViGen và Thử thách Đổi mới Sáng tạo Việt Nam không chỉ nhằm thúc đẩy công nghệ, mà còn hướng tới xây dựng một tương lai AI toàn diện, tôn vinh và tích hợp di sản văn hóa và ngôn ngữ độc đáo của Việt Nam".

GS. Yann LeCun, Phó chủ tịch, Kiến trúc sư trưởng về Trí tuệ Nhân tạo của Tập đoàn Meta

Chia sẻ tại cuộc họp báo, ông Trần Việt Hùng, Nhà sáng lập & CEO, Tổ chức AI for Vietnam cho biết, ở Việt Nam, AI vẫn chưa được ứng dụng hiệu quả mà một trong ngững hạn chế là các ứng dụng sử dụng tiếng Việt rất ít.

"Nếu không nhanh chúng ta sẽ vuột mất cơ hội . Do vậy, việc hỗ trợ tiếng Viêt rất qquan trọng...", ông Hùng nhấn mạnh

ông Trần Việt Hùng, Nhà sáng lập & CEO, Tổ chức AI for Vietnam chia sẻ về dự án ViGen. Ảnh: Thanh Thanh 

Tổ chức AI For Vietnam đã chính thức tham gia vào Liên minh AI toàn cầu. Dự án ViGen - với sự hỗ trợ của NIC và Meta - hoàn toàn phù hợp với sáng kiến dữ liệu mở và tin cậy (OTDI) của Liên minh AI. Cụ thể, Project ViGen sẽ đóng góp cho cộng đồng những bộ dữ liệu lớn và chất lượng cao bằng tiếng Việt nhằm cải thiện hiện trạng tiếng Việt đang bị coi là một ngôn ngữ còn hiện diện hết sức khiêm tốn trong AI. Project ViGen cũng cho thấy sức mạnh và giá trị của những mô hình mã nguồn mở như Llama, cho phép phát triển các giải pháp sáng tạo có tác động tuần cầu có tính đến ngữ cảnh của tiếng Việt.

Ông Võ Xuân Hoài, Phó Giám đốc NIC nhấn mạnh, AI đang chuyển đổi thế giới. Do đó, việc phát triển các tập dữ liệu Việt Nam quy mô lớn, chất lượng cao và mã nguồn mở để đào tạo và đánh giá AI đã trở thành ưu tiên cấp bách.

"Dự án ViGen phù hợp với Nghị quyết 57/NQ-TW của Bộ Chính trị nhằm thúc đẩy đột phá trong khoa học, công nghệ, đổi mới sáng tạo và chuyển đổi số quốc gia. Dự án ViGen đòi hỏi nỗ lực chung từ các nhà hoạch định chính sách, nhóm nghiên cứu, nhà nghiên cứu, nhà phát triển, chuyên gia và người dùng. Cùng nhau, chúng ta sẽ biến AI thành một công cụ mạnh mẽ cho mọi người Việt Nam và đưa Việt Nam trở thành cường quốc AI toàn cầu…", lãnh đạo NIC kỳ vọng.

Theo ông Sarim Aziz, Giám đốc Chính sách Công tại Meta, không chỉ hỗ trợ các doanh nghiệp, Dự án ViGen hay những mô hình AI mã nguồn mở Llama còn hộ trợ cả khu vực công cũng như cả đất nước Việt Nam.

"2025 là một năm bản lề với tiến trình phát triển AI tại Việt Nam. Meta vinh dự được hợp tác cùng NIC và Tổ chức AI for Vietnam Foundation với Dự án ViGen. Thông qua hỗ trợ các nhà nghiên cứu, nhà phát triển và doanh nghiệp Việt Nam tiếp cận những mô hình AI mã nguồn mở như Llama cùng các nguồn lực phù hợp với bối cảnh địa phương, chúng tôi mong muốn giúp họ phát huy tối đa tiềm năng và thúc đẩy các sáng kiến AI mang tính ứng dụng cao, phù hợp với nhu cầu của Việt Nam", đại diện Meta chia sẻ.

Đại diện các bên tham gia Chương trình Thách thức Đổi mới sáng tạo 2025. Ảnh: NIC

Tại sự kiện, Meta, phối hợp cùng Deloitte đã chọn Việt Nam là quốc gia đầu tiên trong khu vực châu Á - Thái Bình Dương ra mắt cẩm nang mang tên "Đổi mới sáng tạo trong khu vực công ở châu Á - Thái Bình Dương với AI mã nguồn mở: Khai phá tiềm năng đột phá cùng Llama".
Cẩm nang này cung cấp các phương pháp tối ưu trong việc ứng dụng AI mã nguồn mở và đánh giá các ứng dụng thực tiễn của mô hình Llama trong các lĩnh vực quan trọng của khu vực công, bao gồm tương tác với người dân, quản lý hành chính công, tuân thủ chính sách, giáo dục, y tế, và an ninh công cộng.
Đặc biệt, cẩm nang giới thiệu hai ứng dụng thực tiễn đầy ấn tượng của mô hình Llama tại Việt Nam: Bộ Khoa học và Công nghệ đã hợp tác cùng MISA để thử nghiệm một trợ lý ảo, giúp giảm 98% thời gian tra cứu thông tin cho cán bộ, qua đó tăng hiệu suất làm việc và tiết kiệm thời gian; trong dự án với Bộ Tư Pháp, Viettel đã tận dụng Llama để triển khai trợ lý pháp lý ảo, giúp rút ngắn thời gian nghiên cứu văn bản pháp luật khoảng 30%.

  • Cùng chuyên mục
Doanh nghiệp Nhật Bản đề nghị Thủ tướng gỡ vướng các dự án cao tốc, metro, phổ biến xe hybrid

Doanh nghiệp Nhật Bản đề nghị Thủ tướng gỡ vướng các dự án cao tốc, metro, phổ biến xe hybrid

Hai bên đã rà soát, đánh giá tình hình hợp tác, đầu tư, thương mại Việt Nam - Nhật Bản; việc giải quyết các vướng mắc tại các dự án cụ thể.

Sự kiện - 12/08/2025 18:00

Hà Nội cụ thể hóa điều chỉnh quy hoạch chung Thủ đô

Hà Nội cụ thể hóa điều chỉnh quy hoạch chung Thủ đô

Hà Nội ban hành kế hoạch cụ thể hóa đồ án điều chỉnh quy hoạch chung Thủ đô, ưu tiên phủ kín các quy hoạch chung xã, quy hoạch phân khu đô thị, phân khu chức năng trong giai đoạn 2025-2027.

Sự kiện - 12/08/2025 13:38

Thủ tướng yêu cầu hoàn thành tuyến đường ven biển từ Quảng Ninh đến An Giang trước 2030

Thủ tướng yêu cầu hoàn thành tuyến đường ven biển từ Quảng Ninh đến An Giang trước 2030

Thủ tướng Chính phủ yêu cầu các bộ, ngành và địa phương đẩy nhanh tiến độ triển khai thi công xây dựng, phấn đấu hoàn thành toàn bộ tuyến đường bộ ven biển từ Quảng Ninh đến An Giang trước năm 2030.

Sự kiện - 12/08/2025 07:51

Việt Nam - Hàn Quốc phấn đấu kim ngạch thương mại song phương đạt 150 tỷ USD vào năm 2030

Việt Nam - Hàn Quốc phấn đấu kim ngạch thương mại song phương đạt 150 tỷ USD vào năm 2030

Việt Nam và Hàn Quốc sẽ tăng cường hợp tác, mở rộng quy mô đầu tư, góp phần đưa kim ngạch thương mại song phương đạt 150 tỷ USD vào năm 2030.

Sự kiện - 11/08/2025 15:59

Yên Tử tổ chức chuỗi sự kiện văn hóa suốt mùa thu

Yên Tử tổ chức chuỗi sự kiện văn hóa suốt mùa thu

Lần đầu tiên phường Yên Tử (tỉnh Quảng Ninh) tổ chức Lễ hội “Yên Tử - Sắc thu Thiền định” với chuỗi các sự kiện văn hóa, thể thao và du lịch hấp dẫn.

Sự kiện - 11/08/2025 14:02

Tạo đột phá phát triển kinh tế tư nhân như 'khoán 10' trong nông nghiệp trước đây

Tạo đột phá phát triển kinh tế tư nhân như 'khoán 10' trong nông nghiệp trước đây

Chiều 10/8, chủ trì cuộc làm việc với Ban Nghiên cứu phát triển kinh tế tư nhân (Ban IV, thuộc Hội đồng Tư vấn cải cách thủ tục hành chính của Thủ tướng Chính phủ), Thủ tướng Phạm Minh Chính nhấn mạnh cần tiếp tục triển khai thành công, hiệu quả Nghị quyết 68 của Bộ Chính trị, tạo đột phá thực sự để phát triển kinh tế tư nhân tương tự "khoán 10" trong nông nghiệp trước đây.

Sự kiện - 11/08/2025 09:51

Cận cảnh cao tốc La Sơn - Hòa Liên đang được mở rộng

Cận cảnh cao tốc La Sơn - Hòa Liên đang được mở rộng

Nhiều mũi thi công đang được chủ đầu tư triển khai tại dự án mở rộng cao tốc La Sơn - Hòa Liên, nhằm đảm bảo mục tiêu cơ bản hoàn thành trong năm 2025.

Sự kiện - 11/08/2025 06:42

Bộ Nội vụ sẽ hướng dẫn điều tiết công chức, nơi thiếu vẫn được tuyển thêm

Bộ Nội vụ sẽ hướng dẫn điều tiết công chức, nơi thiếu vẫn được tuyển thêm

Bộ Nội vụ cho biết thời gian tới sẽ ban hành hướng dẫn cụ thể để điều tiết công chức từ nơi thừa sang nơi thiếu. Nếu sau khi điều tiết mà vẫn chưa đủ nhân lực, các đơn vị, địa phương sẽ được tuyển dụng bổ sung.

Sự kiện - 11/08/2025 06:41

Hà Nội tăng cường tuyến bus phục vụ nhân dân dịp Quốc khánh

Hà Nội tăng cường tuyến bus phục vụ nhân dân dịp Quốc khánh

TP. Hà Nội tăng cường thêm các tuyến bus để phục vụ nhu cầu đi lại của nhân dân, du khách tham gia Triển lãm thành tựu kinh tế - xã hội nhân dịp kỷ niệm 80 năm Ngày Quốc khánh (2/9/1945-2/9/2025) tại Trung tâm Hội chợ triển lãm Quốc gia.

Sự kiện - 10/08/2025 11:39

TP.HCM thu hơn 43.000 tỷ đồng từ dự án của Vingroup, Lotte

TP.HCM thu hơn 43.000 tỷ đồng từ dự án của Vingroup, Lotte

Sở NN&MT TP.HCM cho biết, dự kiến năm 2025, nguồn thu trong công tác xác định giá đất cụ thể các công trình, dự án trên địa bàn TP.HCM của 153 dự án khoảng hơn 86.000 tỷ đồng. Trong đó, dự án Lotte Eco Smart City của Lotte và dự án Khu đô thị lấn biển Cần Giờ của Vingroup chiếm một nửa nguồn thu.

Sự kiện - 09/08/2025 15:36

[Cafe Cuối tuần] Khi bất động sản là chuyến bay toàn vé hạng thương gia

[Cafe Cuối tuần] Khi bất động sản là chuyến bay toàn vé hạng thương gia

"Sản phẩm thị trường bất động sản hiện nay giống như chiếc máy bay chỉ có hạng thương gia, hạng nhất mà không có hạng phổ thông", ý kiến của TS Trần Du Lịch phản ánh rất chính xác bối cảnh của thị trường bất động sản hiện nay.

Sự kiện - 09/08/2025 10:25

Ra mắt nền tảng giao dịch thương mại điện tử giúp doanh nghiệp Việt Nam tại thị trường Mỹ

Ra mắt nền tảng giao dịch thương mại điện tử giúp doanh nghiệp Việt Nam tại thị trường Mỹ

Ba lớp giá trị cốt lõi được tích hợp vào nền tảng gồm: số hóa chuỗi giao thương, chuẩn hóa ESG, và hỗ trợ tài chính, logistics toàn trình. Đây cũng chính là những "mắt xích" thường bị đứt gãy khiến doanh nghiệp Việt khó bước qua ngưỡng thị trường Mỹ.

Sự kiện - 09/08/2025 08:51

Hà Nội ra mắt nền tảng số 'A80 - Tự hào Việt Nam'

Hà Nội ra mắt nền tảng số 'A80 - Tự hào Việt Nam'

TP. Hà Nội chính thức ra mắt nền tảng số "A80 - Tự hào Việt Nam" nhân dịp chào mừng 80 năm Cách mạng tháng Tám thành công và Quốc khánh nước Cộng hòa xã hội chủ nghĩa Việt Nam.

Sự kiện - 08/08/2025 14:23

Thủ tướng chỉ đạo khẩn trương triển khai các biện pháp cần thiết để nâng hạng thị trường chứng khoán

Thủ tướng chỉ đạo khẩn trương triển khai các biện pháp cần thiết để nâng hạng thị trường chứng khoán

Thủ tướng Phạm Minh Chính giao Bộ Tài chính chủ trì phối hợp với các cơ quan liên quan triển khai ngay các biện pháp cần thiết để nâng hạng thị trường chứng khoán.

Sự kiện - 08/08/2025 09:08

Đường sắt tốc độ cao Bắc - Nam 'chốt' ngày khởi công

Đường sắt tốc độ cao Bắc - Nam 'chốt' ngày khởi công

Thủ tướng Phạm Minh Chính yêu cầu các địa phương giải phóng mặt bằng cho dự án đường sắt tốc độ cao Bắc - Nam, huy động cả hệ thống chính trị vào cuộc và tiến hành khởi công đồng loạt vào 19/12.

Sự kiện - 08/08/2025 06:45

Khởi động Better Choice Awards 2025 thúc đẩy đổi mới sáng tạo

Khởi động Better Choice Awards 2025 thúc đẩy đổi mới sáng tạo

Với thông điệp "Vươn mình bứt phá", cùng tinh thần "tự hào Việt Nam", Better Choice Awards 2025 sẽ vinh danh và truyền cảm hứng cho những dự án đổi mới sáng tạo.

Sự kiện - 07/08/2025 17:48