Thấy gì sau cú hích của DeepSeek?

PHƯƠNG ANH
10:34 08/02/2025

Đằng sau thành công của công ty AI Trung Quốc khiến cả thế giới chấn động là câu chuyện định hình lại cuộc đua công nghệ.

Mô hình AI mã nguồn mở DeepSeek R1 ra mắt vào ngày 20/1 gây chấn động mạnh mẽ trên thị trường công nghệ toàn cầu.

Khoảnh khắc "lịch sử"

Do công ty khởi nghiệp Trung Quốc DeepSeek phát triển, DeepSeek R1 nổi bật với khả năng xử lý ngôn ngữ vượt trội và chi phí phát triển thấp hơn đáng kể so với các đối thủ phương Tây như GPT-4 của OpenAI.

DeepSeek R1 chỉ cần 2.000 chip chuyên dụng, trong khi các mô hình tương tự của Mỹ thường yêu cầu tới 16.000 chip, giúp giảm đáng kể chi phí và tài nguyên cần thiết.

(Ảnh minh họa)

Ngay sau khi DeepSeek R1 xuất hiện, thị trường chứng khoán công nghệ phản ứng tiêu cực. Chỉ số Nasdaq Composite giảm 3,1%, làm bốc hơi 1.000 tỷ USD vốn hóa thị trường. Đặc biệt, cổ phiếu của Nvidia – nhà cung cấp chip AI hàng đầu – mất gần 600 tỷ USD giá trị chỉ trong vài ngày. Các nhà đầu tư lo ngại rằng DeepSeek với tính năng mã nguồn mở và miễn phí, có thể làm suy yếu vị thế của các công ty AI phương Tây, vốn dựa mô hình thu phí và phần cứng đắt đỏ.

Giới chính trị gia Mỹ và châu Âu dù vậy nhanh chóng bày tỏ lo ngại về rủi ro bảo mật. Bộ Thương mại Mỹ xem xét điều tra khả năng DeepSeek vi phạm các hạn chế về chip của Mỹ.

Một số lo ngại rằng công nghệ này có thể bị lạm dụng để tạo ra nội dung giả mạo hoặc đánh cắp dữ liệu người dùng. Tại Australia, chính phủ cấm sử dụng DeepSeek trong tất cả các hệ thống và thiết bị của chính phủ do lo ngại về an ninh quốc gia.

Các chuyên gia công nghệ nhận định sự trỗi dậy của DeepSeek có thể làm thay đổi cán cân quyền lực trong lĩnh vực AI. Trung Quốc, vốn bị Mỹ áp đặt lệnh cấm chip cao cấp, nay lại tạo ra một giải pháp AI mạnh mẽ được cho là không phụ thuộc vào công nghệ phương Tây.

Điều này đặt ra thách thức lớn cho các tập đoàn Mỹ như OpenAI và Google DeepMind, đồng thời mở ra một kỷ nguyên cạnh tranh gay gắt trong ngành AI toàn cầu.

Định hình lại chiến tranh công nghệ?

Câu chuyện DeepSeek xuất hiện giữa cao điểm cạnh tranh thương mại và công nghệ, trong đó có cạnh tranh Mỹ - Trung tiếp tục làm dấy lên những cuộc thảo luận. Một nhận định phổ biến là các biện pháp hạn chế của Mỹ với Trung Quốc, liên quan đến khả năng tiếp cận công nghệ cao, đã không hiệu quả khi một công ty Trung Quốc lại làm nên chuyện trong hoàn cảnh bị Mỹ hạn chế.

Chuyên gia đầu tư Jennifer Zhu Scott bình luận trên Financial Times, rằng nhiều người sửng sốt khi nhóm nghiên cứu của DeepSeek đều được đào tạo trong nước. Theo Scott, thành công của DeepSeek làm suy yếu các rào cản đã được tạo ra trong cuộc chiến công nghệ giữa Mỹ và Trung Quốc, bên cạnh đó, đánh dấu khoảnh khắc lịch sử về việc “trao sức mạnh AI vào tay nhân loại”, thay vì một vài ông lớn công nghệ có khả năng vốn, tính toán và năng lượng khổng lồ.

(Ảnh minh họa)

Tuy nhiên, các phòng thí nghiệm AI của Mỹ vẫn đang dẫn đầu, theo một số chuyên gia. Dù những cải tiến của DeepSeek là có thật và góp phần lớn vào việc giúp các hệ thống AI ngày nay rẻ hơn và dễ tiếp cận hơn, xét về mức độ đột phá, đây vẫn là công nghệ tối ưu hóa được OpenAI và những công ty khác phát triển trước.

Về phương pháp, DeepSeek R1 sử dụng phương pháp đào tạo gọi là Tối ưu hóa chính sách tương đối nhóm (GRPO), được phát triển nội bộ. Phương pháp này tăng cường khả năng lập luận của mô hình bằng cách tinh chỉnh các quy trình ra quyết định của mô hình thông qua các chu kỳ học lặp lại. Ngoài ra, mô hình sử dụng kiến ​​trúc "hỗn hợp các chuyên gia", giúp tối ưu hóa hiệu quả tính toán bằng cách chỉ kích hoạt các tập hợp con có liên quan của mô hình trong các tác vụ cụ thể.

GRPO được xây dựng dựa trên khung Tối ưu hóa chính sách gần (PPO), là một trong những thuật toán được ưa chuộng để giải quyết các vấn đề Học máy tăng cường (RL). Nó được phát triển vào năm 2017 bởi John Schuman, người đồng sáng lập OpenAI.

Về phần cứng, mặc dù có những hạn chế từ Mỹ về việc xuất khẩu phần cứng cao cấp sang Trung Quốc, DeepSeek R1 được đào tạo bằng 2.048 GPU Nvidia (Mỹ). Việc sử dụng hiệu quả các tài nguyên phần cứng có sẵn này nhấn mạnh thiết kế được tối ưu hóa của mô hình, cho phép đạt hiệu suất cao mà không cần cơ sở hạ tầng tính toán mở rộng.

Trong các tình huống không thể có chip GPU Nvidia, DeepSeek vẫn có tùy chọn phần cứng thay thế bao gồm GPU từ các nhà sản xuất khác như AMD (Hà Lan) hoặc phần cứng chuyên dụng như Bộ xử lý Tensor (TPU) của Google. Các giải pháp thay thế này có thể cung cấp khả năng tính toán tương đương để đào tạo các mô hình AI lớn. Tuy nhiên, các lựa chọn này cũng có thể chịu ảnh hưởng khác nhau từ các hạn chế thương mại của Mỹ.

Trước tình hình này, các ông lớn công nghệ Trung Quốc cũng đã tham gia vào cuộc chơi. Theo nhà phân tích AI Alexander Doria, R1 của DeepSeek ban đầu được đào tạo bằng H100 của Nvidia nhưng hiện dựa vào chip Ascend 910C của Huawei. Mặc dù chip 910C của Huawei không mạnh bằng H100 của Nvidia trong việc đào tạo, nhưng nó lại hoạt động tốt trong việc phản hồi, giúp DeepSeek cắt giảm chi phí trong khi vẫn duy trì khả năng cạnh tranh.

Điều này cho thấy điện toán AI đang chuyển từ phần cứng do phương Tây sản xuất sang các giải pháp thay thế do Trung Quốc sản xuất, điều có thể rất quan trọng trong cuộc đua AI toàn cầu.

Đường dài mới biết ngựa hay

Theo nhà phân tích công nghệ Casey Newton của Platformer, "sự trỗi dậy" của DeepSeek phản ánh một thực tế là các sáng kiến công nghệ đang thay đổi và bị vượt qua nhanh chóng.  Newton cho biết, thời của GPT-3, các đối thủ của OpenAI mất nhiều tháng hoặc lâu hơn để tiến hành kỹ thuật đảo ngược quy trình và tiếp thu cải tiến, nên để các kỹ thuật đó trở thành mô hình nguồn mở được cung cấp miễn phí có thể mất một năm. 

Nhưng DeepSeek cho thấy các phòng thí nghiệm nguồn mở đã tiến bộ hơn nhiều trong kỹ thuật đảo ngược, và bất kỳ thành tích nào mà các phòng thí nghiệm AI Mỹ đưa ra đều có thể nhanh chóng bị vượt qua.

Sử dụng chip Huawei có thể giúp DeepSeek giảm phụ thuộc vào Nvidia.

Dù vậy, ngành công nghiệp đã lường trước được kịch bản này, khi các công ty nguồn mở sẽ tiến hành kỹ thuật đảo ngược mọi thứ mà các phòng thí nghiệm lớn đang làm và dẫn đến chi phí đào tạo và suy luận AI sẽ giảm đáng kể theo thời gian.

Bên cạnh đó, các thiết bị và cơ sở hạ tầng công nghệ cao, quy mô lớn (mà các công ty Mỹ đầu tư vào) vẫn đóng vai trò quan trọng, để khai phá những kỹ thuật mà các nhà phát triển nguồn mở chưa sao chép, và để phục vụ nhu cầu mà các mô hình mạnh mẽ và có khả năng hơn tạo ra.

Về các hạn chế xuất khẩu chip, đây là các biện pháp kiểm soát tương đối mới, được cho là cần nhiều thời gian hơn để thực sự tỏ ra có hiệu lực. Một tác động chính của các biện pháp kiểm soát xuất khẩu là công ty Trung Quốc sẽ có ít năng lực tính toán hơn so với các công ty Mỹ nói chung trong một thời gian. Điều đó có nghĩa là ngay cả khi các công ty Trung Quốc như DeepSeek phát hành các mô hình mạnh hơn, họ sẽ không triển khai chúng rộng rãi như mong muốn.

Nhìn về phía trước, một số chuyên gia dự đoán rằng khi các mô hình AI hội tụ về kiến ​​trúc Transformer (một kiến trúc mô hình học sâu khác), tầm quan trọng của hệ sinh thái phần mềm Nvidia có thể giảm. Chuyên môn của DeepSeek trong việc tối ưu hóa phần cứng và phần mềm cũng có thể làm giảm đáng kể sự phụ thuộc vào Nvidia, cung cấp cho các công ty AI này một giải pháp thay thế tiết kiệm chi phí hơn, đặc biệt là cho suy luận.

Tuy nhiên, để cạnh tranh trên quy mô toàn cầu, các công ty Trung Quốc sẽ phải vượt qua thách thức về tính ổn định trong đào tạo và tinh chỉnh hơn nữa cơ sở hạ tầng điện toán AI của mình.

  • Cùng chuyên mục
Lập trình bằng AI, cơ hội mới từ 'cái bắt tay' của FPT và TOBESOFT

Lập trình bằng AI, cơ hội mới từ 'cái bắt tay' của FPT và TOBESOFT

FPT và TOBESOFT, doanh nghiệp tiên phong trong chuyển đổi số và công nghệ low-code (phương pháp phát triển ứng dụng, phần mềm mà không yêu cầu viết mã lập trình truyền thống), vừa ký kết Biên bản Ghi nhớ chiến lược (MoU) nhằm thúc đẩy ứng dụng nền tảng low-code tích hợp trí tuệ nhân tạo (AI-powered low-code) trên phạm vi toàn cầu.

Công nghệ - 27/08/2025 15:42

FPT 'bắt tay' công ty công nghệ của tập đoàn hàng không lớn nhất Nhật Bản

FPT 'bắt tay' công ty công nghệ của tập đoàn hàng không lớn nhất Nhật Bản

FPT vừa ký kết thỏa thuận hợp tác chiến lược toàn diện với ANA Systems – công ty CNTT trực thuộc ANA Group, tập đoàn hàng không lớn nhất Nhật Bản – nhằm thúc đẩy đổi mới sáng tạo và tối ưu hóa hiệu quả vận hành cho ngành hàng không.

Công nghệ - 09/08/2025 14:01

Viettel, VinaPhone lọt top toàn cầu về tốc độ mạng di dộng và 5G

Viettel, VinaPhone lọt top toàn cầu về tốc độ mạng di dộng và 5G

Viettel đứng thứ 3 bảng xếp hạng mạng di động nhanh nhất thế giới trong khi VinapPhone đứng thứ 2 ở hạng mục mạng 5G.

Công nghệ - 06/08/2025 16:00

Đầu tư từ Nhật Bản vào Việt Nam trong ngành dịch vụ, công nghệ tăng

Đầu tư từ Nhật Bản vào Việt Nam trong ngành dịch vụ, công nghệ tăng

Ông Abe Ryota - chuyên gia Kinh tế cao cấp của Ngân hàng Sumitomo Mitsui cho biết, trong khi dòng vốn của Nhật Bản vào lĩnh vực sản xuất tại Việt Nam có phần chững lại thì vào các ngành phi sản xuất như dịch vụ và công nghệ lại có sự tăng trưởng đáng kể.

Công nghệ - 06/08/2025 14:47

‘AI không thể sánh kịp con người về sự thấu cảm và sáng tạo’

‘AI không thể sánh kịp con người về sự thấu cảm và sáng tạo’

Ông Colin Blackwell, chủ tịch Hyperion Fintech, công ty dịch vụ công nghệ tài chính tại Thụy Sĩ, cho rằng AI tự động hóa một loạt các công việc văn phòng lặp đi lặp lại như phân tích dữ liệu, lập báo cáo nhưng không thể có cảm xúc và sự sáng tạo như con người.

Công nghệ - 26/07/2025 07:42

Doanh nghiệp là động lực chính để thúc đẩy phát triển công nghệ 5G

Doanh nghiệp là động lực chính để thúc đẩy phát triển công nghệ 5G

Theo chuyên gia, Việt Nam đã tận dụng tốt các chiến lược để có thể phát triển 5G một cách tiết kiệm và hiệu quả. Điều này có thể thúc đẩy phát triển ngành công nghiệp tỷ USD vào năm 2030.

Công nghệ - 24/07/2025 14:51

Hà Nội đề xuất triển khai dịch vụ công số thân thiện trên thiết bị di động

Hà Nội đề xuất triển khai dịch vụ công số thân thiện trên thiết bị di động

Hà Nội đề xuất Trung ương cho phép thành phố triển khai dịch vụ công số thân thiện trên thiết bị di động tích hợp với Cổng Dịch vụ công Quốc gia để đáp ứng nhu cầu của người dân Thủ đô.

Công nghệ - 24/06/2025 07:30

Ra mắt liên minh AI Âu Lạc

Ra mắt liên minh AI Âu Lạc

Trong bối cảnh Quyết định 1131/QĐ-TTg do Thủ tướng Chính phủ vừa ban hành xác định 11 nhóm công nghệ chiến lược ảnh hưởng sâu rộng đến năng lực cạnh tranh và tự chủ công nghệ của quốc gia, trong đó AI được xếp ở vị trí số 1, lần đầu tiên hơn 20 cơ quan nhà nước, doanh nghiệp, trường đại học "bắt tay" thành lập Liên minh AI Âu Lạc

Công nghệ - 20/06/2025 19:23

Từ quốc gia nhỏ bé đến cường quốc số: Học gì từ hành trình chuyển đổi số đột phá của Estonia?

Từ quốc gia nhỏ bé đến cường quốc số: Học gì từ hành trình chuyển đổi số đột phá của Estonia?

Estonia - một quốc gia chỉ có khoảng 1,3 triệu dân, đã trở thành hình mẫu toàn cầu trong ứng dụng AI vào chuyển đổi số chính phủ, từ đó gợi mở nhiều chính sách cho Việt Nam.

Công nghệ - 17/06/2025 06:45

Vẫn chưa có Siri hỗ trợ AI, 'cá nhân hóa hơn' từ Apple

Vẫn chưa có Siri hỗ trợ AI, 'cá nhân hóa hơn' từ Apple

Tại Hội nghị các nhà phát triển toàn cầu năm nay (WWDC 25), Apple đã công bố một loạt các bản cập nhật cho hệ điều hành, dịch vụ và phần mềm của mình, bao gồm giao diện mới được gọi là 'Liquid Glass' và quy ước đặt tên thương hiệu được đổi mới.

Công nghệ - 10/06/2025 10:16

TikTok Việt Nam mở lớp đào tạo pháp lý, quảng cáo TMĐT cho doanh nghiệp, nhà bán hàng

TikTok Việt Nam mở lớp đào tạo pháp lý, quảng cáo TMĐT cho doanh nghiệp, nhà bán hàng

TikTok Việt Nam và Cục Thương mại điện tử và Kinh tế số (Bộ Công thương) kỳ vọng tạo dựng hệ sinh thái TMĐT lành mạnh, hỗ trợ doanh nghiệp địa phương, đặc biệt là doanh nghiệp nhỏ và vừa, phát triển mạnh mẽ hơn trong kỷ nguyên số.

Công nghệ - 12/05/2025 10:53

Việt Nam có thể dẫn đầu thế giới nếu làm AI sức khoẻ

Việt Nam có thể dẫn đầu thế giới nếu làm AI sức khoẻ

Các chuyên gia cho rằng, Việt Nam sở hữu lợi thế lớn về nguồn dữ liệu sức khoẻ và có thể dẫn đầu thế giới nếu công nghệ trí tuệ nhân tạo (AI) về chăm sóc sức khoẻ.

Công nghệ - 10/05/2025 12:38

Hàng trăm 'ông lớn' về chuyển đổi số, AI sẽ ký hợp tác với Tập đoàn FPT

Hàng trăm 'ông lớn' về chuyển đổi số, AI sẽ ký hợp tác với Tập đoàn FPT

Theo ông Vũ Anh Tú, Giám đốc Công nghệ Tập đoàn FPT, sắp tới, sẽ có hơn 300 lãnh đạo các doanh nghiệp hàng đầu về chuyển đổi số, AI trên thế giới đến Đà Nẵng để ký kết hợp tác với FPT.

Công nghệ - 09/05/2025 16:57

Nhiều 'ông lớn' bắt tay làm mạng Blockchain của người Việt

Nhiều 'ông lớn' bắt tay làm mạng Blockchain của người Việt

Không chỉ là một công nghệ, mạng Blockchain "make in Việt Nam" sẽ là hạ tầng số phi tập trung cho dữ liệu công, dịch vụ công, tài chính số và các ứng dụng công nghệ sổ cái phân tán (DLT) cho kinh tế số Việt Nam.

Công nghệ - 06/05/2025 14:16

FPT hợp tác với các tập đoàn hàng đầu Nhật Bản trước sự chứng kiến của 2 Thủ tướng

FPT hợp tác với các tập đoàn hàng đầu Nhật Bản trước sự chứng kiến của 2 Thủ tướng

Ông Trương Gia Bình, Chủ tịch HĐQT Tập đoàn FPT cho rằng, Việt Nam và Nhật Bản đang có hợp tác chặt chẽ và cần bổ khuyết chính nguồn nhân lực tài năng, trẻ và đầy khát vọng.

Công nghệ - 29/04/2025 10:21

Đà Nẵng 'bắt tay' với hai ông lớn công nghệ về bán dẫn, AI

Đà Nẵng 'bắt tay' với hai ông lớn công nghệ về bán dẫn, AI

TP. Đà Nẵng công nhận CTCP FPT và Công ty TNHH Công nghệ Marvell Việt Nam là đối tác chiến lược trong lĩnh vực vi mạch bán dẫn, trí tuệ nhân tạo (AI).

Công nghệ - 26/04/2025 17:40