1. AI đa phương thức – Động lực tăng tốc cuộc đua hạ tầng

Sự phát triển của AI đang chuyển mạnh mẽ từ giai đoạn chỉ xử lý văn bản sang mô hình đa phương thức (Multimodal AI). Mô hình này có khả năng hiểu và sinh nội dung kết hợp nhiều dạng dữ liệu khác nhau, bao gồm văn bản, hình ảnh, âm thanh, và video. Xu hướng này đánh dấu một bước tiến vượt bậc, giúp AI tiến gần hơn đến khả năng nhận thức và tương tác toàn diện như con người. Tuy nhiên, khả năng này cũng tạo ra một nhu cầu tính toán khổng lồ và chưa từng có.
Minh họa điển hình cho xu thế này là Sora của OpenAI. Sora là một mô hình có khả năng tạo ra các video có độ phân giải cao và phức tạp chỉ từ mô tả bằng văn bản. Để đạt được năng lực này, Sora đòi hỏi sức mạnh tính toán lớn gấp nhiều lần so với các mô hình ngôn ngữ thế hệ trước. Theo các ước tính cụ thể, việc huấn luyện Sora cần từ 4.200 đến 10.500 GPU Nvidia H100 trong vòng một tháng. Con số này chỉ mới là chi phí cho giai đoạn huấn luyện.
Về mặt triển khai trên quy mô lớn, nhu cầu về phần cứng sẽ tăng lên theo cấp số nhân. Ước tính cho thấy, để triển khai Sora phục vụ người dùng rộng rãi, nhu cầu có thể lên tới 720.000 GPU H100. Điều này tương đương với một khoản đầu tư phần cứng trị giá hơn 21,6 tỷ USD. Nhu cầu tính toán khổng lồ này đang trực tiếp thúc đẩy một cuộc xây dựng hạ tầng mới, đòi hỏi tiêu tốn cực kỳ nhiều năng lượng. Quan trọng hơn, nó tiếp tục củng cố quyền lực của các siêu cường công nghệ, những bên có khả năng chi trả cho quy mô đầu tư và vận hành này. Cuộc đua về AI đa phương thức về cơ bản là cuộc chơi của các tập đoàn và quốc gia dẫn đầu, nơi mà nguồn lực tài chính và khả năng tiếp cận chip bán dẫn tiên tiến là yếu tố quyết định sự dẫn đầu. Đây là cuộc đua mà các quốc gia đang phát triển hoặc các công ty khởi nghiệp khó có thể tham gia trực diện.
Sự tập trung quyền lực tính toán này làm gia tăng rào cản gia nhập thị trường, tạo ra một sự phân cực rõ rệt. Các quốc gia đi sau, nếu không có chiến lược hợp lý, sẽ đối diện với nguy cơ tụt hậu vĩnh viễn và bị phụ thuộc hoàn toàn vào công nghệ của các siêu cường. Để giảm thiểu rủi ro này, cần phải tìm kiếm một hướng đi chiến lược khác, tập trung vào hiệu quả thay vì quy mô.
2. Mô hình ngôn ngữ nhỏ (SLM) – Hướng phi tập trung hóa quyền lực
Trái ngược hoàn toàn với xu thế “siêu mô hình” và sự tập trung quyền lực vào hạ tầng, sự trỗi dậy mạnh mẽ của Mô hình ngôn ngữ nhỏ (Small Language Models - SLM) đang mở ra một hướng đi chiến lược mang tính “phi tập trung hóa” quyền lực công nghệ. SLM tập trung vào việc tối ưu hóa bộ tham số và dữ liệu huấn luyện chuyên ngành. Những mô hình này đã chứng minh một điều quan trọng là quy mô không phải là yếu tố duy nhất quyết định hiệu suất của AI.
Các mô hình SLM, dù có ít tham số hơn nhiều, vẫn có thể đạt được hiệu suất cực kỳ cạnh tranh với các mô hình lớn hơn trong nhiều tác vụ cụ thể. Lấy ví dụ, mô hình mã nguồn mở Mistral 7B, với 7,3 tỷ tham số, đã đạt được các điểm chuẩn về hiệu năng tương đương với mô hình lớn hơn nhiều là GPT-3.5 trong nhiều tác vụ cụ thể. Lợi thế quyết định của SLM là chi phí. Chi phí vận hành (suy luận) của Mistral 7B chỉ bằng khoảng 10% so với các mô hình lớn. Chi phí vận hành thấp hơn đáng kể này làm cho SLM trở thành một lựa chọn kinh tế và khả thi cho nhiều doanh nghiệp và quốc gia.
Lợi ích chiến lược của SLM đặc biệt quan trọng và rõ rệt đối với các quốc gia không có tiềm lực dẫn đầu về hạ tầng. Một lợi ích lớn là khả năng triển khai tại biên (edge). SLM có thể hoạt động hiệu quả trên các thiết bị giới hạn về tài nguyên như điện thoại thông minh hoặc hệ thống Internet vạn vật (IoT). Điều này giúp giảm thiểu sự phụ thuộc vào hạ tầng đám mây đắt đỏ, đồng thời tăng tốc độ xử lý và quan trọng nhất là bảo vệ dữ liệu nhạy cảm. Khả năng bảo mật dữ liệu này là yếu tố then chốt trong các ngành đòi hỏi tuân thủ nghiêm ngặt như y tế và tài chính.
SLM cũng là một cửa thoát chiến lược cho các quốc gia đi sau. Thay vì cố gắng chạy đua về hạ tầng tính toán, các quốc gia này có thể tập trung nguồn lực để huấn luyện các mô hình SLM "chủ quyền" trên dữ liệu bản địa. Ví dụ, Việt Nam có thể tập trung vào dữ liệu tiếng Việt, luật pháp, y tế đặc thù của mình. Việc này sẽ tạo ra các ứng dụng AI có độ chính xác cao và phù hợp tuyệt đối với bối cảnh đặc thù của quốc gia, từ đó xây dựng lợi thế cạnh tranh mạnh mẽ trong các thị trường ngách.
Tiềm năng kinh tế của SLM là rất lớn. Thị trường SLM toàn cầu được dự báo sẽ tăng trưởng mạnh mẽ, từ 0,93 tỷ USD năm 2025 lên 5,45 tỷ USD vào năm 2032. Tốc độ tăng trưởng kép hàng năm (CAGR) được dự kiến đạt gần 29%. Những con số này cho thấy tiềm năng kinh tế to lớn của hướng đi chuyên môn hóa và hiệu quả này.
3. Tác nhân AI và Nền kinh tế tác nhân
Bước tiến hóa vượt bậc và có tiềm năng thay đổi sâu sắc nhất trên đường chân trời công nghệ chính là sự xuất hiện của các tác nhân AI (AI Agents). Tác nhân AI không còn là những công cụ chỉ đơn thuần phản hồi các câu lệnh đơn lẻ. Chúng là các hệ thống tự chủ, có khả năng nhận thức môi trường, suy luận, lập kế hoạch, và thực thi một chuỗi các hành động phức tạp để đạt được mục tiêu đã định trước.

Sự ra đời của tác nhân AI đại diện cho một bước chuyển từ AI với vai trò là một cỗ máy tạo nội dung sang AI với vai trò là một cỗ máy thực thi hành động hay một nhân viên kỹ thuật số có khả năng tự vận hành. Các phòng thí nghiệm hàng đầu thế giới, bao gồm Google/DeepMind, Microsoft, và Anthropic, đều đang đầu tư mạnh mẽ vào lĩnh vực này và đang thử nghiệm các tác nhân AI có khả năng điều hành toàn bộ quy trình phần mềm một cách tự động.
Sự phát triển này đang đặt nền móng cho một nền kinh tế tác nhân (Agent Economy) hoàn toàn mới. Trong nền kinh tế này, các tác nhân phần mềm tự chủ sẽ trở thành những chủ thể kinh tế chính. Chúng sẽ thực hiện các nhiệm vụ, quản lý tài nguyên, và thậm chí tự giao dịch với nhau một cách độc lập.
Các tác nhân này có khả năng tự động hóa toàn bộ quy trình công việc trong nhiều lĩnh vực quan trọng. Ví dụ, trong lĩnh vực bán hàng, chúng có thể tự động đánh giá khách hàng tiềm năng; trong hỗ trợ khách hàng, chúng có thể quản lý và giải quyết các yêu cầu phức tạp; và trong vận hành, chúng có thể tối ưu hóa chuỗi cung ứng. Sự tự động hóa sâu rộng này giúp tăng năng suất và giảm chi phí một cách đáng kể.
Các dự báo thị trường cho thấy tiềm năng kinh tế khổng lồ của xu thế tác nhân AI. Theo báo cáo của Allied Market Research, thị trường cho các tác nhân AI được dự báo sẽ đạt quy mô gần 200 tỷ USD vào năm 2034. Hơn nữa, theo phân tích của PwC, nền kinh tế tác nhân có thể tạo ra tác động lên tới 15,7 nghìn tỷ USD cho GDP toàn cầu vào năm 2030. Ông Jensen Huang, CEO của Nvidia, đã gọi đây là “cơ hội nghìn tỷ USD tiếp theo” trong bài phát biểu tại hội nghị GTC 2024, nhấn mạnh tầm quan trọng chiến lược và tiềm năng kinh tế vô tận của xu thế này. Tác nhân AI sẽ là công cụ cuối cùng để khai thác hiệu quả các mô hình AI, dù là mô hình lớn hay mô hình nhỏ.
4. Các Công nghệ Bổ trợ và Cuộc đua Hai Tốc độ
Bên cạnh các xu hướng cốt lõi đã đề cập, một loạt các lĩnh vực công nghệ liên quan đang phát triển nhanh chóng và bổ trợ đắc lực cho cuộc cách mạng AI. Sự nổi lên của AI có thể giải thích (Explainable AI - XAI) đang đáp ứng nhu cầu minh bạch ngày càng cao, đặc biệt quan trọng khi các tác nhân AI ngày càng tự chủ và đưa ra các quyết định phức tạp.
AI cho khám phá khoa học (AI for Scientific Discovery) đang giúp tăng tốc đột phá trong các lĩnh vực then chốt như y sinh và nghiên cứu khí hậu. Đồng thời, AI hiện hữu (Embodied AI) tích hợp trí tuệ vào robot và hệ thống tự hành. Điều này hứa hẹn tự động hóa sâu rộng và toàn diện trong sản xuất và dịch vụ.
Sự phân hóa công nghệ này đang tạo ra một "cuộc đua hai tốc độ" rõ rệt trên toàn cầu.
Tốc độ thứ nhất: Đây là cuộc đua về các mô hình nền tảng đa phương thức và tác nhân AI quy mô lớn, cuộc đua này ngày càng khốc liệt, tốn kém, và tập trung quyền lực vào một số ít chủ thể. Đây là sân chơi mà các siêu cường đang thống trị.
Tốc độ thứ hai: Đây là sự trỗi dậy của các mô hình ngôn ngữ nhỏ (SLM), mở ra một sân chơi mới. Trên sân chơi này, sự chuyên môn hóa, hiệu quả, và dữ liệu chất lượng cao trở thành những lợi thế cạnh tranh cốt lõi. Đây chính là con đường chiến lược khả thi và đầy hứa hẹn cho các quốc gia không có tiềm lực dẫn đầu về hạ tầng.
5. Lựa chọn Chiến lược cho các Quốc gia đi sau
Đối với các quốc gia không dẫn đầu về hạ tầng, việc đưa ra một lựa chọn chiến lược rõ ràng là bài toán sống còn. Cần phải tránh đối đầu trực diện trong cuộc đua về quy mô và thay vào đó, tập trung toàn lực vào cuộc đua về hiệu quả và chuyên môn hóa.
Theo đuổi tham vọng xây dựng một mô hình cạnh tranh trực tiếp với các mô hình lớn như GPT-5 là một chiến lược tốn kém và không khả thi. Thay vào đó, một chiến lược khôn ngoan và thực tế hơn là dồn nguồn lực để xây dựng các SLM "Make in Vietnam" hàng đầu thế giới trong các lĩnh vực chuyên biệt. Các lĩnh vực tiềm năng bao gồm y tế, nông nghiệp, và pháp luật, dựa trên các bộ dữ liệu "chủ quyền" độc đáo và có giá trị cao.
Đây không phải là một chiến lược "hạng hai" mà là con đường khả thi duy nhất để đạt được tự chủ công nghệ và tạo ra lợi thế cạnh tranh thực sự trên trường quốc tế. Bằng cách tập trung vào những thị trường ngách mà dữ liệu và sự am hiểu bản địa là tài sản quý giá nhất, các quốc gia đi sau có thể tạo ra sự khác biệt và dẫn đầu trong lĩnh vực chuyên môn của mình.
6. Kết luận
Cuộc cạnh tranh AI toàn cầu đang định hình lại nền kinh tế và địa chính trị thế giới. Nó được thúc đẩy bởi sự bùng nổ của AI đa phương thức đòi hỏi hạ tầng tính toán siêu lớn và sự trỗi dậy chiến lược của Mô hình ngôn ngữ nhỏ (SLM) cùng với sự hình thành của Nền kinh tế tác nhân.
Thách thức đối với các quốc gia không phải là siêu cường nằm ở việc lựa chọn giữa hai tốc độ của cuộc đua. Chiến lược khả thi và hiệu quả nhất là tập trung vào tốc độ thứ hai bằng cách khai thác triệt để tiềm năng của Mô hình ngôn ngữ nhỏ (SLM) và sự chuyên môn hóa.
Các quốc gia cần thực hiện chiến lược trọng tâm này. Điều đó bao gồm tránh đối đầu trực diện về quy mô và dồn toàn lực vào xây dựng các SLM "chủ quyền" hàng đầu thế giới trong các lĩnh vực chuyên biệt. Bằng cách tận dụng lợi thế về dữ liệu bản địa độc đáo, các quốc gia có thể đạt được tự chủ công nghệ và tạo ra các giải pháp AI có độ chính xác cao, phù hợp với bối cảnh đặc thù của mình. Đây là chìa khóa để chuyển mình từ một thị trường tiêu thụ công nghệ trở thành một trung tâm phát triển và ứng dụng AI có tính chiến lược và hiệu quả cao trên bản đồ công nghệ toàn cầu.
Người thực hiện
Trần Thị Thùy Dương
Trung tâm Công nghệ - Chính phủ số,
Cục Chuyển đổi số quốc gia