Những xu hướng AI mới nhất, được các chuyên gia tổng hợp.
Nhận những thông tin chuyên sâu được chọn lọc về các tin tức AI quan trọng và thú vị nhất. Đăng ký nhận bản tin Think hàng tuần của chúng tôi. Xem Tuyên bố về Quyền riêng tư của IBM .
Trong lĩnh vực công nghệ, một năm có thể dài như cả thập kỷ ở bất cứ lĩnh vực nào khác.
Hãy nghĩ mà xem: một năm trước, chúng ta đã thảo luận về việc ChatGPT không thể đếm được số chữ “r” trong từ “strawberry” (dâu tây). Các mô hình suy luận từ các phòng thí nghiệm tiên tiến của Trung Quốc (như DeepSeek-R1 ) chưa tạo được tiếng vang lớn trên thế giới, và các tác nhân suy luận mã nguồn mở cũng vậy.
Công cụ lập trình chuyên dụng của Claude vẫn chưa tồn tại. IBM Granite 3.0 mới chỉ ra mắt . Và cuộc thảo luận về công cụ lập trình chuyên dụng cũng chỉ mới bắt đầu: MCP vừa mới thu hút được sự chú ý vào mùa xuân, với sự ủng hộ đáng kể từ Sam Altman.
Trong khi đó, trong lĩnh vực cơ sở hạ tầng, chip và tài nguyên tính toán ngày càng khan hiếm , tạo lợi thế cạnh tranh cho các thị trường mới.
Trong vài tuần qua, IBM Think đã trò chuyện với hàng chục chuyên gia trong lĩnh vực công nghệ—các nhà nghiên cứu, nhà sáng lập và lãnh đạo từ IBM và các công ty khác—để thu thập những hiểu biết của họ về những gì sẽ diễn ra trong năm tới. Mỗi người đều chia sẻ một niềm tin chung cho năm tới: tốc độ đổi mới sẽ không chậm lại trong năm 2026.
“Đây là một thời điểm vô cùng điên rồ,” Peter Staar, một thành viên chủ chốt trong nhóm nghiên cứu tại Phòng thí nghiệm IBM Research Zurich, chia sẻ với IBM Think trong một cuộc phỏng vấn. “Và tốc độ của nó chỉ ngày càng nhanh hơn.”
Những khả năng mới của trí tuệ nhân tạo sẽ mở ra những cơ hội mới cho cả doanh nghiệp và cá nhân. “Tôi thực sự thấy sự tương đồng giữa việc sản xuất âm nhạc theo phong cách Rick Rubin với việc sáng tạo bằng trí tuệ nhân tạo,” kỹ sư ưu tú Chris Hay của IBM chia sẻ với IBM Think . “Tôi không chỉ giới hạn ở việc lập trình. Tôi nghĩ tất cả chúng ta sẽ trở thành những nhà soạn nhạc AI, cho dù bạn là người làm marketing, lập trình viên hay quản lý dự án.”
Nhiều người tin rằng hiệu quả sẽ là mục tiêu hàng đầu mới. “GPU sẽ vẫn là số một, nhưng các bộ tăng tốc dựa trên ASIC , thiết kế chiplet, suy luận tương tự và thậm chí cả các bộ tối ưu hóa hỗ trợ lượng tử sẽ phát triển hoàn thiện hơn”, Kaoutar El Maghraoui, nhà khoa học nghiên cứu chính tại IBM, cho biết trong sự kiện Mixture of Experts tuần này . “Có thể một loại chip mới dành cho các tác vụ dựa trên tác nhân sẽ xuất hiện.”
Sau nhiều hoài nghi về lợi tức đầu tư (ROI) của AI, khả năng của AI sẽ mở ra những cách thức kinh doanh mới trong doanh nghiệp. Và các mô hình và tác nhân suy luận mã nguồn mở sẽ tiếp tục vượt qua các giới hạn để chinh phục AI doanh nghiệp.
Đồng thời, sự tin tưởng và bảo mật sẽ trở thành những ưu tiên hàng đầu khi nhiều doanh nghiệp tập trung hơn vào chủ quyền trí tuệ nhân tạo.
Đó chỉ là màn mở đầu cho những gì sắp diễn ra trong lĩnh vực công nghệ doanh nghiệp trong những ngày tới. Hãy đọc tiếp để tìm hiểu 18 dự đoán của chuyên gia đáng chú ý trong năm 2026.
Nhận những thông tin chuyên sâu được chọn lọc về các tin tức AI quan trọng và thú vị nhất. Đăng ký nhận bản tin Think hàng tuần của chúng tôi. Xem Tuyên bố về Quyền riêng tư của IBM .
Đến năm 2026, cuộc cạnh tranh sẽ không tập trung vào các mô hình AI, mà là vào các hệ thống.
“Chúng ta sắp đạt đến điểm bão hòa về hàng hóa,” Gabe Goodhart , Kiến trúc sư trưởng về Đổi mới mở AI tại IBM, cho biết trong một cuộc phỏng vấn với IBM Think . “Đây là thị trường của người mua. Bạn có thể chọn mô hình phù hợp nhất với trường hợp sử dụng của mình và bắt đầu cuộc đua. Bản thân mô hình sẽ không phải là yếu tố khác biệt chính.”
Điều quan trọng bây giờ là sự phối hợp : kết hợp các mô hình, công cụ và quy trình làm việc. “Nếu bạn sử dụng ChatGPT, bạn không nói chuyện với một mô hình AI,” ông giải thích. “Bạn đang nói chuyện với một hệ thống phần mềm bao gồm các công cụ để tìm kiếm trên web, thực hiện tất cả các loại tác vụ lập trình riêng lẻ khác nhau và rất có thể là một vòng lặp tác nhân.”
“Tôi nghĩ đến năm 2026, chúng ta sẽ thấy nhiều mô hình định tuyến hợp tác hơn ,” Goodhart nói. “Sẽ có những mô hình nhỏ hơn có thể thực hiện nhiều việc và ủy thác cho mô hình lớn hơn khi cần thiết. Ai thành công trong việc tích hợp hệ thống ở cấp độ này sẽ định hình thị trường.”
Đến năm 2026, xử lý tài liệu sẽ không còn là công việc chỉ dựa vào một mô hình duy nhất. Thay vì buộc một hệ thống duy nhất phải diễn giải toàn bộ tệp, các quy trình phân tích cú pháp tổng hợp sẽ chia tài liệu thành các phần (tiêu đề, đoạn văn, bảng, hình ảnh) và chuyển từng phần đến mô hình hiểu nó tốt nhất.
“Điều này cho phép chúng tôi giảm chi phí tính toán trong khi vẫn cải thiện độ chính xác vì mỗi phần tử được diễn giải bởi lớp mô hình hiểu rõ nó nhất,” Brian Raymond , người sáng lập và CEO của Unstructured , chia sẻ với IBM Think . Unstructured chuyển đổi dữ liệu phi cấu trúc thành dữ liệu sạch sẵn sàng cho AI.
“Kết quả là một lớp tái tạo linh hoạt tổng hợp một bản thể hiện chính xác của nguồn gốc ban đầu trong khi vẫn duy trì những đảm bảo mạnh mẽ về cấu trúc, nguồn gốc và ý nghĩa,” Raymond nói. Gần đây, Unstructured đã tích hợp khả năng phát hiện đối tượng của Docling thuộc IBM Research để đạt được mục tiêu này, từ đó tăng độ chính xác tổng thể.
Tiếp theo là phân tích cú pháp dựa trên tác nhân. Hãy tưởng tượng đó là một nhóm chuyên gia về lĩnh vực cụ thể—nhưng họ là các tác nhân AI—liên tục quét kho dữ liệu của bạn, xây dựng hồ sơ ngữ nghĩa chuyên sâu và lập chỉ mục mọi thứ trên một đồ thị đa chiều. “Điều này cung cấp khả năng tìm kiếm hoạt động đồng thời trên ý định, cấu trúc, nội dung và siêu dữ liệu, đồng thời giúp truy cập được những kiến thức nội bộ trước đây không thể tiếp cận được trong thời gian thực,” Raymond nói.
Nhìn chung, những tiến bộ này hướng đến các hệ thống dữ liệu doanh nghiệp tự nhận thức, một nền tảng cho việc ra quyết định nhanh hơn và quy trình làm việc thông minh hơn vào năm 2026.
“Chúng ta đã vượt qua kỷ nguyên của các tác nhân đơn chức năng,” Chris Hay , Kỹ sư ưu tú tại IBM, cho biết trong một tập gần đây của chương trình Mixture of Experts . Năm 2024, các tác nhân nhỏ và chuyên biệt: người viết email, trợ lý nghiên cứu. Nhưng giờ đây, với khả năng suy luận , các tác nhân có thể lập kế hoạch, gọi các công cụ và hoàn thành các nhiệm vụ phức tạp.
“Chúng ta đang chứng kiến sự trỗi dậy của cái mà tôi gọi là ‘siêu điệp viên’,” Hay nói.
“Tôi dự đoán đến năm 2026, các hệ thống điều khiển tác nhân và bảng điều khiển đa tác nhân sẽ trở thành hiện thực. Bạn sẽ khởi chạy các tác vụ từ một nơi duy nhất, và các tác nhân đó sẽ hoạt động trên nhiều môi trường khác nhau—trình duyệt, trình soạn thảo, hộp thư đến của bạn—mà không cần bạn phải quản lý hàng tá công cụ riêng biệt,” Hay nói. Hãy quên đi phần mềm tĩnh trong trải nghiệm người dùng và giao diện người dùng. Hay dự đoán, hãy kỳ vọng vào các giao diện và ứng dụng có thể thích ứng với mọi tình huống, biến mỗi người dùng thành một nhà soạn nhạc AI.
“Ai nắm giữ cánh cửa dẫn đến vị trí của siêu môi giới sẽ định hình thị trường.”
Năm 2026 sẽ được định hình bởi ba xu hướng đưa trí tuệ nhân tạo vượt ra ngoài phạm vi năng suất cá nhân, theo Kevin Chung , Giám đốc Chiến lược tại Writer , một nền tảng trí tuệ nhân tạo doanh nghiệp dành cho công việc tự động hóa.
“Đầu tiên, AI đang chuyển từ việc sử dụng cá nhân sang điều phối nhóm và quy trình làm việc ,” Chung nói với IBM Think . Điều đó có nghĩa là điều phối toàn bộ quy trình làm việc, kết nối dữ liệu giữa các phòng ban và đưa các dự án từ ý tưởng đến khi hoàn thành.
Thứ hai, khi khả năng suy luận được cải thiện, các hệ thống sẽ không chỉ tuân theo chỉ dẫn mà còn dự đoán được nhu cầu. Ông nói: “Sự tiến hóa này biến trí tuệ nhân tạo từ một trợ lý thụ động thành một cộng tác viên tích cực, có khả năng giải quyết vấn đề và đưa ra quyết định có ý nghĩa”.
Cuối cùng, Chung nhận thấy sự thay đổi thú vị nhất: sự dân chủ hóa việc tạo ra các tác nhân AI. Ông giải thích: “Khả năng thiết kế và triển khai các tác nhân thông minh đang vượt ra khỏi phạm vi của các nhà phát triển và đến tay người dùng doanh nghiệp hàng ngày. Bằng cách giảm bớt các rào cản kỹ thuật, các tổ chức sẽ chứng kiến một làn sóng đổi mới được thúc đẩy bởi những người gần gũi nhất với các vấn đề thực tế.”
Các hệ thống tác nhân đã biến các mô hình học tập dựa trên ngôn ngữ (LLM) và trợ lý lập trình thành những thứ năng động hơn vào năm 2025. Và đây mới chỉ là khởi đầu, theo Ismael Faro , Phó Chủ tịch phụ trách Lượng tử và Trí tuệ nhân tạo tại IBM Research. Ông nhận thấy phần mềm đang chuyển từ tương tác không chính thức sang một phương pháp có cấu trúc, nơi người dùng đặt mục tiêu và xác nhận tiến độ trong khi các tác nhân tự động thực hiện nhiệm vụ và yêu cầu sự chấp thuận của con người.
“Thực tiễn phần mềm sẽ phát triển từ lập trình dựa trên cảm nhận sang Giao thức Xác thực Mục tiêu ,” Faro cho biết trong một cuộc phỏng vấn với IBM Think . “Người dùng sẽ xác định mục tiêu và xác thực trong khi tập hợp các tác nhân tự động thực thi, mở rộng ý tưởng về sự tham gia của con người , yêu cầu sự chấp thuận của con người tại các điểm kiểm tra quan trọng.”
Sự chuyển đổi này sẽ tạo điều kiện cho sự xuất hiện của các môi trường thực thi dựa trên tác nhân để vận hành các quy trình công việc phức tạp với cơ chế kiểm soát, và chuyển hành vi của tác nhân từ các đầu ra tĩnh, bị ràng buộc bởi mã lệnh sang khả năng thích ứng động, được hỗ trợ bởi các lược đồ hướng chính sách nhằm cân bằng giữa tính linh hoạt và khả năng kiểm soát.
Faro giải thích rằng đây sẽ là nền tảng cho một “Hệ điều hành tác nhân (AOS)”, hệ điều hành này sẽ chuẩn hóa việc điều phối, an toàn, tuân thủ và quản lý tài nguyên trên toàn bộ các nhóm tác nhân.
Ông nói: “Với sự chú trọng có kỷ luật vào bảo mật, quản lý tài nguyên, tuân thủ quy định và sự xuất sắc trong vận hành, các doanh nghiệp có thể tận dụng các tác nhân hệ thống chuyên gia để giành lại vị thế dẫn đầu trong lĩnh vực điện toán trọng yếu”.
Aaron Baughman , chuyên gia cấp cao của IBM và nhà phát minh bậc thầy, cho biết trong một tập gần đây của chương trình Mixture of Experts rằng các mô hình tạo sinh cần phải đa giác quan để chúng có thể diễn giải thế giới giống như con người và thậm chí phát hiện ra những tín hiệu mà chúng ta có thể bỏ sót .
Baughman đã làm việc với trí tuệ nhân tạo đa phương thức trong lĩnh vực thể thao và dẫn dắt một số dự án của IBM với giải US Open , ESPN Fantasy Football và giải Masters , đặc biệt là. Đối với ông, trí tuệ nhân tạo đa phương thức là một xu hướng mà ông dự đoán sẽ phát triển mạnh hơn nữa trong năm 2026.
“Những mô hình này sẽ có khả năng nhận thức và hành động trong một thế giới giống con người hơn nhiều. Chúng sẽ có khả năng kết nối ngôn ngữ, thị giác và hành động, tất cả cùng một lúc,” ông nói. “Trong tương lai gần, chúng ta sẽ bắt đầu thấy những người lao động kỹ thuật số đa phương thức có thể tự động hoàn thành các nhiệm vụ khác nhau để diễn giải mọi thứ, thậm chí có thể cả những trường hợp chăm sóc sức khỏe phức tạp.”
Nhưng quyền tự chủ không có nghĩa là loại bỏ sự giám sát của con người. “Trong tương lai, việc có sự tham gia của con người vào quá trình hoạt động của AI cũng rất quan trọng,” Baughman nói, “để con người có thể tinh chỉnh và thay đổi kỹ năng.”
Mới chỉ một năm kể từ khi Anthropic ra mắt MCP , cùng với ACP của IBM và A2A của Google . Nếu năm 2025 là năm của các tác nhân (agent), thì năm 2026 sẽ là năm mà tất cả các hệ thống đa tác nhân được đưa vào sản xuất, Kate Blair của IBM cho biết trong một cuộc phỏng vấn với IBM Think . Sự chuyển đổi đó phụ thuộc vào độ chín muồi và sự hội tụ của các giao thức.
“Năm 2026 là thời điểm những mô hình này sẽ được đưa từ phòng thí nghiệm ra ứng dụng thực tế,” Blair, người đứng đầu các sáng kiến BeeAI và Agent Stack của IBM, cho biết . Cả hai dự án đều được đóng góp cho Linux Foundation.
Mới đây, Linux Foundation đã thông báo về việc thành lập Agentic AI Foundation và sự đóng góp của Anthropic vào MCP. “Chúng tôi rất vui mừng khi MCP được quản trị mở,” Blair nói. “Các tiêu chuẩn cộng đồng được quản trị mở sẽ là điều mở khóa nhiều sự sáng tạo, đổi mới và giải pháp hơn.”
Dự án A2A sắp sửa ra mắt phiên bản chính đầu tiên. Bà cho biết: “Chúng tôi đã thấy sự hợp tác giữa A2A và MCP để chuẩn hóa một thẻ duy nhất mô tả một thực thể, cho dù đó là công cụ hay tài nguyên trong MCP hay tác nhân trong A2A”.
Blair coi thẻ thống nhất này như một chất xúc tác cho khả năng tương tác và cơ hội chia sẻ các sổ đăng ký, khám phá và sử dụng giữa các tác nhân và hệ thống tác nhân.
“Tôi rất hào hứng khi tiến đến cấp độ tiếp theo, nơi chúng ta thực sự thảo luận về các trường hợp sử dụng rộng rãi trong sản xuất, về việc các tác nhân giao tiếp với nhau.”
Atolio cung cấp nền tảng AI an toàn và riêng tư cho các doanh nghiệp. Thách thức mà họ nhận thấy ở khách hàng là nhu cầu phải nhanh chóng và thử nghiệm các công nghệ mới, đồng thời giảm thiểu rủi ro mất kiểm soát dữ liệu AI của mình.
“Xu hướng quan trọng nhất mà chúng tôi dự đoán sẽ nổi lên trong năm tới là sự chuyển dịch từ việc thử nghiệm và hào hứng với AI sang triển khai riêng tư và an toàn với kỳ vọng về lợi tức đầu tư thực sự trong các doanh nghiệp,” David Lanstein , đồng sáng lập kiêm CEO của Atolio , chia sẻ với IBM Think .
“Việc rò rỉ dữ liệu tiếp tục làm xói mòn lòng tin của doanh nghiệp,” ông nói. “Thách thức chưa được giải quyết về các cuộc tấn công chèn mã độc nhanh chóng vào môi trường sản xuất khiến cho chủ quyền dữ liệu và quyền truy cập cấp cao trở thành những yêu cầu không thể thiếu.”
Giải pháp không phải là những mô hình lớn hơn, mà là dữ liệu thông minh hơn. Như Lanstein đã nói: “Giá trị thực sự sẽ đến từ việc cung cấp cho các mô hình dữ liệu có cấu trúc, chất lượng cao và được cấp phép để tạo ra các câu trả lời thông minh, phù hợp và đáng tin cậy.”
“Điều khiến tôi hào hứng nhất là sự hội tụ cần thiết để biến điều này thành hiện thực,” ông nói, đồng thời chỉ ra “cam kết mới đối với an ninh, những tiến bộ và giải pháp hiểu rõ hơn về bối cảnh và nhu cầu của người dùng, cũng như sự phát triển liên tục của hệ sinh thái MCP.”
Được thành lập vào năm 2020, AuthMind đang giải quyết một trong những vấn đề khó khăn nhất trong an ninh mạng: cung cấp cho các công ty cái nhìn rõ ràng, gần như thời gian thực về quyền truy cập và hoạt động của mọi danh tính để họ có thể ngăn chặn các cuộc tấn công trước khi chúng bắt đầu.
“Trong những năm tới, trí tuệ nhân tạo có khả năng tự hành động và các thực thể phi nhân loại khác sẽ chiếm số lượng áp đảo so với người dùng là con người trong tổ chức,” Shlomi Yanai , Giám đốc điều hành kiêm đồng sáng lập của AuthMind , chia sẻ với IBM Think .
Sự thay đổi này sẽ định nghĩa lại an ninh và quản trị doanh nghiệp. “Đây hiện là mối quan tâm ở cấp hội đồng quản trị để đảm bảo mỗi tác nhân đều được kiểm soát và hoạt động đúng như dự định, từ đó tăng cả năng suất và bảo mật”, Yanai cho biết. Khi các tổ chức mở rộng việc áp dụng AI, thách thức không còn chỉ là triển khai các mô hình; mà là quản lý danh tính với những người dùng mới: các tác nhân tự động hoạt động trên nhiều hệ thống.
Đối với các doanh nghiệp, để giành được lợi thế trong bối cảnh này, cần trả lời ba câu hỏi quan trọng: Chúng ta có biết tất cả các tác nhân AI hiện có không? Chúng ta có hiểu nó đang truy cập vào những hệ thống nào không? Và chúng ta có tự tin vào những gì nó đang làm khi truy cập vào một hệ thống nào đó không?
Việc phát hiện, quan sát và bảo vệ không chỉ mọi con người mà còn mọi tác nhân AI đang trở nên thiết yếu đối với việc áp dụng AI một cách có trách nhiệm và an toàn. “Tôi vô cùng hào hứng theo dõi những công ty nắm vững được khả năng hiển thị, trách nhiệm giải trình và sự tin tưởng trên tất cả các danh tính của tác nhân AI,” Yanai nói.
“Xu hướng mạnh mẽ nhất mà tôi thấy trong năm tới là trí tuệ nhân tạo (AI) giải quyết các quy trình làm việc phức tạp của doanh nghiệp,” Steven Aberle , người sáng lập Rohirrim , một công ty khởi nghiệp chuyên về AI tập trung vào hệ sinh thái mua sắm hoàn chỉnh, cho biết trong một cuộc phỏng vấn với IBM Think . “Không phải như một bằng chứng về khái niệm, mà là một hệ thống đáng tin cậy có thể thực hiện các tác vụ phức tạp, từ đầu đến cuối.”
Các hệ thống tạo sinh và hệ thống tác nhân sẽ diễn giải ý định, tìm kiếm trên các mạng lưới rộng lớn, lựa chọn các công cụ phù hợp và tiếp tục cho đến khi đạt được kết quả. Ông giải thích: “Sự thay đổi đó tạo ra các loại nền tảng hoàn toàn mới, thậm chí cả các thị trường mới, bởi vì chúng ta không còn bị giới hạn bởi những gì một con người hay một ứng dụng duy nhất có thể ghi nhớ nữa. Đó chính là tự động hóa máy móc thực sự.”
Những chiếc máy biến áp đã làm nên điều này. “Chúng đã cung cấp cho chúng ta những hệ thống có thể tiếp thu lượng lớn văn bản, mã nguồn và lịch sử, sau đó phản hồi một cách tinh tế và chính xác với các cơ chế bảo vệ hiệu quả,” Aberle nói. “Chúng ta đang bước vào kỷ nguyên mà trí tuệ nhân tạo không chỉ đơn thuần trả lời câu hỏi mà còn trực tiếp ảnh hưởng đến kết quả.”
Trong lĩnh vực mua sắm, điều đó có nghĩa là theo dõi các yêu cầu, phát hiện sớm các thiếu sót và đề xuất các giải pháp khắc phục, giúp các chuyên gia có được sự rõ ràng và tốc độ để đưa ra các quyết định công bằng và nhanh chóng hơn.
Một năm trước, Matt White , Giám đốc điều hành của PyTorch Foundation , đã dự đoán rằng các mô hình nhỏ hơn sẽ đẩy trí tuệ nhân tạo đến giới hạn.
“Ngành công nghiệp đã chứng thực luận điểm rằng các mô hình nhỏ hơn, được tối ưu hóa theo từng lĩnh vực sẽ trở nên quan trọng,” White gần đây nói với IBM Think . “Những tiến bộ trong việc chắt lọc, lượng tử hóa và thời gian chạy tiết kiệm bộ nhớ đã thúc đẩy suy luận đến các cụm máy chủ biên và thiết bị nhúng, do nhu cầu về chi phí, độ trễ và chủ quyền dữ liệu.”
Theo White, ba yếu tố sẽ định hình AI mã nguồn mở vào năm 2026: sự đa dạng hóa mô hình toàn cầu, dẫn đầu bởi các bản phát hành đa ngôn ngữ và được tinh chỉnh về khả năng suy luận của Trung Quốc; khả năng tương tác như một trục cạnh tranh, khi các khung và môi trường chạy được điều chỉnh theo các tiêu chuẩn chung; và quản trị chặt chẽ hơn, với các bản phát hành được kiểm toán bảo mật và các đường dẫn dữ liệu minh bạch.
“Khi các hệ thống tác nhân xuất hiện, vai trò của PyTorch như một nền tảng chung cho việc huấn luyện, mô phỏng và điều phối sẽ ngày càng được củng cố,” White nói. “Các nhà phát triển cần các công cụ linh hoạt cho suy luận đa phương thức, các thành phần bộ nhớ và đánh giá phù hợp với an toàn, và đó là nơi mã nguồn mở phát triển mạnh.”
Peter Staar của IBM dự đoán năm 2026 sẽ đánh dấu sự chuyển dịch trong các ưu tiên nghiên cứu AI, hướng tới những ứng dụng hữu hình. Ông nói: “Robot và AI vật lý chắc chắn sẽ phát triển mạnh”. Mặc dù các mô hình ngôn ngữ quy mô lớn vẫn chiếm ưu thế, Staar lưu ý rằng ngành công nghiệp đang gặp phải tình trạng lợi nhuận giảm dần khi mở rộng quy mô. Ông giải thích: “Mọi người đang mệt mỏi với việc mở rộng quy mô và đang tìm kiếm những ý tưởng mới”.
Staar nhận thấy rất nhiều sự quan tâm đến trí tuệ nhân tạo có khả năng cảm nhận, hành động và học hỏi trong môi trường thực tế; đây chính là thách thức kỹ thuật: đây có thể là bước đột phá tiếp theo cho sự đổi mới.
Đồng thời, Staar tin rằng AI mã nguồn mở sẽ tiếp tục định hình bối cảnh cạnh tranh. Ông nói: “Những người dẫn đầu muốn giữ nó ở dạng đóng, còn những người đuổi theo sẽ chuyển sang dạng mở”.
Với việc NVIDIA nổi lên như một động lực chính của các hệ sinh thái mở — chủ yếu vì hoạt động kinh doanh của họ phụ thuộc vào việc áp dụng rộng rãi GPU hơn là các mô hình độc quyền — Staar dự đoán sự hợp tác sẽ tăng tốc khi AI vượt ra khỏi màn hình và tiến vào thế giới vật lý.
Năm 2024 khép lại với một năm đầy thành công đối với trí tuệ nhân tạo mã nguồn mở (open-source AI) khi các mô hình Llama của Meta thu hút được sự chú ý. Kể từ đó, hệ sinh thái trí tuệ nhân tạo mã nguồn mở đã phát triển mạnh mẽ, với các mô hình nhỏ hơn, chuyên biệt theo từng lĩnh vực đạt được những kết quả ấn tượng—điển hình là Granite của IBM , Olmo 3 của Ai2 và tất nhiên, các mô hình của DeepSeek. Anthony Annunziata , Giám đốc Trí tuệ Nhân tạo Mã nguồn Mở tại IBM và AI Alliance , dự đoán xu hướng này sẽ tăng tốc trong năm 2026.
“Chúng ta sẽ thấy những mô hình suy luận nhỏ hơn, đa phương thức và dễ điều chỉnh hơn cho các lĩnh vực cụ thể,” ông nói trong một cuộc phỏng vấn với IBM Think .
Những tiến bộ trong việc tinh chỉnh và học tăng cường cũng đồng nghĩa với việc các doanh nghiệp có thể áp dụng AI mã nguồn mở, đáp ứng nhu cầu về các mô hình nhỏ gọn và hiệu quả hơn. Ông cho biết: “Thay vì một mô hình khổng lồ cho mọi thứ, bạn sẽ có những mô hình nhỏ gọn và hiệu quả hơn, chính xác không kém – thậm chí có thể chính xác hơn – khi được tinh chỉnh cho từng trường hợp sử dụng phù hợp”.
Trí tuệ nhân tạo (AI) mã nguồn mở, dựa trên tác nhân sẽ thúc đẩy xu hướng này. “Các tác nhân đa năng không đủ cho lĩnh vực pháp lý, y tế hay sản xuất,” Annunziata nói. “Bạn cần các mô hình và kiến trúc chuyên biệt phản ánh quy trình làm việc của chuyên gia.”
Trí tuệ nhân tạo mã nguồn mở là điều cần thiết. Ông nói: “Nếu bạn tin rằng chúng ta đang hướng tới một nền kinh tế nơi khả năng tự động hóa của AI đảm nhiệm phần lớn công việc, thì các tiêu chuẩn tương tác phải được mở. Nếu không, bạn sẽ có những hệ thống phân mảnh, hoặc một nền tảng mà người thắng cuộc sẽ chiếm trọn tất cả.”
“Phần giữa rộng lớn của đường cong phân bố chuẩn trong doanh nghiệp bắt đầu chuyển từ giai đoạn thử nghiệm sang các hệ thống cấp độ sản xuất,” Tomás Hernando Kofman , đồng sáng lập của Not Diamond , một nền tảng cơ sở hạ tầng AI đa mô hình, cho biết trong một cuộc phỏng vấn với IBM Think .
Quá trình chuyển đổi đó sẽ không dễ dàng: “Các nhóm AI sẽ phải đầu tư mạnh vào việc đánh giá, độ tin cậy, tối ưu hóa, hiệu quả, khả năng mở rộng và khả năng bảo trì”, ông nói.
Việc này đòi hỏi sự phối hợp và nguồn lực đáng kể. Nếu các công ty không đầu tư, họ sẽ rơi vào bế tắc: thiếu năng lực cần thiết đồng nghĩa với việc hệ thống không hữu dụng, và sự thiếu hữu dụng đó chỉ làm trầm trọng thêm vấn đề.
Ở lĩnh vực tiên tiến, những thách thức lại khác. “Tôi tin rằng lĩnh vực này sẽ phải đối mặt với ba trở ngại lớn: học hỏi liên tục, bộ nhớ và khả năng mở rộng,” Kofman nói.
Công việc sẽ được thực hiện ở cả cấp độ kiến trúc mô hình và trong các hệ thống tác nhân.
“Chúng ta sẽ bắt đầu thấy các mạng lưới tác nhân phi tập trung có thể học hỏi lẫn nhau, chia sẻ thông tin và lưu giữ kiến thức quan trọng trong thời gian dài—vài tuần, vài tháng, thậm chí vài năm,” ông nói. “Các hệ thống này sẽ cải thiện tính năng động và sự tiến bộ liên tục, đồng thời cho phép các tác nhân và mô hình chuyên môn hóa thành các khả năng hiệu quả và tập trung.”
Không một thực thể đơn lẻ nào có thể giải quyết được cuộc khủng hoảng deepfake và AI vũ khí hóa, đặc biệt là khi các vectơ đe dọa mới—như các tác nhân AI vũ khí hóa—xuất hiện vào cuối năm nay, theo Ben Colman , Giám đốc điều hành kiêm đồng sáng lập của Reality Defender , một công ty an ninh mạng cung cấp các công cụ phát hiện deepfake. Sự phát triển nhanh chóng của AI tạo sinh đòi hỏi một hệ sinh thái hợp tác.
Ông chia sẻ với IBM Think : “Quan hệ đối tác chiến lược là điều thiết yếu, không chỉ để tăng cường khả năng phòng thủ, mà còn để dự đoán làn sóng tiếp theo của các mô hình tinh vi và các lỗ hổng bảo mật đặc thù của ngành.”
“Tôi thấy những mối quan hệ đối tác trong ngành của chúng ta, giữa chính chúng ta và những người khác đang nghiên cứu các khía cạnh khác nhau của một vấn đề tương tự, đang diễn ra nhanh chóng, thậm chí còn nhanh hơn cả những tiến bộ trong trí tuệ nhân tạo.”
Colman nhận thấy xu hướng chuyển dịch sang mô hình an ninh nhiều lớp. Ông nói: “Bằng cách xếp chồng các lớp phòng thủ khác nhau, những lỗ hổng trong lớp này sẽ được lớp khác che lấp để tạo ra một lá chắn bất khả xâm phạm”.
Việc tích hợp sẽ định hình giai đoạn tiếp theo. Ông nói: “Khi các công nghệ mới nổi này kết hợp với các nền tảng phát hiện như của chúng tôi, kết quả sẽ là một chiến lược ‘phòng thủ nhiều lớp’ toàn diện. Điều này đảm bảo các tổ chức được bảo vệ trên tất cả các định dạng phương tiện và điểm truy cập, cho tất cả các trường hợp sử dụng và trong tất cả các bộ công cụ – thay vì dựa vào một điểm yếu duy nhất.”
Các tổ chức không thể để các dự án AI của mình bị gián đoạn—nhưng các nhà lãnh đạo doanh nghiệp chỉ có thể kiểm soát được một phần nào đó. Quyền tự chủ về AI—khả năng quản lý các hệ thống, dữ liệu và cơ sở hạ tầng AI mà không cần dựa vào các thực thể bên ngoài—đã trở nên tối quan trọng, theo Anthony Marshall , Giám đốc cấp cao và Phó Chủ tịch của Viện Giá trị Kinh doanh IBM (IBV).
Theo khảo sát của IBV , 93% các nhà điều hành cấp cao cho rằng việc đưa chủ quyền AI vào chiến lược kinh doanh sẽ là điều bắt buộc trong năm 2026. “Đây không chỉ là việc làm cho có lệ”, ông Marshall nói.
Một nửa số giám đốc điều hành lo ngại về sự phụ thuộc quá mức vào tài nguyên điện toán ở một số khu vực nhất định (mối lo ngại này đặc biệt cao đối với các nhà lãnh đạo doanh nghiệp ở Trung Đông và khu vực châu Á – Thái Bình Dương), và nhiều người tin rằng việc dựa dẫm vào những tài nguyên đó có thể dẫn đến nhiều rủi ro. Ví dụ như rò rỉ dữ liệu, mất quyền truy cập dữ liệu và đánh cắp tài sản trí tuệ.
Tính minh bạch và sự tin tưởng cũng sẽ vẫn là những ưu tiên hàng đầu. “Cả cơ quan quản lý và người tiêu dùng đều yêu cầu các tổ chức giải thích cách các tác nhân AI đưa ra các quyết định cụ thể. Các tổ chức phải thiết kế các tác nhân có thể chứng minh được quá trình hoạt động của chúng, ngay cả đối với những kết quả phức tạp nhất”, ông Marshall cho biết.
Điều đó có nghĩa là xây dựng chủ quyền thông qua tính mô đun – thiết kế môi trường AI sao cho khối lượng công việc, dữ liệu và tác nhân có thể di chuyển giữa các khu vực và nhà cung cấp đáng tin cậy.
“Việc giám sát liên tục là điều cần thiết để phát hiện và giải quyết sự sai lệch của mô hình trước khi nó ảnh hưởng đến hiệu suất hoặc gây ra sai lệch,” Marshall cho biết.
Nguồn :https://www.ibm.com/think/news/ai-tech-trends-predictions-2026
Cuộc cách mạng AI trong phát triển phần mềm Lĩnh vực phát triển phần mềm đang trải qua một sự […]
Hiện đại hóa chu trình phát triển phần mềm bằng sức mạnh của trí tuệ nhân tạo. Báo cáo “Nghịch […]
Trong kỷ nguyên “Composable Architecture” (Kiến trúc lắp ghép) hiện nay, việc xây dựng website không còn bó buộc trong […]
Trong bối cảnh kỹ thuật số không ngừng thay đổi, các tổ chức đang rất cần cung cấp nội dung […]
Trong môi trường kinh doanh hiện đại, danh thiếp truyền thống đang dần nhường chỗ cho các giải pháp số […]
Trong kỷ nguyên số, tốc độ và chất lượng là hai yếu tố quyết định sự thành công của một […]
