Liệu AI Agent có thể trở thành cứu cánh cho Web3+AI?
Dự án AI Agent trong khởi nghiệp Web2 chủ yếu là loại dịch vụ cho doanh nghiệp, trong khi trong lĩnh vực Web3, các dự án về đào tạo mô hình và tập hợp nền tảng đã trở thành xu hướng chính nhờ vai trò then chốt của chúng trong việc xây dựng hệ sinh thái.
Hiện tại, số lượng dự án AI Agent trong Web3 không nhiều, chiếm 8%, nhưng tỷ lệ thị trường của chúng trong lĩnh vực AI lại cao tới 23%, do đó thể hiện sức cạnh tranh mạnh mẽ trên thị trường. Chúng tôi dự đoán rằng với sự trưởng thành của công nghệ và sự nâng cao mức độ công nhận của thị trường, trong tương lai sẽ xuất hiện nhiều dự án có định giá trên 1 tỷ USD.
Đối với các dự án Web3, việc áp dụng công nghệ AI cho các sản phẩm ứng dụng không phải cốt lõi AI có thể trở thành lợi thế chiến lược. Đối với cách kết hợp dự án AI Agent, cần chú trọng vào việc xây dựng hệ sinh thái toàn diện và thiết kế mô hình kinh tế token để thúc đẩy sự phi tập trung và hiệu ứng mạng.
Cuộc cách mạng AI: Tình trạng ra mắt các dự án và sự gia tăng định giá
Kể từ khi ChatGPT ra mắt vào tháng 11 năm 2022, chỉ trong vòng hai tháng đã thu hút được hơn một trăm triệu người dùng, đến tháng 5 năm 2024, doanh thu hàng tháng của ChatGPT đã đạt đến con số 20,3 triệu đô la Mỹ đáng kinh ngạc, trong khi OpenAI cũng nhanh chóng phát hành các phiên bản lặp lại như GPT-4 và GP4-4o sau khi ra mắt ChatGPT. Với sự tăng trưởng nhanh chóng như vậy, các ông lớn công nghệ truyền thống đã nhận ra tầm quan trọng của các ứng dụng mô hình AI tiên tiến như LLM, và lần lượt tung ra các mô hình và ứng dụng AI của riêng mình, chẳng hạn như Google phát hành mô hình ngôn ngữ lớn PaLM2, Meta giới thiệu Llama3, trong khi các công ty Trung Quốc cho ra mắt các mô hình lớn như Wenxin Yiyan và Zhipu Qingyan, rõ ràng lĩnh vực AI đã trở thành một chiến trường không thể thiếu.
Cuộc đua của các ông lớn công nghệ không chỉ thúc đẩy sự phát triển của các ứng dụng thương mại, mà chúng tôi cũng nhận thấy từ thống kê điều tra nghiên cứu AI mã nguồn mở, báo cáo AI Index năm 2024 cho thấy số lượng dự án liên quan đến AI trên GitHub đã tăng vọt từ 845 vào năm 2011 lên khoảng 1,8 triệu vào năm 2023, đặc biệt là sau khi GPT được phát hành vào năm 2023, số lượng dự án đã tăng 59,3% so với cùng kỳ năm trước, phản ánh sự nhiệt tình của cộng đồng nhà phát triển toàn cầu đối với nghiên cứu AI.
Sự đam mê với công nghệ AI đã được phản ánh trực tiếp trong thị trường đầu tư, với thị trường đầu tư AI đang thể hiện sự tăng trưởng mạnh mẽ, đặc biệt là trong quý 2 năm 2024 với sự bùng nổ. Toàn cầu có tổng cộng 16 khoản đầu tư liên quan đến AI vượt quá 150 triệu USD, gấp đôi so với quý 1. Tổng số vốn huy động của các startup AI đã tăng vọt lên 24 tỷ USD, tăng hơn gấp đôi so với năm trước. Trong đó, xAI thuộc sở hữu của Elon Musk đã huy động được 6 tỷ USD, với định giá 24 tỷ USD, trở thành công ty khởi nghiệp AI có định giá cao thứ hai, chỉ sau OpenAI.
Sự phát triển nhanh chóng của công nghệ AI đang định hình lại diện mạo của lĩnh vực công nghệ với tốc độ chưa từng có. Từ cuộc cạnh tranh gay gắt giữa các gã khổng lồ công nghệ, đến sự phát triển mạnh mẽ của các dự án cộng đồng mã nguồn mở, cho đến sự cuồng nhiệt của thị trường vốn đối với khái niệm AI. Các dự án xuất hiện liên tục, số tiền đầu tư đạt mức cao kỷ lục, và định giá cũng theo đó tăng vọt. Nhìn chung, thị trường AI đang ở một thời kỳ vàng son phát triển nhanh chóng, với các mô hình ngôn ngữ lớn và công nghệ tạo nội dung tăng cường tìm kiếm đã đạt được những tiến bộ đáng kể trong lĩnh vực xử lý ngôn ngữ. Tuy nhiên, những mô hình này vẫn đối mặt với thách thức khi chuyển đổi lợi thế công nghệ thành sản phẩm thực tế, như sự không chắc chắn trong đầu ra của mô hình, rủi ro tạo ra thông tin không chính xác và vấn đề minh bạch của mô hình. Những vấn đề này trở nên đặc biệt quan trọng trong các tình huống ứng dụng yêu cầu độ tin cậy cực cao.
Trong bối cảnh này, chúng tôi bắt đầu nghiên cứu về AI Agent, vì AI Agent nhấn mạnh tính toàn diện trong việc giải quyết các vấn đề thực tế và tương tác với môi trường. Sự chuyển mình này đánh dấu sự tiến hóa của công nghệ AI từ các mô hình ngôn ngữ thuần túy sang các hệ thống thông minh có khả năng thực sự hiểu, học hỏi và giải quyết các vấn đề trong thế giới thực. Do đó, chúng tôi thấy hy vọng từ sự phát triển của AI Agent, nó đang dần thu hẹp khoảng cách giữa công nghệ AI và việc giải quyết các vấn đề thực tế. Sự tiến hóa của công nghệ AI đang không ngừng định hình lại cấu trúc của năng suất, trong khi công nghệ Web3 đang tái cấu trúc các mối quan hệ sản xuất trong nền kinh tế số. Khi ba yếu tố chính của AI: dữ liệu, mô hình và sức mạnh tính toán, hòa quyện với các khái niệm cốt lõi của Web3 như phi tập trung, kinh tế token và hợp đồng thông minh, chúng tôi dự đoán sẽ tạo ra một loạt các ứng dụng đổi mới. Trong lĩnh vực giao thoa đầy tiềm năng này, chúng tôi tin rằng, AI Agent với khả năng tự thực hiện nhiệm vụ, đã thể hiện tiềm năng to lớn trong việc đạt được ứng dụng quy mô lớn.
Để thực hiện điều đó, chúng tôi bắt đầu nghiên cứu sâu về những ứng dụng đa dạng của AI Agent trong Web3, từ cơ sở hạ tầng Web3, middleware, đến các ứng dụng, cũng như các thị trường dữ liệu và mô hình, với mục tiêu nhận diện và đánh giá những loại dự án và kịch bản ứng dụng triển vọng nhất, nhằm hiểu sâu sắc sự kết hợp chặt chẽ giữa AI và Web3.
Làm rõ khái niệm: Giới thiệu và phân loại AI Agent
Giới thiệu cơ bản
Trước khi giới thiệu AI Agent, để giúp độc giả hiểu rõ hơn sự khác biệt giữa định nghĩa và mô hình của nó, chúng ta sẽ lấy một ví dụ từ một tình huống thực tế: giả sử bạn đang lên kế hoạch cho một chuyến du lịch. Các mô hình ngôn ngữ lớn truyền thống cung cấp thông tin về điểm đến và gợi ý du lịch. Công nghệ tạo sinh tăng cường tìm kiếm có thể cung cấp nội dung điểm đến phong phú và cụ thể hơn. Còn AI Agent giống như Jarvis trong bộ phim Iron Man, có thể hiểu nhu cầu và còn chủ động tìm kiếm chuyến bay và khách sạn dựa trên một câu nói của bạn, thực hiện các thao tác đặt chỗ và thêm lịch trình vào lịch.
Hiện nay, định nghĩa phổ biến về AI Agent trong ngành là hệ thống thông minh có khả năng cảm nhận môi trường và thực hiện hành động tương ứng, thu thập thông tin môi trường thông qua cảm biến, xử lý và sau đó tác động đến môi trường thông qua bộ thi hành (Stuart Russell & Peter Norvig, 2020). Chúng tôi cho rằng, AI Agent chính là trợ lý kết hợp các khả năng của LLM, RAG, trí nhớ, lập kế hoạch nhiệm vụ và sử dụng công cụ. Nó không chỉ cung cấp thông tin đơn thuần, mà còn có khả năng lập kế hoạch, phân tách nhiệm vụ và thực hiện một cách thực sự.
Dựa trên định nghĩa và đặc điểm này, chúng ta có thể nhận thấy AI Agent đã sớm hòa nhập vào cuộc sống của chúng ta, được áp dụng trong nhiều bối cảnh khác nhau, chẳng hạn như AlphaGo, Siri, và hệ thống lái tự động cấp độ L5 trở lên của Tesla đều có thể được coi là những ví dụ về AI Agent. Đặc điểm chung của những hệ thống này là chúng đều có khả năng nhận thức đầu vào từ người dùng bên ngoài và từ đó tạo ra ảnh hưởng tương ứng đến môi trường thực tế.
Lấy ChatGPT làm ví dụ để làm rõ khái niệm, chúng ta nên chỉ rõ rằng Transformer là kiến trúc kỹ thuật tạo thành mô hình AI, GPT là chuỗi mô hình phát triển dựa trên kiến trúc này, trong khi GPT-1, GPT-4, GPT-4o lần lượt đại diện cho các phiên bản của mô hình ở các giai đoạn phát triển khác nhau. ChatGPT là AI Agent tiến hóa dựa trên mô hình GPT.
Phân loại tổng quan
Hiện tại, thị trường AI Agent vẫn chưa hình thành tiêu chuẩn phân loại thống nhất. Chúng tôi đã gán nhãn cho 204 dự án AI Agent trong thị trường Web2+Web3, dựa trên nhãn nổi bật của từng dự án, chia thành phân loại cấp một và cấp hai. Trong đó, phân loại cấp một gồm ba loại: cơ sở hạ tầng, tạo nội dung, và tương tác người dùng, sau đó được phân tách theo các trường hợp sử dụng thực tế.
Cơ sở hạ tầng: Loại này tập trung vào việc xây dựng nội dung cơ bản trong lĩnh vực Agent, bao gồm nền tảng, mô hình, dữ liệu, công cụ phát triển, cũng như các dịch vụ B2B ứng dụng cơ bản đã phát triển.
Công cụ phát triển: Cung cấp cho các nhà phát triển công cụ và khung hỗ trợ để xây dựng AI Agent.
Lĩnh vực xử lý dữ liệu: Xử lý và phân tích dữ liệu ở các định dạng khác nhau, chủ yếu được sử dụng để hỗ trợ ra quyết định, cung cấp nguồn cho việc đào tạo.
Mô hình đào tạo: Cung cấp dịch vụ đào tạo mô hình cho AI, bao gồm suy luận, xây dựng mô hình, thiết lập, v.v.
Dịch vụ B端: Chủ yếu hướng đến người dùng doanh nghiệp, cung cấp các giải pháp dịch vụ doanh nghiệp, giải pháp dọc và tự động hóa.
Nền tảng tập hợp: Nền tảng tích hợp nhiều dịch vụ và công cụ AI Agent.
Loại tương tác: Tương tự như loại nội dung tạo ra, sự khác biệt ở chỗ có sự tương tác liên tục hai chiều. Agent loại tương tác không chỉ tiếp nhận và hiểu nhu cầu của người dùng, mà còn cung cấp phản hồi thông qua các công nghệ như xử lý ngôn ngữ tự nhiên (NLP), đạt được sự tương tác hai chiều với người dùng.
Loại hỗ trợ cảm xúc: AI Agent cung cấp hỗ trợ và sự đồng hành cảm xúc.
Loại GPT: AI Agent dựa trên mô hình GPT (Transformer được huấn luyện trước sinh).
Loại tìm kiếm: Tập trung vào chức năng tìm kiếm, cung cấp Agent chủ yếu để truy xuất thông tin chính xác hơn.
Nội dung tạo ra: Dạng dự án này tập trung vào việc tạo ra nội dung, sử dụng công nghệ mô hình lớn để sinh ra các hình thức nội dung khác nhau theo hướng dẫn của người dùng, chia thành bốn loại: tạo văn bản, tạo hình ảnh, tạo video và tạo âm thanh.
Phân tích tình trạng phát triển của Web2 AI Agent
Theo thống kê của chúng tôi, việc phát triển AI Agent trong Internet truyền thống Web2 đang thể hiện rõ xu hướng tập trung theo từng lĩnh vực. Cụ thể, khoảng hai phần ba các dự án tập trung vào các lĩnh vực cơ sở hạ tầng, trong đó chủ yếu là dịch vụ B2B và công cụ phát triển, chúng tôi cũng đã thực hiện một số phân tích về hiện tượng này.
Ảnh hưởng của độ trưởng thành công nghệ: Các dự án cơ sở hạ tầng chiếm ưu thế chủ yếu nhờ vào độ trưởng thành công nghệ của chúng. Những dự án này thường được xây dựng trên nền tảng các công nghệ và khung đã được kiểm chứng qua thời gian, từ đó giảm bớt độ khó và rủi ro trong quá trình phát triển. Tương tự như "cái xẻng" trong lĩnh vực AI, nó cung cấp một nền tảng vững chắc cho việc phát triển và ứng dụng AI Agent.
Sự thúc đẩy từ nhu cầu thị trường: Một yếu tố then chốt khác là nhu cầu thị trường. So với thị trường tiêu dùng, nhu cầu về công nghệ AI từ thị trường doanh nghiệp cấp thiết hơn, đặc biệt là trong việc tìm kiếm các giải pháp nâng cao hiệu quả vận hành và giảm chi phí. Đồng thời, đối với các nhà phát triển, dòng tiền từ doanh nghiệp tương đối ổn định, có lợi cho việc phát triển các dự án tiếp theo.
Hạn chế về các tình huống ứng dụng: Trong khi đó, chúng tôi nhận thấy rằng các AI tạo nội dung có ứng dụng tương đối hạn chế trong thị trường B2B. Do sự không ổn định trong sản phẩm của nó, các doanh nghiệp thường ưa chuộng những ứng dụng có thể nâng cao năng suất một cách ổn định. Điều này dẫn đến tỷ lệ của AI tạo nội dung trong kho dự án là khá nhỏ.
Xu hướng này phản ánh sự trưởng thành của công nghệ, nhu cầu thị trường và các yếu tố thực tế của các kịch bản ứng dụng. Với sự tiến bộ không ngừng của công nghệ AI và nhu cầu thị trường ngày càng rõ ràng, chúng tôi dự đoán rằng cấu trúc này có thể sẽ có sự điều chỉnh, nhưng các hạng mục cơ sở hạ tầng vẫn sẽ là nền tảng vững chắc cho sự phát triển của AI Agent.
Phân tích dự án dẫn đầu AI Agent Web2
Chúng tôi sẽ đi sâu vào một số dự án AI Agent hiện tại trên thị trường Web2 và phân tích chúng, với ba dự án là Character AI, Perplexity AI và Midjourney làm ví dụ.
Character AI:
Giới thiệu sản phẩm: Character.AI cung cấp hệ thống đối thoại dựa trên trí tuệ nhân tạo và công cụ tạo nhân vật ảo. Nền tảng của họ cho phép người dùng tạo, đào tạo và tương tác với các nhân vật ảo có khả năng đối thoại bằng ngôn ngữ tự nhiên và thực hiện các nhiệm vụ cụ thể.
Phân tích dữ liệu: Lượng truy cập của Character.AI trong tháng 5 là 277 triệu, nền tảng này có hơn 3,5 triệu người dùng hoạt động hàng ngày, trong đó phần lớn người dùng có độ tuổi từ 18 đến 34, cho thấy đặc điểm của nhóm người dùng trẻ. Character AI đã thể hiện xuất sắc trên thị trường vốn, hoàn thành việc huy động 150 triệu đô la, với giá trị định giá đạt 1 tỷ đô la, do a16z dẫn dắt.
Phân tích kỹ thuật: Character AI đã ký một thỏa thuận cấp phép không độc quyền với công ty mẹ của Google là Alphabet để sử dụng mô hình ngôn ngữ lớn của mình, điều này cho thấy Character AI đang áp dụng công nghệ tự phát triển. Đáng chú ý là, các nhà sáng lập của công ty, Noam Shazeer và Daniel De Freitas, đã tham gia phát triển mô hình ngôn ngữ đối thoại Llama của Google.
Perplexity AI:
Giới thiệu sản phẩm: Perplexity có khả năng thu thập và cung cấp câu trả lời chi tiết từ Internet. Thông qua việc trích dẫn và liên kết tham khảo để đảm bảo tính đáng tin cậy và chính xác của thông tin, đồng thời nó sẽ giáo dục, hướng dẫn người dùng thực hiện các câu hỏi tiếp theo và tìm kiếm từ khóa, đáp ứng nhu cầu truy vấn đa dạng của người dùng.
Phân tích dữ liệu: Số lượng người dùng hoạt động hàng tháng của Perplexity đã đạt 10 triệu, với lượng truy cập trên ứng dụng di động và máy tính để bàn tăng 8,6% trong tháng Hai, thu hút khoảng 50 triệu người dùng. Trên thị trường vốn, Perplexity AI gần đây đã công bố đã huy động được 62,7 triệu USD, với định giá đạt 1,04 tỷ USD, do Daniel Gross dẫn đầu, với sự tham gia của Stan Druckenmiller và NVIDIA.
Phân tích kỹ thuật: Mô hình chính mà Perplexity sử dụng là GPT-3.5 đã được tinh chỉnh, cùng với hai mô hình lớn được tinh chỉnh từ các mô hình lớn mã nguồn mở: pplx-7b-online và pplx-70b-online. Các mô hình này phù hợp cho nghiên cứu học thuật chuyên nghiệp và các truy vấn trong lĩnh vực chuyên biệt, đảm bảo độ chân thực và độ tin cậy của thông tin.
Midjourney:
Giới thiệu sản phẩm: Người dùng có thể tạo ra hình ảnh với đủ loại phong cách và chủ đề trên Midjourney thông qua Prompts, đáp ứng nhu cầu sáng tạo đa dạng từ hiện thực đến trừu tượng. Nền tảng còn
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
15 thích
Phần thưởng
15
7
Chia sẻ
Bình luận
0/400
GasFeeCry
· 07-11 15:56
Chỉ có dữ liệu này mà còn khoe? Có tiền cũng không đến mua coin nhà tôi.
Xem bản gốcTrả lời0
GateUser-c802f0e8
· 07-11 15:38
Đều là chơi đùa với mọi người mà thôi
Xem bản gốcTrả lời0
SatoshiNotNakamoto
· 07-11 15:36
Ví tiền của tôi đã chuẩn bị sẵn sàng, chỉ chờ To da moon.
Xem bản gốcTrả lời0
TokenUnlocker
· 07-11 15:33
Thật sự như một lời nguyền, cái gì cũng phải dựa vào web3.
Xem bản gốcTrả lời0
SchrodingerWallet
· 07-11 15:27
đồ ngốc等chơi đùa với mọi người 裤子准备好了
Xem bản gốcTrả lời0
Token_Sherpa
· 07-11 15:22
một kiểu ponzinomics khác được bọc trong những từ ngữ xu hướng AI, thật là...
Sự trỗi dậy của AI Agent: Cơ hội và thách thức mới của Web3+AI
Liệu AI Agent có thể trở thành cứu cánh cho Web3+AI?
Dự án AI Agent trong khởi nghiệp Web2 chủ yếu là loại dịch vụ cho doanh nghiệp, trong khi trong lĩnh vực Web3, các dự án về đào tạo mô hình và tập hợp nền tảng đã trở thành xu hướng chính nhờ vai trò then chốt của chúng trong việc xây dựng hệ sinh thái.
Hiện tại, số lượng dự án AI Agent trong Web3 không nhiều, chiếm 8%, nhưng tỷ lệ thị trường của chúng trong lĩnh vực AI lại cao tới 23%, do đó thể hiện sức cạnh tranh mạnh mẽ trên thị trường. Chúng tôi dự đoán rằng với sự trưởng thành của công nghệ và sự nâng cao mức độ công nhận của thị trường, trong tương lai sẽ xuất hiện nhiều dự án có định giá trên 1 tỷ USD.
Đối với các dự án Web3, việc áp dụng công nghệ AI cho các sản phẩm ứng dụng không phải cốt lõi AI có thể trở thành lợi thế chiến lược. Đối với cách kết hợp dự án AI Agent, cần chú trọng vào việc xây dựng hệ sinh thái toàn diện và thiết kế mô hình kinh tế token để thúc đẩy sự phi tập trung và hiệu ứng mạng.
Cuộc cách mạng AI: Tình trạng ra mắt các dự án và sự gia tăng định giá
Kể từ khi ChatGPT ra mắt vào tháng 11 năm 2022, chỉ trong vòng hai tháng đã thu hút được hơn một trăm triệu người dùng, đến tháng 5 năm 2024, doanh thu hàng tháng của ChatGPT đã đạt đến con số 20,3 triệu đô la Mỹ đáng kinh ngạc, trong khi OpenAI cũng nhanh chóng phát hành các phiên bản lặp lại như GPT-4 và GP4-4o sau khi ra mắt ChatGPT. Với sự tăng trưởng nhanh chóng như vậy, các ông lớn công nghệ truyền thống đã nhận ra tầm quan trọng của các ứng dụng mô hình AI tiên tiến như LLM, và lần lượt tung ra các mô hình và ứng dụng AI của riêng mình, chẳng hạn như Google phát hành mô hình ngôn ngữ lớn PaLM2, Meta giới thiệu Llama3, trong khi các công ty Trung Quốc cho ra mắt các mô hình lớn như Wenxin Yiyan và Zhipu Qingyan, rõ ràng lĩnh vực AI đã trở thành một chiến trường không thể thiếu.
Cuộc đua của các ông lớn công nghệ không chỉ thúc đẩy sự phát triển của các ứng dụng thương mại, mà chúng tôi cũng nhận thấy từ thống kê điều tra nghiên cứu AI mã nguồn mở, báo cáo AI Index năm 2024 cho thấy số lượng dự án liên quan đến AI trên GitHub đã tăng vọt từ 845 vào năm 2011 lên khoảng 1,8 triệu vào năm 2023, đặc biệt là sau khi GPT được phát hành vào năm 2023, số lượng dự án đã tăng 59,3% so với cùng kỳ năm trước, phản ánh sự nhiệt tình của cộng đồng nhà phát triển toàn cầu đối với nghiên cứu AI.
Sự đam mê với công nghệ AI đã được phản ánh trực tiếp trong thị trường đầu tư, với thị trường đầu tư AI đang thể hiện sự tăng trưởng mạnh mẽ, đặc biệt là trong quý 2 năm 2024 với sự bùng nổ. Toàn cầu có tổng cộng 16 khoản đầu tư liên quan đến AI vượt quá 150 triệu USD, gấp đôi so với quý 1. Tổng số vốn huy động của các startup AI đã tăng vọt lên 24 tỷ USD, tăng hơn gấp đôi so với năm trước. Trong đó, xAI thuộc sở hữu của Elon Musk đã huy động được 6 tỷ USD, với định giá 24 tỷ USD, trở thành công ty khởi nghiệp AI có định giá cao thứ hai, chỉ sau OpenAI.
Sự phát triển nhanh chóng của công nghệ AI đang định hình lại diện mạo của lĩnh vực công nghệ với tốc độ chưa từng có. Từ cuộc cạnh tranh gay gắt giữa các gã khổng lồ công nghệ, đến sự phát triển mạnh mẽ của các dự án cộng đồng mã nguồn mở, cho đến sự cuồng nhiệt của thị trường vốn đối với khái niệm AI. Các dự án xuất hiện liên tục, số tiền đầu tư đạt mức cao kỷ lục, và định giá cũng theo đó tăng vọt. Nhìn chung, thị trường AI đang ở một thời kỳ vàng son phát triển nhanh chóng, với các mô hình ngôn ngữ lớn và công nghệ tạo nội dung tăng cường tìm kiếm đã đạt được những tiến bộ đáng kể trong lĩnh vực xử lý ngôn ngữ. Tuy nhiên, những mô hình này vẫn đối mặt với thách thức khi chuyển đổi lợi thế công nghệ thành sản phẩm thực tế, như sự không chắc chắn trong đầu ra của mô hình, rủi ro tạo ra thông tin không chính xác và vấn đề minh bạch của mô hình. Những vấn đề này trở nên đặc biệt quan trọng trong các tình huống ứng dụng yêu cầu độ tin cậy cực cao.
Trong bối cảnh này, chúng tôi bắt đầu nghiên cứu về AI Agent, vì AI Agent nhấn mạnh tính toàn diện trong việc giải quyết các vấn đề thực tế và tương tác với môi trường. Sự chuyển mình này đánh dấu sự tiến hóa của công nghệ AI từ các mô hình ngôn ngữ thuần túy sang các hệ thống thông minh có khả năng thực sự hiểu, học hỏi và giải quyết các vấn đề trong thế giới thực. Do đó, chúng tôi thấy hy vọng từ sự phát triển của AI Agent, nó đang dần thu hẹp khoảng cách giữa công nghệ AI và việc giải quyết các vấn đề thực tế. Sự tiến hóa của công nghệ AI đang không ngừng định hình lại cấu trúc của năng suất, trong khi công nghệ Web3 đang tái cấu trúc các mối quan hệ sản xuất trong nền kinh tế số. Khi ba yếu tố chính của AI: dữ liệu, mô hình và sức mạnh tính toán, hòa quyện với các khái niệm cốt lõi của Web3 như phi tập trung, kinh tế token và hợp đồng thông minh, chúng tôi dự đoán sẽ tạo ra một loạt các ứng dụng đổi mới. Trong lĩnh vực giao thoa đầy tiềm năng này, chúng tôi tin rằng, AI Agent với khả năng tự thực hiện nhiệm vụ, đã thể hiện tiềm năng to lớn trong việc đạt được ứng dụng quy mô lớn.
Để thực hiện điều đó, chúng tôi bắt đầu nghiên cứu sâu về những ứng dụng đa dạng của AI Agent trong Web3, từ cơ sở hạ tầng Web3, middleware, đến các ứng dụng, cũng như các thị trường dữ liệu và mô hình, với mục tiêu nhận diện và đánh giá những loại dự án và kịch bản ứng dụng triển vọng nhất, nhằm hiểu sâu sắc sự kết hợp chặt chẽ giữa AI và Web3.
Làm rõ khái niệm: Giới thiệu và phân loại AI Agent
Giới thiệu cơ bản
Trước khi giới thiệu AI Agent, để giúp độc giả hiểu rõ hơn sự khác biệt giữa định nghĩa và mô hình của nó, chúng ta sẽ lấy một ví dụ từ một tình huống thực tế: giả sử bạn đang lên kế hoạch cho một chuyến du lịch. Các mô hình ngôn ngữ lớn truyền thống cung cấp thông tin về điểm đến và gợi ý du lịch. Công nghệ tạo sinh tăng cường tìm kiếm có thể cung cấp nội dung điểm đến phong phú và cụ thể hơn. Còn AI Agent giống như Jarvis trong bộ phim Iron Man, có thể hiểu nhu cầu và còn chủ động tìm kiếm chuyến bay và khách sạn dựa trên một câu nói của bạn, thực hiện các thao tác đặt chỗ và thêm lịch trình vào lịch.
Hiện nay, định nghĩa phổ biến về AI Agent trong ngành là hệ thống thông minh có khả năng cảm nhận môi trường và thực hiện hành động tương ứng, thu thập thông tin môi trường thông qua cảm biến, xử lý và sau đó tác động đến môi trường thông qua bộ thi hành (Stuart Russell & Peter Norvig, 2020). Chúng tôi cho rằng, AI Agent chính là trợ lý kết hợp các khả năng của LLM, RAG, trí nhớ, lập kế hoạch nhiệm vụ và sử dụng công cụ. Nó không chỉ cung cấp thông tin đơn thuần, mà còn có khả năng lập kế hoạch, phân tách nhiệm vụ và thực hiện một cách thực sự.
Dựa trên định nghĩa và đặc điểm này, chúng ta có thể nhận thấy AI Agent đã sớm hòa nhập vào cuộc sống của chúng ta, được áp dụng trong nhiều bối cảnh khác nhau, chẳng hạn như AlphaGo, Siri, và hệ thống lái tự động cấp độ L5 trở lên của Tesla đều có thể được coi là những ví dụ về AI Agent. Đặc điểm chung của những hệ thống này là chúng đều có khả năng nhận thức đầu vào từ người dùng bên ngoài và từ đó tạo ra ảnh hưởng tương ứng đến môi trường thực tế.
Lấy ChatGPT làm ví dụ để làm rõ khái niệm, chúng ta nên chỉ rõ rằng Transformer là kiến trúc kỹ thuật tạo thành mô hình AI, GPT là chuỗi mô hình phát triển dựa trên kiến trúc này, trong khi GPT-1, GPT-4, GPT-4o lần lượt đại diện cho các phiên bản của mô hình ở các giai đoạn phát triển khác nhau. ChatGPT là AI Agent tiến hóa dựa trên mô hình GPT.
Phân loại tổng quan
Hiện tại, thị trường AI Agent vẫn chưa hình thành tiêu chuẩn phân loại thống nhất. Chúng tôi đã gán nhãn cho 204 dự án AI Agent trong thị trường Web2+Web3, dựa trên nhãn nổi bật của từng dự án, chia thành phân loại cấp một và cấp hai. Trong đó, phân loại cấp một gồm ba loại: cơ sở hạ tầng, tạo nội dung, và tương tác người dùng, sau đó được phân tách theo các trường hợp sử dụng thực tế.
Cơ sở hạ tầng: Loại này tập trung vào việc xây dựng nội dung cơ bản trong lĩnh vực Agent, bao gồm nền tảng, mô hình, dữ liệu, công cụ phát triển, cũng như các dịch vụ B2B ứng dụng cơ bản đã phát triển.
Công cụ phát triển: Cung cấp cho các nhà phát triển công cụ và khung hỗ trợ để xây dựng AI Agent.
Lĩnh vực xử lý dữ liệu: Xử lý và phân tích dữ liệu ở các định dạng khác nhau, chủ yếu được sử dụng để hỗ trợ ra quyết định, cung cấp nguồn cho việc đào tạo.
Mô hình đào tạo: Cung cấp dịch vụ đào tạo mô hình cho AI, bao gồm suy luận, xây dựng mô hình, thiết lập, v.v.
Dịch vụ B端: Chủ yếu hướng đến người dùng doanh nghiệp, cung cấp các giải pháp dịch vụ doanh nghiệp, giải pháp dọc và tự động hóa.
Nền tảng tập hợp: Nền tảng tích hợp nhiều dịch vụ và công cụ AI Agent.
Loại tương tác: Tương tự như loại nội dung tạo ra, sự khác biệt ở chỗ có sự tương tác liên tục hai chiều. Agent loại tương tác không chỉ tiếp nhận và hiểu nhu cầu của người dùng, mà còn cung cấp phản hồi thông qua các công nghệ như xử lý ngôn ngữ tự nhiên (NLP), đạt được sự tương tác hai chiều với người dùng.
Loại hỗ trợ cảm xúc: AI Agent cung cấp hỗ trợ và sự đồng hành cảm xúc.
Loại GPT: AI Agent dựa trên mô hình GPT (Transformer được huấn luyện trước sinh).
Loại tìm kiếm: Tập trung vào chức năng tìm kiếm, cung cấp Agent chủ yếu để truy xuất thông tin chính xác hơn.
Nội dung tạo ra: Dạng dự án này tập trung vào việc tạo ra nội dung, sử dụng công nghệ mô hình lớn để sinh ra các hình thức nội dung khác nhau theo hướng dẫn của người dùng, chia thành bốn loại: tạo văn bản, tạo hình ảnh, tạo video và tạo âm thanh.
Phân tích tình trạng phát triển của Web2 AI Agent
Theo thống kê của chúng tôi, việc phát triển AI Agent trong Internet truyền thống Web2 đang thể hiện rõ xu hướng tập trung theo từng lĩnh vực. Cụ thể, khoảng hai phần ba các dự án tập trung vào các lĩnh vực cơ sở hạ tầng, trong đó chủ yếu là dịch vụ B2B và công cụ phát triển, chúng tôi cũng đã thực hiện một số phân tích về hiện tượng này.
Ảnh hưởng của độ trưởng thành công nghệ: Các dự án cơ sở hạ tầng chiếm ưu thế chủ yếu nhờ vào độ trưởng thành công nghệ của chúng. Những dự án này thường được xây dựng trên nền tảng các công nghệ và khung đã được kiểm chứng qua thời gian, từ đó giảm bớt độ khó và rủi ro trong quá trình phát triển. Tương tự như "cái xẻng" trong lĩnh vực AI, nó cung cấp một nền tảng vững chắc cho việc phát triển và ứng dụng AI Agent.
Sự thúc đẩy từ nhu cầu thị trường: Một yếu tố then chốt khác là nhu cầu thị trường. So với thị trường tiêu dùng, nhu cầu về công nghệ AI từ thị trường doanh nghiệp cấp thiết hơn, đặc biệt là trong việc tìm kiếm các giải pháp nâng cao hiệu quả vận hành và giảm chi phí. Đồng thời, đối với các nhà phát triển, dòng tiền từ doanh nghiệp tương đối ổn định, có lợi cho việc phát triển các dự án tiếp theo.
Hạn chế về các tình huống ứng dụng: Trong khi đó, chúng tôi nhận thấy rằng các AI tạo nội dung có ứng dụng tương đối hạn chế trong thị trường B2B. Do sự không ổn định trong sản phẩm của nó, các doanh nghiệp thường ưa chuộng những ứng dụng có thể nâng cao năng suất một cách ổn định. Điều này dẫn đến tỷ lệ của AI tạo nội dung trong kho dự án là khá nhỏ.
Xu hướng này phản ánh sự trưởng thành của công nghệ, nhu cầu thị trường và các yếu tố thực tế của các kịch bản ứng dụng. Với sự tiến bộ không ngừng của công nghệ AI và nhu cầu thị trường ngày càng rõ ràng, chúng tôi dự đoán rằng cấu trúc này có thể sẽ có sự điều chỉnh, nhưng các hạng mục cơ sở hạ tầng vẫn sẽ là nền tảng vững chắc cho sự phát triển của AI Agent.
Phân tích dự án dẫn đầu AI Agent Web2
Chúng tôi sẽ đi sâu vào một số dự án AI Agent hiện tại trên thị trường Web2 và phân tích chúng, với ba dự án là Character AI, Perplexity AI và Midjourney làm ví dụ.
Character AI:
Giới thiệu sản phẩm: Character.AI cung cấp hệ thống đối thoại dựa trên trí tuệ nhân tạo và công cụ tạo nhân vật ảo. Nền tảng của họ cho phép người dùng tạo, đào tạo và tương tác với các nhân vật ảo có khả năng đối thoại bằng ngôn ngữ tự nhiên và thực hiện các nhiệm vụ cụ thể.
Phân tích dữ liệu: Lượng truy cập của Character.AI trong tháng 5 là 277 triệu, nền tảng này có hơn 3,5 triệu người dùng hoạt động hàng ngày, trong đó phần lớn người dùng có độ tuổi từ 18 đến 34, cho thấy đặc điểm của nhóm người dùng trẻ. Character AI đã thể hiện xuất sắc trên thị trường vốn, hoàn thành việc huy động 150 triệu đô la, với giá trị định giá đạt 1 tỷ đô la, do a16z dẫn dắt.
Phân tích kỹ thuật: Character AI đã ký một thỏa thuận cấp phép không độc quyền với công ty mẹ của Google là Alphabet để sử dụng mô hình ngôn ngữ lớn của mình, điều này cho thấy Character AI đang áp dụng công nghệ tự phát triển. Đáng chú ý là, các nhà sáng lập của công ty, Noam Shazeer và Daniel De Freitas, đã tham gia phát triển mô hình ngôn ngữ đối thoại Llama của Google.
Perplexity AI:
Giới thiệu sản phẩm: Perplexity có khả năng thu thập và cung cấp câu trả lời chi tiết từ Internet. Thông qua việc trích dẫn và liên kết tham khảo để đảm bảo tính đáng tin cậy và chính xác của thông tin, đồng thời nó sẽ giáo dục, hướng dẫn người dùng thực hiện các câu hỏi tiếp theo và tìm kiếm từ khóa, đáp ứng nhu cầu truy vấn đa dạng của người dùng.
Phân tích dữ liệu: Số lượng người dùng hoạt động hàng tháng của Perplexity đã đạt 10 triệu, với lượng truy cập trên ứng dụng di động và máy tính để bàn tăng 8,6% trong tháng Hai, thu hút khoảng 50 triệu người dùng. Trên thị trường vốn, Perplexity AI gần đây đã công bố đã huy động được 62,7 triệu USD, với định giá đạt 1,04 tỷ USD, do Daniel Gross dẫn đầu, với sự tham gia của Stan Druckenmiller và NVIDIA.
Phân tích kỹ thuật: Mô hình chính mà Perplexity sử dụng là GPT-3.5 đã được tinh chỉnh, cùng với hai mô hình lớn được tinh chỉnh từ các mô hình lớn mã nguồn mở: pplx-7b-online và pplx-70b-online. Các mô hình này phù hợp cho nghiên cứu học thuật chuyên nghiệp và các truy vấn trong lĩnh vực chuyên biệt, đảm bảo độ chân thực và độ tin cậy của thông tin.
Midjourney:
Giới thiệu sản phẩm: Người dùng có thể tạo ra hình ảnh với đủ loại phong cách và chủ đề trên Midjourney thông qua Prompts, đáp ứng nhu cầu sáng tạo đa dạng từ hiện thực đến trừu tượng. Nền tảng còn