現在、業界ではAIエージェントの定義として、環境を感知し、適切な行動をとる知的システムを指すことが一般的です。センサーを通じて環境情報を取得し、処理を経てアクチュエーターを用いて環境に影響を与えます(Stuart Russell & Peter Norvig, 2020)。私たちは、AIエージェントはLLM、RAG、記憶、タスク計画、ツール使用能力を集約した助手であると考えています。それは単に情報を提供するだけでなく、タスクを計画し、分解し、実際に実行することができます。
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
AIエージェントの台頭:Web3+AIの新しい機会と課題
AIエージェントはWeb3+AIの救いの手になるか?
AIエージェントプロジェクトはWeb2の起業において人気で成熟したタイプが主に企業向けサービスであり、Web3の分野ではモデルトレーニングおよびプラットフォーム統合型プロジェクトがエコシステム構築における重要な役割のため主流となっています。
現在のWeb3のAIエージェントプロジェクトの数は少なく、全体の8%を占めていますが、それらのAI分野における時価総額の割合はなんと23%に達しており、強力な市場競争力を示しています。技術の成熟と市場の認知度の向上に伴い、今後10億ドルを超える評価額のプロジェクトが多数登場することを予想しています。
Web3プロジェクトにおいて、AIコアでないアプリケーション製品にAI技術を導入することは戦略的な優位性となる可能性があります。AIエージェントプロジェクトの統合方法は、全体のエコシステムの構築とトークン経済モデルの設計に重点を置くべきであり、分散化とネットワーク効果を促進します。
AIの波:プロジェクトの続出と評価の高騰の現状
ChatGPTが2022年11月に登場して以来、わずか2ヶ月で1億人以上のユーザーを引き付け、2024年5月にはChatGPTの月収が驚異的な2030万ドルに達しました。また、OpenAIはChatGPTの発表後、迅速にGPT-4やGP4-4oなどのバージョンをリリースしました。このような急速な展開により、伝統的なテクノロジーの巨人たちはLLMなどの最先端AIモデルの重要性を認識し、自社のAIモデルやアプリケーションを次々と発表しています。例えば、Googleは大規模言語モデルPaLM2を発表し、MetaはLlama3を発表し、中国の企業は文心一言や智谱清言などの大規模モデルを発表しました。明らかにAI分野は激しい競争の場となっています。
各大テクノロジー企業の競争はビジネスアプリケーションの発展を促進するだけでなく、オープンソースAI研究の調査統計からもわかるように、2024年のAIインデックスレポートは、GitHub上のAI関連プロジェクトの数が2011年の845件から2023年の約180万件に急増したことを示しています。特にGPTがリリースされた2023年には、プロジェクトの数が前年同期比で59.3%増加し、世界の開発者コミュニティのAI研究への熱心さを反映しています。
AI技術への熱意は投資市場に直接反映されており、AI投資市場は強力な成長を示し、2024年第2四半期には爆発的な成長を見せました。世界中で16件の1.5億ドルを超えるAI関連の投資があり、これは第1四半期の2倍です。AIスタートアップの資金調達総額は240億ドルに急増し、前年同期比で倍増しました。その中で、マスク氏のxAIは60億ドルを調達し、評価額は240億ドルに達し、OpenAIに次ぐ評価額2位のAIスタートアップとなりました。
! AIエージェントはWeb3+AIの命の恩人になれるか?
AI技術の急速な発展は、かつてない速度でテクノロジー分野の地図を再構築しています。テクノロジー大手間の激しい競争から、オープンソースコミュニティプロジェクトの活発な成長、さらに資本市場でのAIコンセプトへの熱烈な追求まで、プロジェクトは次々と登場し、投資額は新たな高水準を記録し、評価額もそれに伴って上昇しています。全体として、AI市場は高速成長の黄金時代にあり、大規模な言語モデルと検索強化生成技術は、言語処理分野で重要な進展を遂げています。それにもかかわらず、これらのモデルは技術的な優位性を実際の製品に変換する際に課題に直面しています。例えば、モデルの出力の不確実性、生成される不正確な情報の幻覚リスク、モデルの透明性の問題などです。これらの問題は、信頼性が非常に重要な応用シーンでは特に重要です。
この背景の中で、私たちはAIエージェントの研究を始めました。AIエージェントは、実際の問題の解決と環境との相互作用の包括性を強調しています。この転換は、AI技術が純粋な言語モデルから、実際の問題を本当に理解し、学習し、解決できる知能システムへと進化することを示しています。私たちはAIエージェントの発展から希望を見出しており、それはAI技術と実際の問題解決の間のギャップを徐々に埋めています。AI技術の進化は生産力の構造を常に再構築しており、Web3技術はデジタル経済の生産関係を再構築しています。AIの三大要素:データ、モデル、計算能力が、Web3の非中央集権、トークン経済、スマートコントラクトなどの核心理念と融合することで、一連の革新的なアプリケーションが生まれることを予見しています。この潜在能力に満ちた交差領域において、AIエージェントは自主的にタスクを実行する能力を持ち、大規模な応用を実現する巨大な可能性を示しています。
そのため、私たちはWeb3におけるAIエージェントの多様な応用を深く研究し始めました。Web3のインフラストラクチャー、中間ウェア、アプリケーションレイヤー、データおよびモデル市場などのさまざまな次元から、最も有望なプロジェクトの種類やアプリケーションシナリオを特定し評価することを目指し、AIとWeb3の深い統合を深く理解します。
概念の明確化:AIエージェントの紹介と分類概要
基本的な紹介
AIエージェントを紹介する前に、読者がその定義とモデル自体の違いをよりよく理解できるように、実際のシーンを例に挙げてみましょう:あなたが旅行を計画していると仮定します。従来の大規模言語モデルは、目的地の情報や旅行の提案を提供します。検索強化生成技術は、より豊かで具体的な目的地の内容を提供できます。そしてAIエージェントは、アイアンマン映画のジャービスのように、ニーズを理解し、あなたの一言に基づいてフライトやホテルを積極的に検索し、予約操作を実行し、スケジュールに旅程を追加します。
現在、業界ではAIエージェントの定義として、環境を感知し、適切な行動をとる知的システムを指すことが一般的です。センサーを通じて環境情報を取得し、処理を経てアクチュエーターを用いて環境に影響を与えます(Stuart Russell & Peter Norvig, 2020)。私たちは、AIエージェントはLLM、RAG、記憶、タスク計画、ツール使用能力を集約した助手であると考えています。それは単に情報を提供するだけでなく、タスクを計画し、分解し、実際に実行することができます。
この定義と特性に基づいて、AIエージェントはすでに私たちの生活に溶け込んでおり、さまざまなシーンで応用されています。たとえば、AlphaGo、Siri、テスラのL5レベル以上の自動運転などは、AIエージェントの例と見なすことができます。これらのシステムの共通の特性は、外部のユーザー入力を感知し、それに基づいて現実の環境に影響を与えることができるという点です。
ChatGPTを例に概念を明確にするために、TransformerはAIモデルを構成する技術的アーキテクチャであることを明確に指摘する必要があります。GPTはこのアーキテクチャに基づいて発展したモデルシリーズであり、GPT-1、GPT-4、GPT-4oはそれぞれ異なる発展段階のモデルバージョンを表しています。ChatGPTはGPTモデルから進化したAIエージェントです。
カテゴリ概要
現在、AIエージェント市場は統一された分類基準を形成していません。私たちは、Web2+Web3市場における204のAIエージェントプロジェクトにラベルを付けることで、各プロジェクトに対応する顕著なラベルに基づいて、一次分類と二次分類に分けました。その中で、一次分類は基盤構築、コンテンツ生成、ユーザーインタラクションの三つのカテゴリーであり、さらに実際のユースケースに基づいて細分化しています。
基礎インフラ系:このカテゴリは、エージェント分野の比較的基盤となるコンテンツの構築に焦点を当てており、プラットフォーム、モデル、データ、開発ツール、そして比較的成熟した基盤アプリケーションのB2Bサービスを含みます。
開発ツール:開発者にAIエージェントを構築するための補助ツールとフレームワークを提供します。
データ処理クラス:異なる形式のデータを処理および分析し、主に意思決定を支援し、トレーニングのためのソースを提供します。
モデル訓練タイプ:AI向けのモデル訓練サービスを提供し、推論、モデルの構築、設定などを含みます
B端サービス:主に企業ユーザーを対象に、企業サービス、垂直型、オートメーションのソリューションを提供します。
プラットフォーム集合型:さまざまなAIエージェントサービスとツールを統合したプラットフォーム。
インタラクティブ型:コンテンツ生成型に似ていますが、持続的な双方向のインタラクションが異なります。インタラクティブエージェントは、ユーザーのニーズを受け入れ理解するだけでなく、自然言語処理(NLP)などの技術を通じてフィードバックを提供し、ユーザーとの双方向のインタラクションを実現します。
感情的な伴侶タイプ:感情的なサポートと伴侶を提供するAIエージェント。
GPT:GPT(Generative Pre-trained Transformer)モデルに基づくAIエージェント。
検索系:検索機能に特化し、より正確な情報検索を提供するエージェント。
コンテンツ生成型:このタイプのプロジェクトは、ユーザーの指示に基づいてさまざまな形式のコンテンツを生成するために、大規模モデル技術を利用してコンテンツの生成に特化しています。テキスト生成、画像生成、動画生成、音声生成の4つのカテゴリに分かれています。
! AIエージェントはWeb3+AIの命の恩人になれるか?
Web2 AI Agentの開発状況の分析
私たちの統計によると、Web2の従来のインターネットにおけるAIエージェントの開発は明らかなセクター集中の傾向を示しています。具体的には、約3分の2のプロジェクトがインフラストラクチャに集中しており、その中でも主にB向けサービスと開発ツールが多く見られます。この現象についてもいくつかの分析を行いました。
技術成熟度の影響:インフラ系プロジェクトが主導的な地位を占める理由は、まずその技術成熟度にあります。これらのプロジェクトは通常、時間に裏打ちされた技術とフレームワークに基づいて構築されているため、開発の難易度とリスクが低下します。AI分野における「シャベル」に相当し、AIエージェントの開発と応用に堅固な基盤を提供します。
市場需要の推進:もう一つの重要な要素は市場の需要です。消費者市場と比較して、企業市場はAI技術に対する需要がより切実であり、特に運営効率を向上させ、コストを削減するソリューションを求めています。同時に、開発者にとって企業からのキャッシュフローは比較的安定しており、今後のプロジェクトの開発に有利です。
適用シーンの制限:同時に、私たちはコンテンツ生成AIのB2B市場における適用シーンが比較的限られていることに気付きました。その出力の不安定性により、企業は生産性を安定して向上させることができるアプリケーションを好む傾向にあります。これが、プロジェクトライブラリにおけるコンテンツ生成AIの占める割合が少ない理由です。
このトレンドは、技術の成熟度、市場の需要、そしてアプリケーションシナリオの実際の考慮を反映しています。AI技術の進歩と市場の需要がさらに明確になるにつれて、私たちはこの構図が調整される可能性があると予想していますが、インフラストラクチャーは依然としてAIエージェントの発展の確固たる基盤となるでしょう。
Web2のAIエージェントのリーダーシッププロジェクト分析
! AIエージェントはWeb3+AIの命の恩人になれるか?
私たちは現在のWeb2市場におけるAIエージェントプロジェクトを深く掘り下げ、Character AI、Perplexity AI、Midjourneyの3つのプロジェクトを例に分析を行います。
キャラクターAI:
製品紹介:Character.AIは、人工知能に基づく対話システムと仮想キャラクター作成ツールを提供します。このプラットフォームでは、ユーザーは仮想キャラクターを作成、訓練し、それらと対話することが可能で、キャラクターは自然言語での対話を行い、特定のタスクを実行できます。
データ分析:Character.AIの5月の訪問者数は2.77億で、プラットフォームには350万人以上のデイリーアクティブユーザーがいます。その大半は18歳から34歳の間で、若年層のユーザー層の特徴を示しています。Character AIは資本市場で素晴らしいパフォーマンスを発揮し、1.5億ドルの資金調達を完了し、評価額は10億ドルに達しました。a16zがリード投資を行いました。
テクニカル分析:Character AIはGoogleの親会社であるAlphabetと、同社の大規模言語モデルを非独占的に使用するライセンス契約を結びました。これは、Character AIが独自の技術を採用していることを示しています。注目すべきは、創業者のNoam ShazeerとDaniel De Freitasが、Googleの対話型言語モデルLlamaの開発に関与していたことです。
パープレキシティAI:
製品紹介:Perplexityはインターネットから情報を収集し、詳細な回答を提供することができます。引用や参考リンクを通じて情報の信頼性と正確性を保証し、ユーザーが追加の質問をしたりキーワードを検索したりする際の教育的なガイドとして機能し、ユーザーの多様な問い合わせニーズに応えます。
データ分析:Perplexityの月間アクティブユーザー数は1000万人に達し、2月にはモバイルおよびデスクトップアプリケーションの訪問者数が8.6%増加し、約5000万人のユーザーを引き付けました。資本市場では、Perplexity AIが最近6270万ドルの資金調達を発表し、評価額は10.4億ドルに達しました。リード投資家はDaniel Grossで、参加者にはStan DruckenmillerとNVIDIAが含まれています。
技術分析:Perplexityが使用している主なモデルは微調整されたGPT-3.5であり、オープンソースの大規模モデルを微調整した2つの大型モデル:pplx-7b-onlineとpplx-70b-onlineに基づいています。このモデルは専門的な学術研究や特化した分野のクエリに適しており、情報の真実性と信頼性を確保します。
ミッドジャーニー:
製品紹介:ユーザーはPromptsを使用してMidjourneyでさまざまなスタイルやテーマの画像を作成でき、リアリスティックから抽象的な幅広い創作ニーズをカバーしています。プラットフォームはさらに