AI は暗号通貨のエージェントです: AI エージェントの進化
作者: ズオ・イエ
芸術作品は決して完成することはなく、放棄されるだけです。
誰もが AI エージェントについて話していますが、話している内容は同じではありません。これは、私たちが関心を持っている AI エージェントと一般の視点、および AI 実践者の視点との違いにつながります。
ずっと前に、私は 「暗号は AI の幻想である 」と書きましたが、当時から現在に至るまで、暗号と AI の組み合わせは報われない愛であり、AI の専門家が Web3/ブロックチェーンという用語を言及することはめったにありません。しかし、私は AI に情熱を持っており、AI エージェント フレームワークがトークン化できるという驚異を知った後、それが本当に AI 実践者を私たちの世界に導入できるかどうかはわかりません。
AI はクリプトの代理人である これは、今回の AI の急増をクリプトの観点から見るための最良の説明です。特に、クリプトの AI に対する熱意は、金融資産の発行と運用を統合することを望んでいます。
エージェントの進化、原点はテクニカルマーケティング
そのルーツを調査すると、AI エージェントには少なくとも 3 つのソースがあり、OpenAI の AGI (General Artificial Intelligence) はこれを重要なステップとして挙げており、この用語は技術レベルを超えたバズワードとなっています。ただし、本質的に、エージェントは新しい概念ではありません。これに AI のエンパワーメントを加えると、革命的な技術トレンドとは言えません。
1つは、OpenAIの観点からのAIエージェントであり、自動運転分類におけるL3に似ています。AIエージェントは、一定の高度な運転支援機能を備えていると見なされますが、完全に人間に取って代わることはできません。
画像の説明: OpenAI 計画の AGI 段階、画像出典: https://www.bloomberg.com/
第二に、AI エージェントは、名前が示すように、AI の恩恵を受けたエージェントです。OpenAI の計画の下では、エージェントは対話形式 (ChatGPT) と推論形式 (さまざまなボット) になります。 ) 最後の L3 ステージは、「特定の動作を自律的に実行する」こと、または LangChain の創設者である Harrison Chase の定義を使用することによって特徴付けられます。「AI エージェントは、LLM を使用するエージェントです。」プログラム制御フローの決定を行うためのシステム。」
これが謎なのですが、LLM が登場する前は、プログラマがクローラ プログラムを設計する際、エージェントは主に人為的に設定された自動処理を実行していました。もちろん、AI エージェントを使用して人間の動作をより詳細に模倣すると、AI エージェント クローラー フレームワークが表示され、クローラーが「より人間らしく」なります。
このような変更では、AI Agent の追加は既存のシナリオと組み合わせる必要があります。Curosr や Github copilot などのコード補完機能や生成機能も、LSP (Language Server Protocol) などに基づいています。考えてみると、これには多くの例があります。
- Apple: AppleScript (スクリプトエディタ)--Alfred--Siri--ショートカット--Apple Intelligence
- ターミナル: ターミナル (macOS)/Power Shell (Windows)--iTerm 2--Warp(AI ネイティブ)
- 人間とコンピュータのインタラクション: Web 1.0 CLI TCP/IP Netscape Browser--Web 2.0 GUI/RestAPI/ Search Engine/Google/Super App--Web 3.0 AI Agent + dapp?
少し説明すると、人間とコンピュータのインタラクションのプロセスにおいて、Web 1.0 GUI とブラウザの組み合わせにより、Windows + IE の組み合わせに代表されるように、実際に公衆が何の障壁もなくコンピュータを使用できるようになります。API はデータの抽象化であり、API はデータの抽象化であり、 Web 2.0 時代のインターネットの背後にある伝送規格 ブラウザはすでに Chrome の時代を迎えており、モバイルへの移行により人々のインターネット利用習慣が変化しました。WeChat や Meta などのスーパー プラットフォームのアプリが人々の生活のあらゆる側面をカバーしています。 。
第三に、暗号分野におけるインテントの概念は、AI エージェント サークルの爆発的な前兆です。ただし、これは不完全なビットコイン スクリプトからイーサリアム スマート コントラクトまで、エージェントの概念自体が暗号内でのみ有効であることに注意してください。広く使用され、その後生み出されたクロスチェーンブリッジ - チェーン抽象化、EOA - AA ウォレットはすべてこの種の考え方の自然な拡張であるため、AI エージェントが暗号通貨に「侵入」した後、DeFi につながりました。この光景は驚くことではありません。
ここで、Crypto の文脈で AI エージェントの概念が混乱します。私たちが実際に実現したいのは、「自動的に財務を管理し、新しいミームを自動的に作成する」エージェントです。しかし、OpenAI の定義では、そのような危険なシナリオさえも必要になります。 L4 /L5 は本当に実現できますが、一般の人が遊んでいるのは自動コード生成や AI ワンクリック要約、ゴーストライティングなどの機能です。両者間のコミュニケーションは同じ次元ではありません。
私たちが本当に望んでいることは理解できたので、AI エージェントの組織ロジックに焦点を当てましょう。技術的な詳細は後で隠します。結局のところ、AI エージェントのコンセプトは、大規模な普及の障害からテクノロジーを取り除くことです。このツールはパーソナル PC 業界にミダス的な影響を与えているため、人間とコンピューターのインタラクションの観点から AI エージェントを考察することと、AI エージェントとそれをリードする LLM の違いとつながりの 2 点に焦点を当てます。第三部へ: 暗号と AI エージェント この組み合わせは最終的に何も残さない。
AI_Agent = LLM+API とします。
ChatGPT などのチャットベースの人間とコンピューターの対話モデルが登場する前は、人間とコンピューター間の対話は主に GUI (グラフィカル インターフェイス) と CLI (コマンド ライン インターフェイス) の形式で行われ、GUI の考え方はブラウザー、アプリ、その他の特定のものを導き出し続けました。フォーム、CLI とシェルの組み合わせはほとんど変更されません。
しかし、これは人間とコンピューターの「フロントエンド」の表面上のやりとりにすぎません。インターネットの発展に伴い、データの量と種類が増加することで、データ間の「バックエンド」のやりとりも増加しています。単純な Web ブラウジング動作であっても、実際には 2 つの連携と協力が必要です。
しかし、これは人間とコンピューターの「フロントエンド」の表面上のやりとりにすぎません。インターネットの発展に伴い、データの量と種類が増加することで、データ間の「バックエンド」のやりとりも増加しています。単純な Web ブラウジング動作であっても、実際には 2 つの連携と協力が必要です。
人とブラウザとアプリの間のインタラクションについて言えば、ユーザーポータルについて話しますが、実際には、これも一般のユーザーには必要のない、インターネットの実際の操作をサポートするものです。コマンドラインやAPIなどの用語を理解することで目的を達成することができます。
LLM についても同様であり、ユーザーはさらに一歩進んで、プロセス全体を次の手順のように記述することができます。
- ユーザーがチャット ウィンドウを開きます。
- ユーザーは自然言語、つまりテキストまたは音声を使用してニーズを説明します。
- LLM はそれを解析して合理化された操作ステップに変換します。
- LLM は結果をユーザーに返します。
このプロセスでは、最大の課題は Google であることがわかります。ユーザーは検索エンジンを開く必要はなく、GPT のようなさまざまなダイアログ ウィンドウを開く必要があり、トラフィックの入り口が静かに変化しているためです。この LLM は検索エンジンの生活に革命をもたらすと考えています。
では、AI エージェントはこの中でどのような役割を果たしているのでしょうか?
一言で言えば、AI Agent は LLM を専門化したものです。
現在の LLM は AGI ではありません。つまり、OpenAI の理想的な L5 オーガナイザーではありません。たとえば、ユーザーが情報を入力しすぎると幻覚を引き起こしやすいことが挙げられます。たとえば、トレーニング メカニズムで GPT 1+1=3 を繰り返し指示すると、次のインタラクションでは一定の確率で 1+1+1= が要求されます。答えが 4 である確率を示します。
現時点での GPT のフィードバックは完全に個人ユーザーからのものであるため、モデルがインターネットに接続されていない場合、今後は、ユーザーの情報によって動作メカニズムが変更される可能性があります。 1+1=3 はわかりますが、モデルがインターネットに接続できる場合、GPT のフィードバック メカニズムはより多様になります。結局のところ、インターネット上の大多数の人は 1+1=2 であると信じています。
難易度はさらに上がりますが、ローカルで LLM を使用する必要がある場合、そのような問題を回避するにはどうすればよいでしょうか?
簡単かつ大雑把な方法は、2 つの LLM を同時に使用し、質問に答えるたびに 2 つの LLM が相互に検証するように規定することです。これが機能しない場合は、エラーが発生する可能性が低くなります。他の方法としては、2 人のユーザーが一度に 1 つのプロセスを処理し、1 人が質問を担当し、もう 1 人が質問を微調整する責任を負い、言語をより標準化して合理的にすることを試みます。
もちろん、インターネットでは問題を完全に回避できない場合もあります。たとえば、LLM が知的障害のあるバーから回答を取得する場合、状況は悪化する可能性があります。ただし、これらのデータを回避すると、利用可能なデータの量が減少するため、既存のデータが分割される可能性があります。実際、これは RAG (検索拡張生成) の自然言語理解です。
人間と機械は相互に理解する必要があります。複数の LLM が相互に理解して連携できるようにすると、本質的に AI エージェントの動作モードに触れることになります。つまり、人間のエージェントが他のリソースを呼び出します。これには大規模なモデルやモデルも含まれる場合があります。他のエージェント。
このことから、LLM と AI エージェントの関係を把握しました。LLM は人間が対話ウィンドウを通じてコミュニケーションできる知識の集合体ですが、実際には、いくつかの特定のタスク フローを特定の小さなプログラム、ボット、および命令セット、これらをエージェントとして定義します。
AI エージェントは依然として LLM の一部であり、この 2 つを同じものと見なすことはできません。AI エージェントの呼び出し方法は LLM に基づいており、特に外部プログラム、LLM および他のエージェントの連携に重点が置かれているため、AI エージェント = LLM となります。 +API感。
次に、LLM ワークフローに AI エージェントの命令を追加できます。例として X の API データを呼び出してみましょう。
- 人間のユーザーがチャット ウィンドウを開きます。
- ユーザーは自然言語、つまりテキストまたは音声を使用してニーズを説明します。
- LLM はそれを API 呼び出しのような AI エージェント タスクに解析し、会話許可をエージェントに転送します。
- AI エージェントはユーザー X にアカウントと API パスワードを要求し、ユーザーの説明に基づいてオンラインで X と通信します。
- AI エージェントは最終結果をユーザーに返します。
人間とコンピューターの対話の進化の歴史をまだ覚えていますか? Web 1.0 と Web 2.0 に存在したブラウザーと API は今後も存在しますが、ユーザーはその存在を完全に無視して、AI エージェントの呼び出しのみを操作することができます。およびその他のプロセスは会話形式で使用でき、相手がインターフェースを開いてユーザーが許可を持っている限り、これらの API サービスはローカル データ、ネットワーク情報、外部アプリ データなど、あらゆる種類のものにすることができます。それを使うために。
完全な AI エージェントの使用プロセスは、上の図に示されています。LLM は、AI エージェントとは別の部分と見なすことも、プロセスの 2 つのサブリンクと見なすこともできます。 、ユーザーのニーズに応えます。
人間とコンピュータの対話プロセスの観点から見ると、ユーザーが自分自身と会話している場合でも、ユーザーは自分の考えや考えを表現するだけでよく、AI/LLM/AI エージェントがユーザーのニーズを何度も推測します。フィードバック メカニズムを追加し、LLM に現在の状況のコンテキスト (Context) を記憶するよう要求することで、AI エージェントが自分が行っていることを突然忘れないようにすることができます。
つまり、AI エージェントは、従来のスクリプトや自動化ツールとの本質的な違いであり、ユーザーの真のニーズを考慮する必要があります。推測の結果、L3 レベルの AI エージェントには人間の理解力や表現力が備わっていないため、外部 API に接続することは危険に満ちています。
AIフレームワークを収益化した後
AI フレームワークが収益化できるという事実は、私が Crypto に興味を持ち続ける重要な理由です。従来の AI テクノロジー スタックでは、フレームワークはそれほど重要ではなく、少なくともデータやコンピューティング能力ほど重要ではありません。 AI 製品をフレームワークから収益化するのは困難です。結局のところ、ほとんどの AI アルゴリズムとモデル フレームワークはオープンソース製品であり、データなどの機密情報です。
本質的に、AI フレームワークまたはモデルは一連のアルゴリズムの容器と組み合わせであり、ガチョウを煮る鉄鍋に相当します。ただし、ガチョウの種類と火加減が味を区別する鍵となります。販売されている製品は本質的に異なります。それは大きなガチョウであるはずですが、現在、Web3 の顧客は真珠の箱を購入したいのに、ポットを購入してガチョウを放棄しています。
その理由は複雑ではありません。Web3 の AI 製品は基本的に、既存の AI フレームワーク、アルゴリズム、製品に基づいてカスタマイズされた製品であるため、技術的には大きな違いはありません。見分けがつかないため、名前やアプリケーションシナリオなどについて大騒ぎする必要があります。そのため、AI フレームワーク自体にいくつかの小さな調整を加えた結果、さまざまなトークンがサポートされるようになり、Crypto AI Agent のフレームワークバブルが発生しました。
学習データやアルゴリズムに多額の投資をする必要がないため、DeepSeek V3 がどれほど安価であっても、多くのドクターズ ヘアと GPU と電力消費が必要になります。
これはある意味、トークンよりもトークン発行プラットフォームの価値が高いという最近のWeb3の一貫したスタイルでもあり、Pump.Fun/Hyperliquidも同様で、エージェントは本来アプリケーションやアセットであるべきなのですが、代理発行フレームワークは最も人気のある製品になっています。
実際、これはさまざまなタイプのエージェント間の区別がないため、エージェントのフレームワークはより安定しており、資産発行の価値の吸い上げ効果を生み出すことができます。これは、Crypto の組み合わせの現在の 1.0 バージョンです。そしてAIエージェント。
2.0 バージョンが登場しており、通常は DeFi と AI エージェントの組み合わせです。DeFAI の概念はもちろん熱によって刺激された市場の動きですが、次の状況を考慮すると、それが異なることがわかります。
2.0 バージョンが登場しており、通常は DeFi と AI エージェントの組み合わせです。DeFAI の概念はもちろん熱によって刺激された市場の動きですが、次の状況を考慮すると、それが異なることがわかります。
- Morpho は、Aave などの古い融資商品に挑戦しています。
- HyperliquidはdYdXのオンチェーンデリバティブを置き換え、さらにはBinanceのCEXリスト効果に挑戦しています。
- ステーブルコインはオフチェーンシナリオの支払いツールになりつつあります。
DeFiの進化の背景には、AIがDeFiの基本ロジックを改良していることがあり、これまでのDeFiの最大のロジックがスマートコントラクトの実現可能性を検証することであったとしたら、AIエージェントはDeFiの製造ロジックを変更する必要はありません。 DeFi を理解する この方法でのみ DeFi 製品を作成できます。これは、チェーンの抽象化よりもさらに基礎的な権限を与えます。
誰もがプログラマーとなり、複雑な計算を AI エージェントの背後にある LLM と API にアウトソーシングし、個人が自分のアイデアに集中するだけで、自然言語を効率的にプログラミング ロジックに変換できる時代が到来します。
結論
この記事では、Crypto AI Agent のトークンとフレームワークについては触れていません。なぜなら、Cookie.Fun は AI エージェント情報の集約とトークン検出プラットフォーム、次に AI エージェント フレームワーク、そして最後にエージェント生成という十分な仕事をしてきたからです。コインが突然現れたり消えたりするため、記事に情報を記載し続けることに価値はありません。
ただし、この観察期間中、Crypto AI Agent が市場で何を指すのかについてはまだ本格的な議論が不足しています。メモリの変更が本質であると常に議論できるわけではありません。
さまざまな原資産を継続的に資産に変換できることこそが、クリプトの魅力です。
免責事項:本記事の内容はあくまでも筆者の意見を反映したものであり、いかなる立場においても当プラットフォームを代表するものではありません。また、本記事は投資判断の参考となることを目的としたものではありません。
こちらもいかがですか?
イヴァンカ・トランプ、彼女の名前を使用した偽の暗号通貨トークンに警告
要点 偽のトークン発行は、トランプ家からの最近の正当な暗号通貨発行を利用している可能性があります。
EigenLayer がメインネット上で Rewards v2 プロトコルのアップグレードを完了し、エコシステム報酬の柔軟性が向上
簡単に言えば EigenLayer はメインネット上で Rewards v2 プロトコルのアップグレードを完了しました。これは、プロトコル評議会によって提案および実装された最初の ELIP および最初のメインネット アップグレードとなります。
SOONが22万ドルを調達 NFT セール、分離型 SVM を搭載したレイヤー 2 メインネットを開始
簡単に言えば SOONは、 NFT 同社は販売を開始し、メインネットを立ち上げ、イーサリアムの平均ブロックタイムを 50 ミリ秒に抑え、将来的には他のレイヤー 1 ブロックチェーンにもサポートを拡大する予定です。
QCP Capital: SECによる新たな暗号タスクフォースの設立はデジタル資産の転換点となる可能性がある
簡単に言えば QCPキャピタルは、投資家がドナルド・トランプ大統領のデジタル資産に関する次期大統領令が長年の期待に応えるものとなるかどうかを注視しており、市場は慎重姿勢を維持しているため、ビットコインのさらなる上昇は不透明であると指摘している。