AIエージェントで株式取引を自動化する一般的な仕組み(2026年3月11日時点)
結論
いま一般的な「AIエージェントでの株式自動売買」は、LLM単体が魔法のように売買する仕組みではありません。実態は、LLMを判断役に置き、その外側に市場データ取得、ルール確認、リスク制御、注文実行、監視、記録を置く多層構造です。Anthropicはこの基本形を「augmented LLM(拡張されたLLM)」と説明しており、LLMに検索・ツール・記憶を足して使うのが出発点です。LangChain系の公式文書でも、エージェントはモデル呼び出し→ツール実行→観察→再判断のループで動くと整理されています。
まず理解すべき「脳」と「手足」の分担
初心者が最初に誤解しやすいのは、ClaudeやGPTが証券会社に直接つながっていて、そのまま株を売買していると思ってしまう点です。実際には、LLMは主に考える係です。株価やニュースを直接持っているわけではないので、外部ツールで最新データを取得し、LLMはその結果を読んで「今は買いか、見送りか、数量はいくつか」を考えます。実際の注文は、AlpacaやIBKRのようなブローカーAPIが担当します。Claude APIの公式文書でも、素のAPIは「自分で会話状態を管理し、自分でツールループを書く」前提で、Agent SDK側がそのループを実行すると明記されています。
一般的な全体構成
典型的な構成は、次の6層です。
①指示層は人間が自然言語で目標を与える場所です。たとえば「毎日寄り前に米国大型株を点検し、最大損失を抑えながら候補を3つ出す」のように指示します。
②推論層はClaudeやGPTなどのLLMです。
③ツール層は市場データ、ニュース、テクニカル指標、ポートフォリオ情報、発注APIです。
④ガードレール層は「1銘柄20%まで」「現金が足りなければ発注禁止」「人間承認がない限り成行禁止」などを強制します。
⑤実行層は証券APIです。
⑥監視・記録層はログ、約定確認、異常停止、通知です。LangGraphはこの種の長時間・状態保持型エージェント向けに、durable execution、人間承認、短期・長期メモリを用意しています。
ReActパターンでどう動くのか
2025〜2026年に広く説明される標準形は、ほぼReAct型です。LangChain公式は、エージェントが**ReAct(Reasoning + Acting)**で、短い推論とツール呼び出しを交互に繰り返し、観察結果を次の判断に渡すと説明しています。つまり流れは、
Observe→Reason→Act→Observeです。
たとえば、
-
価格取得ツールでAAPL、NVDA、SPYの現在値と出来高を取る。
-
ニュースAPIで決算や規制ニュースを取る。
-
指標計算ツールで移動平均やRSIを出す。
-
LLMが「上昇基調だがイベント前で不安定」などと解釈する。
-
ガードレールが数量上限や損失上限を確認する。
-
発注ツールが買い・売り・取消を出す。
-
注文状態を監視し、未約定なら再判断する。
この「考える」と「道具を使う」を交互に回すのが中核です。
市場データはどこから来るのか
AIが賢くても、材料が古ければ判断は崩れます。そのため自動売買では、データ取得の品質が非常に重要です。Alpacaの公式では、株式・暗号資産・オプション・ニュースのリアルタイムデータをWebSocketで配信でき、常時使えるテストストリームも用意されています。注文状態の維持も、ポーリングよりストリーミングが推奨されています。つまり実運用では、数秒ごとに全部を再取得するより、イベントが来たら再判断する設計が増えています。
注文はどう実行されるのか
発注部分は、LLMではなくブローカーAPIの仕事です。Alpaca公式では、注文の発行・照会・取消がAPIででき、注文ごとにIDが付き、更新はストリーミングでも受け取れます。IBKRもWeb API、TWS API、FIXなど複数のAPIを提供し、自動売買戦略の実装を前提にしています。つまり、AIエージェントは「証券会社を置き換える存在」ではなく、証券APIを操作する判断装置です。
MCPやエージェントフレームワークは何を楽にするのか
ここでMCPやLangChain系フレームワークが効いてきます。Anthropic系ではMCPが、AIアプリと外部ツールを一定の形式でつなぐ標準として位置づけられています。AlpacaのMCP Serverも、自然言語で市場調査・分析・注文を扱える橋渡しとして提供されており、履歴データ、ライブデータ、注文、ポジション、買付余力、損益などにアクセスできます。LangChainやLangGraphは、その上でツール選択、状態遷移、割り込み、人間承認、メモリ保持を組み立てやすくします。CrewAIは複数エージェントの役割分担や委任を前面に出しています。
固定ルール型ボットとの違い
従来型ボットは「RSIが30以下なら買う」のように、条件が決まれば速くて再現性も高い反面、想定外の文脈に弱いです。LLMエージェント型は、ニュース、決算、保有比率、資金余力、過去の失敗ログなど、複数の情報を文章レベルで統合できるのが強みです。半面、自由度が高いほど暴走余地も増えます。LangChain公式が人間承認ミドルウェアを用意し、Anthropicが「用途に合わせて能力を絞ること」を強調しているのはそのためです。実務では、LLMに全部を丸投げせず、売買可能銘柄、最大数量、許容損失、承認必須条件をコード側で固定する構成が一般的です。これは公式文書を踏まえた実装上の帰結です。
初心者向けに超具体化すると、1回の売買はこう進みます
朝9時前、スケジューラがエージェントを起動します。エージェントはまず口座残高、保有株、前日の取引結果を読みます。次に市場データとニュースを取得し、候補銘柄を絞ります。その後、LLMが「今日はイベント前なので新規買いは半分」「既存ポジションの一部利確を優先」と判断案を作ります。しかしそこで即発注はせず、ガードレールが「1日の最大損失想定」「銘柄集中度」「注文種別」「市場時間」を確認します。条件を満たした注文だけが発行され、約定結果はログに保存され、SlackやLINEやメールに通知されます。約定しなければ再評価し、異常があれば停止します。これが“自律”の実態です。
初心者が最初に選ぶべき運用形
最初から本番資金で回すのは危険です。Alpacaの公式では、紙取引は無料で、リアルタイム市場データを使ったシミュレーションとして提供され、注文は実市場へ送られず、見積もり価格を基に約定が模擬されます。またPaper Only Accountは世界中からメールアドレスで作成可能と案内されています。まずは紙取引で、プロンプトの癖、注文のずれ、約定通知、停止条件を確認し、その後に少額ライブへ移るのが王道です。
実装パターンは大きく3種類
2026年時点の実装は、だいたい次の3系統に分かれます。
1つ目は、会話型+MCP型です。Claude系や各種AIクライアントにMCPサーバーをつなぎ、自然言語で「今日の候補を探して、条件に合えば注文案を作って」と頼む方式です。AlpacaのMCP Serverはまさにこの形で、対応クライアントとしてClaude Web、Claude Code、VS Code、Cursor、ChatGPT系などを挙げています。
2つ目は、フレームワーク型です。LangChainのagent、LangGraphの状態遷移、CrewAIの役割分担を使って、自前アプリとして組む方式です。
3つ目は、素のAPI直書き型です。Claude APIや各種SDKを直接呼び、開発者が会話履歴、ツール呼び出し、再試行、停止条件を全部制御します。Claude公式は、この場合は自分で会話状態とツールループを書くと明記しています。
なぜ「完全放置」が難しいのか
初心者は「AIなら24時間勝手に稼いでくれるのでは」と思いがちですが、実際には自動化しても不確実性の置き場が変わるだけです。紙取引の段階ですら、Alpacaは本番との差として市場インパクト、情報漏れ、レイテンシによるスリッページ、板の順番、価格改善、配当、規制費用などを再現しないと明示しています。つまり、バックテストや紙取引で良く見えても、本番で同じ結果になる保証はありません。だから現在のベストプラクティスは、LLMに自由判断をさせる範囲を狭め、危険なツール呼び出しは人間承認で止められるようにすることです。LangChainのHITLはそのための仕組みです。
初心者が仕組みを学ぶ順番
学ぶ順番も重要です。最初は、
①市場データを読む
②注文を出さず分析だけさせる
③紙取引で注文案と約定ログを照合する
④少額本番で監視付き運用にする
の順が安全です。いきなり「フル自動・無監視」に行くと、プロンプトの誤解、銘柄コードの取り違え、相場急変時の連打、API制限、ネット切断時の再送重複など、システム事故のほうで負けやすいです。LangGraphがdurable executionや状態保存を強く押し出し、Alpacaがストリーミングと注文状態監視を推奨しているのは、売買ロジック以前に運用の壊れ方が重要だからです。
※本稿は仕組み解説です。特定銘柄の推奨ではありません。実運用前に紙取引、税務確認、API鍵保護、停止条件設定等を必ず行ってください。

