知見のアーカイブ

最もAGIに近いAIエージェント「Manus」を紹介!ChatGPT AgentやClaude Codeと比較して機能を解説!

最もAGIに近いAIエージェント「Manus」を紹介!ChatGPT AgentやClaude Codeと比較して機能を解説!

AGIに近づくAIエージェントの最前線

近年、AIは単なる対話型チャットボットから、与えられた目標を自律的に遂行する「AIエージェント」へと急速に進化しています。こうしたエージェントは複数のAIモデルやツールを連携させ、人間の指示に基づいて計画・実行・成果物生成までを一貫して行う能力を持ちます。特に注目されるのが、中国発の自律型エージェント「Manus(マヌス)」であり、その性能は汎用人工知能(AGI)に近いとも言われます。他方、米OpenAIもChatGPTエージェントを発表し、またAnthropicは開発者向けにコード特化型エージェントのClaude Codeを提供しています。本記事ではこれら最新のAIエージェントを、開発背景・技術特性・活用事例・課題など多角的に比較解説します。

AIエージェントとは何か

エージェント機能のイメージ

従来の対話型AI(LLM: 大規模言語モデル)はユーザーの問いかけに応答する一回限りの動作が主でした。しかしエージェント型AIは、単なる回答生成を超え、ウェブ検索やツール操作、コード実行などを含む複数工程を自律的にこなす点が特徴です。まるで人間の秘書やプログラマーのように、与えられた課題を「考えて実行する」能力を備えています。OpenAIのプレスリリースでも「ChatGPTが自前の仮想コンピュータを使い、複雑なタスクを最初から最後まで実行する」エージェント機能として紹介されています (1)。このようにエージェントはアイデアを具体的な成果物に変換する役割を担い、いわば「思考と行動を橋渡しする」システムです (2) 。

エージェント技術はAGI(汎用AI)に近い可能性を期待される一方、安全性や信頼性の確保が課題でもあります。実行型AIでは外部ツールへのアクセスや複数工程の自動化が進む一方で、誤動作や悪意ある操作(プロンプトインジェクション)への対策も必須となります。OpenAIは「エージェントモード」におけるプロンプト攻撃への対策やユーザー許可の導入を強調し (3) 、AnthropicのClaude Codeも明示的なユーザー承認モデルを採用しています (4)。以下では、個別のエージェントについて詳しく見ていきます。

ドメイン横断型エージェント:Manus(マヌス)AI

汎用AIエージェントのイメージ

Manus AIエージェントは、中国北京のスタートアップ「Butterfly Effect」が開発した汎用的AIエージェントです (5) 。2025年3月にクローズドβ版が発表されると、中国国内外で大きな注目を集めました。共同創業者の季逸超氏は「アイデアと実行のギャップを埋める次世代AIで、AGIの一端を垣間見る可能性がある」と語り、その自律性の高さを強調しています 。

Manusの技術的特徴は、いわゆるマルチエージェント構造にあります 。与えられた目標を達成するため、プランナーナレッジ検索などの専門サブエージェントが協調し合い、情報収集、計画立案、ツール操作、分析・加工を連続して実行します。各ユーザーには「Manusの仮想コンピュータ」が割り当てられ、ブラウザ操作、ファイル管理、プログラム実行などを経てタスクが完遂されます 。この過程はリアルタイムでビジュアル化され、ユーザーは進捗を確認しながら必要に応じて介入・指示できます 。

ManusのコアモデルにはAnthropicのClaude 3.5 Sonnetと、中国企業アリババのQwenが使われています 。Claude 3.5を主軸に、Qwenでファインチューニングを施すことで、実世界タスクへの応用力を高めています。また、Manus内部には29種類以上の外部ツールを呼び出せる仕組み(一般的なものではブラウザ自動操作ツール「Browser Use」やPython実行環境など)が組み込まれ、ユーザーが別々のアプリ間で手作業を挟むことなくシームレスに処理が進みます 。

さらに、Manusはクラウド上での非同期処理も可能です。ユーザーがPC画面を閉じていてもタスクはバックグラウンドで継続され、完了時に通知されます 。大規模なデータ分析や長時間のWebスクレイピングでも、Manusに任せることで待機時間を有効活用できます。

Manus公式サイトや公開データによれば、GAIAベンチマーク(汎用AIエージェント評価指標)においてManusはSOTA(最先端)の性能を示し、OpenAIのGPT-4系モデルや他社トップエージェントを上回っています 。例えばGAIAレベル1ではManusのタスク正答率86.5%に対し、OpenAIのDeep Researchは74.3%と報告されており、レベル3でも57.7%対47.6%と差を付けています 。これらは外部ツール活用や論理推論能力が高く評価された結果であり、Manusが世界トップクラスの汎用エージェントであることを裏付けています。

Manusの提供形態と料金: 2025年3月のβ版発表当初は招待制でしたが、高い関心に応えて5月から無料タスク枠やポイントボーナスを全ユーザーに開放しています 。現在、基本的に全員が1日1タスク(300クレジット相当)の無料利用枠を得られ、さらに招待制廃止によりウェイトリスト無しで使える形になっています 。有料プランも多段階で用意され、月額$19のベーシック(1900ポイント)、$39の「Plus」(3900ポイント)、$199の「Pro」(19900ポイント)などがあります (6) 。これらのポイントはManus内でタスク実行に消費され、より高度なモードや並列タスク実行、優先アクセスなどが付与されます 。

Manusの活用事例: 企業やビジネスシーンでは、サイト制作、旅行計画、経理レポート作成、株価分析など多彩な用途が想定されています 。たとえば「Webサイトのテーマを指定して関連情報を集め、デザイン提案や文章生成まで含むサイト完成」「旅行条件を伝えれば観光プランを立案し旅程ハンドブックを自動生成」「企業経理で月次レポートや売上グラフを作成」「株価データやSNSコメントを組み合わせた分析レポート生成」などの例が挙げられています 。実際、EC事業者が週50社分の競合価格データを収集・分析し、対策案を提案するといった実例報告もされており (7)、Manus自身も「競合調査からスライド作成までManusの方が高品質」と公式Twitterで主張するなど積極的な利用促進を行っています (8)。

注意点: Manusは非常に高機能ですが、利用に際しては安全性と法的側面に注意が必要です。入力データや生成物がサーバーに送信されるため(特に中国基盤のサービスではセキュリティや監査の透明性が不明瞭)、機密情報の取り扱いには慎重を要します 。また、ウェブ上のデータ収集では著作権やプライバシー規約違反のリスクが指摘されており、使用前に情報源のライセンスや利用許諾を確認することが推奨されています 。さらに、β版の高負荷によりサーバーは極端な負荷にさらされており、運用の安定性確保が急務と公式が認めています 。以上を踏まえた上で、Manusは「自律型AIエージェントとして思考から成果物生成まですべてを完遂する」という理念のもと、大規模な自動化を実現しつつあります 。

汎用チャットエージェント:ChatGPT Agent

自律型エージェントのイメージ

OpenAIが2025年7月に公開したChatGPTエージェントは、ChatGPT(GPT-4o)に自律型の振る舞いを加えた機能です。基本的には先述のOperator(ウェブ操作)とDeep Research(統合調査)技術を統合し、一般的な質問応答を超え、指示されたタスクを計画・遂行・報告することを目指します 。例えば公式デモでは「カレンダーを見て今後の会議を要約」「和朝食4人分の献立と材料購入」「競合他社3社を分析してスライド作成」など、具体的な例が挙げられています 。ChatGPTはウェブサイトを自動操作し、検索結果をフィルタリング、必要に応じて安全なログインを行い、コード実行や分析処理を実施した上で、結果を編集可能なスライドやスプレッドシートとしてまとめます 。

技術的には、ChatGPT Agentは仮想コンピュータを使って作業する構造を持ち、Operator(ブラウザ操作)・Deep Research(情報統合)・ChatGPT本体(会話・推論)の3つの強みを一体化したシステムです 。タスクの実行中も進捗が可視化され、ユーザーはいつでも介入可能です 。またOpenAIは特に安全対策に注力しており、高リスク行為(資金移動など)は拒否する学習を施し、外部サイトからの悪意ある命令(プロンプトインジェクション)に対抗するため「明示的なユーザー承認」を必須としています 。つまり、ChatGPT Agentは高度に自動化された作業をこなせる一方で、重大な操作には都度ユーザーの許可を求め、ユーザーが必要に応じて中断や承認を行える設計です 。

リリース状況と料金: ChatGPTエージェント機能は、当初ChatGPTの有料プラン(ProやTeam)向けに順次提供されました (9)。公式発表によれば、Pro(個人$20/月)およびTeamプランのユーザーはすぐに「エージェントモード」を有効化でき、Plusプランにも順次展開中です (10)。料金的には、ChatGPT Plusプラン(月額20ドル)にエージェント機能が含まれ、チーム向けでは1ユーザーあたり月200ドルのTeamプランも用意されています 。機能的には、Deep ResearchやOperatorと同様に、GPT-4oなど最先端モデルへのアクセスが拡張されます。なお、利用量には制限があり、現時点ではProプランが月400メッセージ、その他有料プランが40メッセージの上限が設けられています(今後拡大予定) 。

活用の展望: ChatGPTエージェントは個人の生産性向上からビジネス用途まで幅広い利用が想定されます。例えば、日常業務の自動化(スケジュール調整、レポート作成)、学習・研究サポート(情報収集とレポート化)、通販や旅行手配の自動化などが挙げられます。実際にTechRadarやPC Gamerなどの報道では、簡単なデートプラン作成からオンラインショッピングの注文、子供の預け先調整まで含むタスクを試行した事例が報告されています (11)。ただし、ChatGPTエージェントはまだ実験的機能の域を出ておらず、結果にムラがあったり誤動作も見受けられます。OpenAI自身も「高負荷作業には注意」「ユーザーが慎重に監視・調整する必要がある」としており 、実運用では最終判断に人間が関わるべき段階です。

📊 お役立ち資料
国内99件のAI・データ活用プロジェクトの成功事例をまとめた資料です。 関心のある業界や、気になる関連企業の成功事例の詳細な事例集をご覧にいただけます。
ダウンロードはこちら

プログラミング特化型エージェント:Claude Code

コーディング支援のイメージ

Claude Codeは、Anthropic(クロードAI社)が開発した、主にソフトウェア開発支援に特化したAIエージェントです。2025年4月の開発者向けカンファレンス「Code with Claude」で発表され、その名の通りコマンドラインやIDE内で動作するコーディングアシスタントを目指しています 。内包するモデルは最新のClaude 4 Opusで、Anthropic研究者が使用するものと同等のエンジンです 。

Claude Code最大の特徴は、コードベース全体の理解自律的編集です。Anthropic公式サイトでは「Claude CodeはAgentic Searchを使い、プロジェクト構造や依存関係を自動的に把握して、複数ファイルの変更を調整する」ことが謳われています 。具体的には、コードリポジトリ全体を数秒でマッピング・説明し、GitHubやGitLabと連携してIssue→Pull Requestワークフローを自動化します 。ユーザーはターミナルで自然言語の指示を出すだけで、テスト実行やコミット、プルリクエスト作成まで一貫して処理を任せられます 。また「ファイルを自動修正する前に必ず承認を求める」「プロジェクト独自のコーディングスタイルを学習する」など、実運用での安全性・カスタマイズ性も重視されています 。

Claude Codeは開発者に馴染みのある環境で動作する点も特徴です。ターミナルに常駐して対話を行うほか、Visual Studio CodeやJetBrains系IDEにも統合可能です 。これによりコンテキスト切り替えの手間が減り、開発フローをスムーズにすることが狙いです。Anthropicエンジニアやパートナー企業の評価では「Claude Codeによりチームのコーディング効率が劇的に向上した」「手間のかかる作業が1~2日分節約できた」といった声が上がっており 、エンタープライズから個人開発者まで幅広く期待が寄せられています。

提供形態と料金: Claude Code自体はCode with Claude 2024での発表以降ベータ展開中ですが、利用にはAnthropic APIへのサインアップと利用料が必要です。公式サイトには「標準的なAnthropic API料金の従量課金モデルで提供」と明記されています 。つまり、Claude Codeの利用料はGPT-4oモデル呼び出しと同様に発生し、個別の固定料金プランはありません。一般的なAnthropic API料金はトークン使用量に応じた従量制であり、アクセスするモデル(Claude 4 Sonata vs Opus)や呼び出し頻度によりコストが変わります。

利用例: Claude Codeはあくまでもコーディング支援に特化しているため、大規模ドキュメントの処理やビジネスレポート作成などには使えません。あくまで開発者が日常的に行うタスク(コーディング、デバッグ、テスト、ドキュメント生成など)で威力を発揮します。たとえば、AnthropicはNext.jsプロジェクトへの新機能追加を例に公開デモを行っており、コードインポートからユニットテスト生成、バグ修正まで完全自動で対応しました 。社内外の開発者コミュニティでも「複雑な変更も一括編集で対応できる」「CLI上でPull Requestまで完了させられる」といった活用報告が増えています。

AIエージェント比較表

以上の内容を整理し、主要なAIエージェントの特徴を以下の表にまとめます。Manusは汎用性・自動化の高さが特徴で、企業の業務全般や個人生活タスクまで幅広くこなせます。ChatGPTエージェントは対話AIの延長上にあり、複雑タスクを遂行するもののユーザーの監督下で動作します。Claude Codeはコーディング専用で、プログラミング生産性の飛躍的向上を目指します。

機能・項目 Manus AI(汎用エージェント) ChatGPT Agent(OpenAI) Claude Code(Anthropic)
主な用途・対象業務 Web操作、レポート作成、検討、コード生成など幅広いタスク 目的指向の複雑タスク(調査・計画・実行) ソフトウェア開発(コード理解・生成・テスト)
モデル技術 Claude 3.5 Sonnet + 中国Qwen を融合 GPT-4o系(統合エージェント) Claude 4 Opus(コード特化モデル)
実行環境・インターフェース クラウド上の仮想コンピュータ(独自GUI「Manusコンピュータ」) ChatGPTウェブアプリ(会話UI) 開発者PC上のターミナル/IDE
外部ツール連携 29種以上のツール(ブラウザ操作、自動入力、Excel操作、Python 等) ブラウザ操作、API連携(メール・カレンダー・検索など) Git/GitHub/GitLab、ビルドツール、テストフレームワーク
自動化レベル 高:指示から成果物まで完全自律(ユーザー介入最小) 中:段階的に実行するが重要操作はユーザー許可を要する 中:コードタスクを代行。ただし最終コミット前に承認が必要
提供形態/利用条件 招待制β→現在無料利用枠+有料プラン($19~$199/月) ChatGPT Plus($20/月)以上で利用可 API経由の従量課金。単体ツールとしては試用ベータ(要Anthropic登録)
主な利点 自律性: 一度の指示で業務完結多機能: 複数モデル・複数ツール連携バックグラウンド処理 即時性: 既存モデルそのままを使ってすぐ試せる自由度: 自然言語で柔軟に指示可能回答品質: ChatGPTの言語能力 専門性: 大規模コードベースの理解効率化: 反復作業の自動化制御性: ユーザー承認モデルで安全
主な課題 データ安全: 中国サーバー依存で不透明要素 法的規制: ウェブデータ収集のライセンス問題 安定性: β版サーバ負荷 信頼性: 新機能ゆえ誤作動も多い安全性: Webからの悪意ある指示への警戒 課題管理: 高度タスクに対する過信リスク 利用範囲: コード以外のタスクには使用不可コスト: 大規模プロジェクトではAPI使用料が嵩む依存性: プロジェクト構造に強く依存し、学習コストがかかる

表:代表的なAIエージェントの比較。各項目の内容は公式発表や各種レポートを参照。

課題・展望と考察

以上のように、Manus、ChatGPTエージェント、Claude Codeはそれぞれ異なるアプローチで「AIが人間の仕事を代替する未来」を示しています。Manusは最も汎用性が高く自律的ですが、依然として既存モデル(Claude/Qwen)とツールの組み合わせに過ぎず、AGIを達成しているわけではありません。一方ChatGPTエージェントは現在進化途上であり、ハイステークな業務には慎重なユーザー介在を要求します。Claude Codeは「AIがすべての開発業務を代行する」レベルには至らず、あくまでプログラマーの支援ツールです。

コスト面では、Manusは無料枠+低額から始まるサブスクリプション($19~$199/月) 、ChatGPTエージェントはChatGPT Plusプラン($20/月)に含まれる形 、Claude CodeはAPI従量課金 と、提供形態が大きく異なります。またモデル仕様も一長一短で、Manusは複数モデルを組み合わせるマルチモデル戦略 、ChatGPTは最新のGPT-4oオールラウンダー型、Claude Codeはコード最適化専用の独自最適化モデルです 。

実運用上の注意: どのエージェントも、出力結果をそのまま鵜呑みにすると誤謬やコンプライアンス違反に繋がる恐れがあります。Manusは生成データがすべてサーバに送られるため機密情報はNG 、ChatGPT Agentはウェブ上の誤情報流用に注意 、Claude Codeは生成コードの品質やセキュリティを開発者自身が検証する必要があります。さらに、Manusを巡っては中国側で「海外モデル依存」と規制問題が噴出し、運営拠点をシンガポールに移す事態にもなりました (12)。これはAIエージェント技術が国家安全保障やプライバシー規制の対象となり得る現実を示しています。

総じて、これらのAIエージェントはいずれも部分的にAGI的な動作を実現するものであり、実務効率化への大きな可能性を秘めています。ただし「AGI」ありきの過剰な期待は禁物です。各エージェントは現時点で道具(ツール)と大規模言語モデルの組み合わせに過ぎず、真の汎用性・自己学習能力までは持ち合わせていません。今後も技術改良が続き、機能は向上していくでしょうが、最終的な成果の評価やリスク管理は常に人間側が担う必要があります。AIエージェントを活用するには、適切なガバナンスと人間との協働設計が欠かせません。

まとめ: Manusは「思考を行動に変える」新進気鋭の汎用AIエージェントであり、ChatGPTエージェントは「対話型大規模モデルの仕事まで代行する」技術進化、Claude Codeは「コーディング業務の自動化支援」として位置付けられます。それぞれが強みを持ち、将来の業務革新に寄与すると期待されますが、AGIの名にふさわしい存在となるにはなお多くの技術的・倫理的課題を越える必要があります。今後も各社の動向やユーザー事例に注目しつつ、AIエージェントの利点と限界を理解した上で活用戦略を立てることが重要です。

📑 資料請求
 代表者直筆! ビッグデータラボの事例に基づく、社内でAI・データ活用のプロジェクトを進める上でのノウハウをまとめました。
ダウンロードはこちら

お問い合わせ

下記フォームよりお気軽にお問い合わせください。
担当者より折り返しご連絡いたします。

人材・HR生成AI・LLMシステム開発