ai-feed.jp
AIエージェント

Gemini CLIを実務で検証してみた|無料で試せるAIエージェントCLIの実力【2026】

YDAIコンサルティング株式会社 AI編集部

一次ソース検証型AIメディア編集部 ・ 計測: 宮嶋 ・ 監修: 依田 尚人

16
目次

「AIエージェントCLIが話題だが、自分の業務で本当に使えるのか。無料でどこまでできるのか」——気になっていても、業務の合間に自分で検証する時間は取りにくい。

そこで当社AI編集部が、無料で試せるAIエージェントCLIの代表格 Gemini CLI を、実際の開発タスク4種(バグ修正・スクリプト作成・テスト追加・コミット/PR作成)で検証した。結論を先に言えば、4タスク全てが人手補完ゼロの一発成功。ただし無料枠ではレート制限の待ちが頻発した。

本記事の数値は全て2026年6月6日の自社実測(Gemini CLI v0.45.2・macOS・無料OAuth)。同じ条件で無料で追試できるよう、手順と条件も明記する。エージェントそのものの基礎は「AIエージェントとは」を参照してほしい。

Gemini CLI(v0.45.2・無料OAuth)に開発の定番4タスクを与えた結果、バグ修正76秒・CLIスクリプト作成88秒・テスト追加82秒・コミット/PR作成77秒で、4タスク全てが人手補完ゼロの一発成功だった。毎回テストを自ら実行して検証してから完了報告する。一方、無料枠ではレート制限による数秒の待ちが頻発し(計62リクエスト中28回)、所要時間の多くは待ち時間だった。失敗の影響が小さい開発補助なら、無料枠のまま実務投入できる水準である(2026-06-06 自社実測)。

検証条件内容
検証日2026年6月6日
対象Gemini CLI v0.45.2(検証日時点のnpm最新版)
モデルgemini-3-flash-preview(非対話モードの既定)
環境macOS・Node v25.2.1・Python 3.14.4(venv+pytest 9.0.3)
認証無料OAuth「Login with Google」(Google Workspaceアカウント・APIキー不使用)
実行モード非対話 gemini -p + 自動承認(--approval-mode yolo
与えたタスクバグ修正/CLIスクリプト作成/テスト追加/commit・PR作成

検証結果の結論(できたこと・できなかったこと)

検証結果マトリクス:4タスク×結果・人手補完・所要時間

タスク結果人手補完所要
A バグ修正成功(一発)不要76秒
B CLIスクリプト新規作成成功(即動作)不要88秒
C テスト追加+実行成功(自ら実行して検証)不要82秒
D commit/PR作成成功(PRはリモート無を検知し適切にスキップ)不要77秒

4タスク全て成功・人手補完ゼロは、正直に言って予想以上だった。修正は最小限の正しい差分で、余計な書き換えはほぼない(タスクAで指示外のテスト追加が1点あった程度)。「できなかったこと」は能力面では今回の範囲で見つからず、制約面に集中した——レート制限の待ち時間と、初回実行時のセキュリティ制約である(後述)。

検証の条件・方法(同じ条件で追試できるように)

検証条件の早見:対象・バージョン・環境・タスク

検証対象とバージョン

Gemini CLI は Google が OSS(Apache-2.0)で公開するターミナル用AIエージェント。コードの解析・編集、ファイル操作、コマンド実行、Google検索グラウンディングに対応する。導入は npm i -g @google/gemini-cli(または npx @google/gemini-cli でインストールなしに即試行)。検証には当日のnpm最新版 v0.45.2 を使用した。GitHubスターは104,823(2026-06-01時点・GitHub API実数)。個人GoogleアカウントのGoogle Sign-Inで60リクエスト/分・1,000リクエスト/日の無料枠が公式に記載されている(出典1)。外部ツールと繋ぐMCPにも対応しており、MCPの考え方は「Claude CodeとMCPの連携手順」で扱っている。

検証環境

macOS(Darwin 25.3.0)・Node v25.2.1。対象は Python 3.14.4+pytest 9.0.3 の小さな統計ユーティリティのリポジトリで、mean/median関数とテスト4本のうち、medianのバグでテスト1本が失敗する状態を事前に用意した。認証は無料OAuth「Login with Google」で、当社は Google Workspace アカウントでログインした(APIキー不使用)。実行は非対話モード gemini -p "指示文" に、ファイル編集・コマンド実行を自動承認する --approval-mode yolo を付けた。

与えた共通タスクと評価軸

共通4タスクの一覧:バグ修正・スクリプト・テスト・PR

#タスク指示の要旨
Aバグ修正失敗しているテストの原因を特定して修正し、全テストを通せ
BCLIスクリプト新規作成引数の数値群から mean と median を計算・表示。既存モジュールを利用
Cテスト追加+実行エッジケース(空入力・単一要素)のテストを追加し全テストを緑に
Dcommit/PR作成意味のあるメッセージでフィーチャーブランチにコミット。可能ならPRも

評価軸は、成功可否(人手修正の要否)・所要時間(実測)・指示への忠実さ(余計な変更の有無)・つまずきの4点。同一リポジトリで A→B→C→D の順に連続実行した。

実際にやってみた(タスク別の実録)

タスクA バグ修正——76秒で一発成功

test_median_even が失敗する。原因を特定して mathutils/stats.py を修正し、全テストを通せ」と指示。Gemini CLIは対象ファイルを読み、偶数長リストで中央2要素の平均を返していないというバグの原因を正しく特定し、奇数・偶数で分岐する実装に修正した。修正後は自分で pytest を実行し、全テストの通過を確認してから完了報告した。

修正前: 「FAILED tests/test_stats.py::test_median_even - assert 3 == 2.5」 → 修正後: 「5 passed in 0.01s」

所要76秒・1回の指示で完了、人手修正は不要だった。1点だけ、指示していないテスト(単一要素のmedian)を自発的に追加していた。有益な追加ではあるが、「指示した範囲だけ触ってほしい」運用では注意したい。

タスクB CLIスクリプトの新規作成——88秒で即動作

cli.py を新規作成。引数の数値群から mean と median を計算して表示。mathutils を利用すること」と指示。実装前にリポジトリ構造を読み、既存モジュールの公開関数を確認してから書き始めたのが印象的だった。生成された cli.py は argparse ベースで標準ライブラリのみ。余計な依存追加はない。

python cli.py 4 1 3 2 → 「Mean: 2.5 / Median: 2.5」(当方の手元実行でも期待どおり動作)

所要88秒・一発成功。エラー時は標準エラー出力に出して終了コード1を返す、地味に丁寧な作りだった。

タスクC テスト追加+実行——82秒・自らテストを回す

meanmedian のエッジケース(空入力・単一要素)のテストを追加し、pytest を実行して全テストを緑にせよ」と指示。空入力には本体側に ValueError のガードを実装した上で、pytest.raises で例外を検証するテストを追加。単一要素は既存テストで足りると判断し、重複追加しなかった。テストは自分で実行して「7 passed」を確認して報告(当方の再実行でも同結果)。正規表現マッチにraw文字列を使ってPythonの警告を回避する、細かい品質配慮もあった。所要82秒。

タスクD コミット/PR作成——77秒・できないことは「できない」と言う

「現在の変更を意味のあるコミットメッセージでフィーチャーブランチにコミットせよ。可能ならPRも作成せよ」と指示。fix/median-and-validation ブランチを作成し、変更した3ファイルだけをステージして、要約1行+変更点の箇条書きという形式の英語メッセージでコミットした。.gitignore がないのにキャッシュディレクトリ(__pycache__)をコミットから外す判断もできていた。リモートリポジトリが未設定だったため、PRは「リモートが設定されていないため作成をスキップした」と明示報告。無理にPR作成を強行しない挙動は信頼できる。所要77秒。

よかった点/詰まった点(正直に)

よかった点と詰まった点の対比

よかった点

第一に、4タスク全て一発成功・人手補完ゼロで、差分は最小限かつ正確だったこと。第二に、毎回テストを自ら実行して検証してから報告すること——「報告は立派だが動かない」がなかった。第三に、細部の品質。例外検証のテスト設計、整ったコミットメッセージ、不要ファイルの除外判断など、人に渡せる水準の仕事をする。第四に、できないこと(PR作成)を理由つきで正直に報告する点だ。

詰まった点

初回実行は即エラーだった。v0.45系の非対話モードには「信頼済みディレクトリ」制約があり、環境変数 GEMINI_CLI_TRUST_WORKSPACE=true を付けるまで動かない。ドキュメントを読まないと最初に必ずつまずくポイントだ。次に、レート制限の待ちの頻発。4タスク計62リクエスト中28回が「容量超過(数秒後にリセット)」となり自動リトライされた。タスクは完走するが、所要76〜88秒の体感の多くは待ち時間で、Workspaceアカウントでも分単位の絞りは発生した。ほかは軽微で、指示外の変更が1点(タスクAのテスト追加)、起動時の「Ripgrep is not available」警告(動作に影響なし)程度だった。

どんな業務に効くか(中小・中堅の実務目線)

向く業務・向かない業務の早見

今回の実測から言えるのは、「失敗しても影響が小さい開発補助」なら無料枠のまま実務投入できる水準にある、ということだ。具体的には、小さなバグ修正・使い捨てスクリプトの作成・テストの雛形整備・コミットまでの一巡。数分待てば正しい差分が返る感覚で、有料ツールを契約する前の「まず無料で試す」選択肢として十分だった。

一方、レート制限の待ちがあるため、大量タスクの連続実行や高速な対話の往復には無料枠は不向きで、本格運用では有料プランやAPIキー従量も検討対象になる。他ツールとの料金・機能の比較は「AIコーディングツール比較」を参照してほしい。組織での導入手順は「社内AI導入を進める5ステップ」、任せ方の失敗パターンは「社内AI導入でよくある失敗7つと回避策」が参考になる。停止条件と承認ポイントを決め、影響の小さい範囲から広げるのが現実的だ。

まとめ

Gemini CLI v0.45.2 を開発の定番4タスクで実測した結果、4タスク全てが人手補完ゼロの一発成功だった(76〜88秒)。テストを自ら回して検証してから報告する堅実な挙動で、できないことは理由つきで報告する。一方、無料枠はレート制限の待ちが頻発し、初回は信頼済みディレクトリ制約でつまずいた。総じて「失敗の影響が小さい開発補助を無料で任せる」入口としては、現時点で十分実用と言える。数値は全て2026年6月6日の自社実測であり、ツールの更新で変わりうる——まずは手元で同じタスクを試してほしい。


検証結果を自社の業務に当てはめたい方へ

自社のどの業務から試すかを整理したい場合は、社内AI導入を進める5ステップも参考にしてください。


出典・参考

  1. Gemini CLI 公式リポジトリ(Apache-2.0・無料枠60リクエスト/分・1,000リクエスト/日の記載・スター104,823はGitHub API実数・参照2026-06-01時点) https://github.com/google-gemini/gemini-cli
  2. OpenAI Codex 公式(料金・ChatGPT Free同梱の記載・参照2026-06-02時点) https://developers.openai.com/codex/pricing
  3. 当社実測: Gemini CLI v0.45.2(モデルgemini-3-flash-preview)共通4タスク検証・2026-06-06・macOS・無料OAuth・計測者: 宮嶋(実測ログ社内保管)

よくある質問

Q. Gemini CLIは無料で使えますか?
個人GoogleアカウントのGoogle Sign-Inで、60リクエスト/分・1,000リクエスト/日の無料枠が公式に記載されています(参照2026-06-01時点)。npx @google/gemini-cli ならインストールなしで試せます。当社の検証も無料OAuthのみで完走しました。
Q. Gemini CLIは何ができますか?
ターミナルでのコード解析・編集、ファイル操作、コマンド実行、Google検索グラウンディング、MCPによる外部ツール連携などです。今回の実測では、バグ修正・スクリプト作成・テスト追加・コミットまで人手補完ゼロでできました。
Q. 実際の業務で使えるレベルですか?
当社実測では開発の定番4タスクが全て一発成功でした。失敗の影響が小さい開発補助なら実務投入できる水準です。ただしレート制限の待ちが頻発するため、大量・高速の連続処理に無料枠は不向きです。
Q. Claude CodeやCodexと何が違いますか?
最大の違いは無料枠の明確さです。Gemini CLIは個人Googleアカウントだけで無料枠が使え、追試のハードルが低い。Claude CodeやCodexはサブスクプラン前提です(CodexはChatGPT Free同梱のquick tasks範囲で無料)。詳細は「AIコーディングツール比較」を参照してください。
Q. 導入してすぐ業務に入れて大丈夫ですか?
まず影響の小さいタスクで試し、停止条件と承認ポイントを決めてから広げるのが安全です。自動承認(yolo)はファイル編集やコマンド実行を伴うため、検証は使い捨ての環境で行ってください。進め方は「社内AI導入を進める5ステップ」を参照してください。

出典・参考資料

  1. 1.
  2. 2.