Gemini CLIは無料で使えますか？

個人GoogleアカウントのGoogle Sign-Inで、60リクエスト/分・1,000リクエスト/日の無料枠が公式に記載されています（参照2026-06-01時点）。npx @google/gemini-cli ならインストールなしで試せます。当社の検証も無料OAuthのみで完走しました。

Gemini CLIは何ができますか？

ターミナルでのコード解析・編集、ファイル操作、コマンド実行、Google検索グラウンディング、MCPによる外部ツール連携などです。今回の実測では、バグ修正・スクリプト作成・テスト追加・コミットまで人手補完ゼロでできました。

実際の業務で使えるレベルですか？

当社実測では開発の定番4タスクが全て一発成功でした。失敗の影響が小さい開発補助なら実務投入できる水準です。ただしレート制限の待ちが頻発するため、大量・高速の連続処理に無料枠は不向きです。

Claude CodeやCodexと何が違いますか？

最大の違いは無料枠の明確さです。Gemini CLIは個人Googleアカウントだけで無料枠が使え、追試のハードルが低い。Claude CodeやCodexはサブスクプラン前提です（CodexはChatGPT Free同梱のquick tasks範囲で無料）。詳細は「AIコーディングツール比較」を参照してください。

導入してすぐ業務に入れて大丈夫ですか？

まず影響の小さいタスクで試し、停止条件と承認ポイントを決めてから広げるのが安全です。自動承認（yolo）はファイル編集やコマンド実行を伴うため、検証は使い捨ての環境で行ってください。進め方は「社内AI導入を進める5ステップ」を参照してください。

AIエージェント

Gemini CLIを実務で検証してみた｜無料で試せるAIエージェントCLIの実力【2026】

編

YDAIコンサルティング株式会社 AI編集部

一次ソース検証型AIメディア編集部・計測: 宮嶋・監修: 依田尚人

公開: 2026年6月11日16分

検証結果の結論（できたこと・できなかったこと）
検証の条件・方法（同じ条件で追試できるように）
検証対象とバージョン
検証環境
与えた共通タスクと評価軸
実際にやってみた（タスク別の実録）
タスクA バグ修正——76秒で一発成功
タスクB CLIスクリプトの新規作成——88秒で即動作
タスクC テスト追加＋実行——82秒・自らテストを回す
タスクD コミット／PR作成——77秒・できないことは「できない」と言う
よかった点／詰まった点（正直に）
よかった点
詰まった点
どんな業務に効くか（中小・中堅の実務目線）
まとめ
出典・参考

「AIエージェントCLIが話題だが、自分の業務で本当に使えるのか。無料でどこまでできるのか」——気になっていても、業務の合間に自分で検証する時間は取りにくい。

そこで当社AI編集部が、無料で試せるAIエージェントCLIの代表格 Gemini CLI を、実際の開発タスク4種（バグ修正・スクリプト作成・テスト追加・コミット／PR作成）で検証した。結論を先に言えば、4タスク全てが人手補完ゼロの一発成功。ただし無料枠ではレート制限の待ちが頻発した。

本記事の数値は全て2026年6月6日の自社実測（Gemini CLI v0.45.2・macOS・無料OAuth）。同じ条件で無料で追試できるよう、手順と条件も明記する。エージェントそのものの基礎は「AIエージェントとは」を参照してほしい。

Gemini CLI（v0.45.2・無料OAuth）に開発の定番4タスクを与えた結果、バグ修正76秒・CLIスクリプト作成88秒・テスト追加82秒・コミット／PR作成77秒で、4タスク全てが人手補完ゼロの一発成功だった。毎回テストを自ら実行して検証してから完了報告する。一方、無料枠ではレート制限による数秒の待ちが頻発し（計62リクエスト中28回）、所要時間の多くは待ち時間だった。失敗の影響が小さい開発補助なら、無料枠のまま実務投入できる水準である（2026-06-06 自社実測）。

検証条件	内容
検証日	2026年6月6日
対象	Gemini CLI v0.45.2（検証日時点のnpm最新版）
モデル	gemini-3-flash-preview（非対話モードの既定）
環境	macOS・Node v25.2.1・Python 3.14.4（venv＋pytest 9.0.3）
認証	無料OAuth「Login with Google」（Google Workspaceアカウント・APIキー不使用）
実行モード	非対話 `gemini -p` ＋自動承認（`--approval-mode yolo`）
与えたタスク	バグ修正／CLIスクリプト作成／テスト追加／commit・PR作成

検証結果の結論（できたこと・できなかったこと）

検証結果マトリクス：4タスク×結果・人手補完・所要時間

タスク	結果	人手補完	所要
A バグ修正	成功（一発）	不要	76秒
B CLIスクリプト新規作成	成功（即動作）	不要	88秒
C テスト追加＋実行	成功（自ら実行して検証）	不要	82秒
D commit／PR作成	成功（PRはリモート無を検知し適切にスキップ）	不要	77秒

4タスク全て成功・人手補完ゼロは、正直に言って予想以上だった。修正は最小限の正しい差分で、余計な書き換えはほぼない（タスクAで指示外のテスト追加が1点あった程度）。「できなかったこと」は能力面では今回の範囲で見つからず、制約面に集中した——レート制限の待ち時間と、初回実行時のセキュリティ制約である（後述）。

検証の条件・方法（同じ条件で追試できるように）

検証条件の早見：対象・バージョン・環境・タスク

検証対象とバージョン

Gemini CLI は Google が OSS（Apache-2.0）で公開するターミナル用AIエージェント。コードの解析・編集、ファイル操作、コマンド実行、Google検索グラウンディングに対応する。導入は npm i -g @google/gemini-cli（または npx @google/gemini-cli でインストールなしに即試行）。検証には当日のnpm最新版 v0.45.2 を使用した。GitHubスターは104,823（2026-06-01時点・GitHub API実数）。個人GoogleアカウントのGoogle Sign-Inで60リクエスト/分・1,000リクエスト/日の無料枠が公式に記載されている（出典1）。外部ツールと繋ぐMCPにも対応しており、MCPの考え方は「Claude CodeとMCPの連携手順」で扱っている。

検証環境

macOS（Darwin 25.3.0）・Node v25.2.1。対象は Python 3.14.4＋pytest 9.0.3 の小さな統計ユーティリティのリポジトリで、mean／median関数とテスト4本のうち、medianのバグでテスト1本が失敗する状態を事前に用意した。認証は無料OAuth「Login with Google」で、当社は Google Workspace アカウントでログインした（APIキー不使用）。実行は非対話モード gemini -p "指示文" に、ファイル編集・コマンド実行を自動承認する --approval-mode yolo を付けた。

与えた共通タスクと評価軸

共通4タスクの一覧：バグ修正・スクリプト・テスト・PR

#	タスク	指示の要旨
A	バグ修正	失敗しているテストの原因を特定して修正し、全テストを通せ
B	CLIスクリプト新規作成	引数の数値群から mean と median を計算・表示。既存モジュールを利用
C	テスト追加＋実行	エッジケース（空入力・単一要素）のテストを追加し全テストを緑に
D	commit／PR作成	意味のあるメッセージでフィーチャーブランチにコミット。可能ならPRも

評価軸は、成功可否（人手修正の要否）・所要時間（実測）・指示への忠実さ（余計な変更の有無）・つまずきの4点。同一リポジトリで A→B→C→D の順に連続実行した。

実際にやってみた（タスク別の実録）

タスクA バグ修正——76秒で一発成功

「test_median_even が失敗する。原因を特定して mathutils/stats.py を修正し、全テストを通せ」と指示。Gemini CLIは対象ファイルを読み、偶数長リストで中央2要素の平均を返していないというバグの原因を正しく特定し、奇数・偶数で分岐する実装に修正した。修正後は自分で pytest を実行し、全テストの通過を確認してから完了報告した。

修正前: 「FAILED tests/test_stats.py::test_median_even - assert 3 == 2.5」 → 修正後: 「5 passed in 0.01s」

所要76秒・1回の指示で完了、人手修正は不要だった。1点だけ、指示していないテスト（単一要素のmedian）を自発的に追加していた。有益な追加ではあるが、「指示した範囲だけ触ってほしい」運用では注意したい。

タスクB CLIスクリプトの新規作成——88秒で即動作

「cli.py を新規作成。引数の数値群から mean と median を計算して表示。mathutils を利用すること」と指示。実装前にリポジトリ構造を読み、既存モジュールの公開関数を確認してから書き始めたのが印象的だった。生成された cli.py は argparse ベースで標準ライブラリのみ。余計な依存追加はない。

python cli.py 4 1 3 2 → 「Mean: 2.5 ／ Median: 2.5」（当方の手元実行でも期待どおり動作）

所要88秒・一発成功。エラー時は標準エラー出力に出して終了コード1を返す、地味に丁寧な作りだった。

タスクC テスト追加＋実行——82秒・自らテストを回す

「mean／median のエッジケース（空入力・単一要素）のテストを追加し、pytest を実行して全テストを緑にせよ」と指示。空入力には本体側に ValueError のガードを実装した上で、pytest.raises で例外を検証するテストを追加。単一要素は既存テストで足りると判断し、重複追加しなかった。テストは自分で実行して「7 passed」を確認して報告（当方の再実行でも同結果）。正規表現マッチにraw文字列を使ってPythonの警告を回避する、細かい品質配慮もあった。所要82秒。

タスクD コミット／PR作成——77秒・できないことは「できない」と言う

「現在の変更を意味のあるコミットメッセージでフィーチャーブランチにコミットせよ。可能ならPRも作成せよ」と指示。fix/median-and-validation ブランチを作成し、変更した3ファイルだけをステージして、要約1行＋変更点の箇条書きという形式の英語メッセージでコミットした。.gitignore がないのにキャッシュディレクトリ（__pycache__）をコミットから外す判断もできていた。リモートリポジトリが未設定だったため、PRは「リモートが設定されていないため作成をスキップした」と明示報告。無理にPR作成を強行しない挙動は信頼できる。所要77秒。

よかった点／詰まった点（正直に）

よかった点と詰まった点の対比

よかった点

第一に、4タスク全て一発成功・人手補完ゼロで、差分は最小限かつ正確だったこと。第二に、毎回テストを自ら実行して検証してから報告すること——「報告は立派だが動かない」がなかった。第三に、細部の品質。例外検証のテスト設計、整ったコミットメッセージ、不要ファイルの除外判断など、人に渡せる水準の仕事をする。第四に、できないこと（PR作成）を理由つきで正直に報告する点だ。

詰まった点

初回実行は即エラーだった。v0.45系の非対話モードには「信頼済みディレクトリ」制約があり、環境変数 GEMINI_CLI_TRUST_WORKSPACE=true を付けるまで動かない。ドキュメントを読まないと最初に必ずつまずくポイントだ。次に、レート制限の待ちの頻発。4タスク計62リクエスト中28回が「容量超過（数秒後にリセット）」となり自動リトライされた。タスクは完走するが、所要76〜88秒の体感の多くは待ち時間で、Workspaceアカウントでも分単位の絞りは発生した。ほかは軽微で、指示外の変更が1点（タスクAのテスト追加）、起動時の「Ripgrep is not available」警告（動作に影響なし）程度だった。

どんな業務に効くか（中小・中堅の実務目線）

向く業務・向かない業務の早見

今回の実測から言えるのは、「失敗しても影響が小さい開発補助」なら無料枠のまま実務投入できる水準にある、ということだ。具体的には、小さなバグ修正・使い捨てスクリプトの作成・テストの雛形整備・コミットまでの一巡。数分待てば正しい差分が返る感覚で、有料ツールを契約する前の「まず無料で試す」選択肢として十分だった。

一方、レート制限の待ちがあるため、大量タスクの連続実行や高速な対話の往復には無料枠は不向きで、本格運用では有料プランやAPIキー従量も検討対象になる。他ツールとの料金・機能の比較は「AIコーディングツール比較」を参照してほしい。さらに、今回のような非対話モードでの委譲を推し進め、タスクを渡すと非同期に自走してPRを返す型まで視野を広げるなら、「自律型コーディングAI比較」でDevin・OpenHands・Jules等を中立に整理している。組織での導入手順は「社内AI導入を進める5ステップ」、任せ方の失敗パターンは「社内AI導入でよくある失敗7つと回避策」が参考になる。停止条件と承認ポイントを決め、影響の小さい範囲から広げるのが現実的だ。

まとめ

Gemini CLI v0.45.2 を開発の定番4タスクで実測した結果、4タスク全てが人手補完ゼロの一発成功だった（76〜88秒）。テストを自ら回して検証してから報告する堅実な挙動で、できないことは理由つきで報告する。一方、無料枠はレート制限の待ちが頻発し、初回は信頼済みディレクトリ制約でつまずいた。総じて「失敗の影響が小さい開発補助を無料で任せる」入口としては、現時点で十分実用と言える。数値は全て2026年6月6日の自社実測であり、ツールの更新で変わりうる——まずは手元で同じタスクを試してほしい。

検証結果を自社の業務に当てはめたい方へ

自社のどの業務から試すかを整理したい場合は、社内AI導入を進める5ステップも参考にしてください。

出典・参考

Gemini CLI 公式リポジトリ（Apache-2.0・無料枠60リクエスト/分・1,000リクエスト/日の記載・スター104,823はGitHub API実数・参照2026-06-01時点） https://github.com/google-gemini/gemini-cli
OpenAI Codex 公式（料金・ChatGPT Free同梱の記載・参照2026-06-02時点） https://developers.openai.com/codex/pricing
当社実測: Gemini CLI v0.45.2（モデルgemini-3-flash-preview）共通4タスク検証・2026-06-06・macOS・無料OAuth・計測者: 宮嶋（実測ログ社内保管）

よくある質問

Q. Gemini CLIは無料で使えますか？: 個人GoogleアカウントのGoogle Sign-Inで、60リクエスト/分・1,000リクエスト/日の無料枠が公式に記載されています（参照2026-06-01時点）。npx @google/gemini-cli ならインストールなしで試せます。当社の検証も無料OAuthのみで完走しました。
Q. Gemini CLIは何ができますか？: ターミナルでのコード解析・編集、ファイル操作、コマンド実行、Google検索グラウンディング、MCPによる外部ツール連携などです。今回の実測では、バグ修正・スクリプト作成・テスト追加・コミットまで人手補完ゼロでできました。
Q. 実際の業務で使えるレベルですか？: 当社実測では開発の定番4タスクが全て一発成功でした。失敗の影響が小さい開発補助なら実務投入できる水準です。ただしレート制限の待ちが頻発するため、大量・高速の連続処理に無料枠は不向きです。
Q. Claude CodeやCodexと何が違いますか？: 最大の違いは無料枠の明確さです。Gemini CLIは個人Googleアカウントだけで無料枠が使え、追試のハードルが低い。Claude CodeやCodexはサブスクプラン前提です（CodexはChatGPT Free同梱のquick tasks範囲で無料）。詳細は「AIコーディングツール比較」を参照してください。
Q. 導入してすぐ業務に入れて大丈夫ですか？: まず影響の小さいタスクで試し、停止条件と承認ポイントを決めてから広げるのが安全です。自動承認（yolo）はファイル編集やコマンド実行を伴うため、検証は使い捨ての環境で行ってください。進め方は「社内AI導入を進める5ステップ」を参照してください。