Google製のAIエージェント「Gemini CLI」の特長や導入方法を解説

普段のお仕事に役立つ普遍的なプログラミングTIPSや、業界で注目度が高い最新情報をお届けする「編集部ピックアップ」。
今回はターミナルからGeminiに直接アクセスできるGoogle製のAIエージェント「Gemini CLI」をご紹介します。

はじめに

大規模言語モデルとして知られるGPT-5やClaudeは、汎用的な生成AIサービスとして展開され、ビジネスからプライベートまで様々な場面で活用されています。自然言語の認識や応答の精度が非常に高くなり、専門家のような設計案やタスク自動化などの提案を受けられるようになりました。

Googleが研究開発を進める大規模言語モデル「Gemini」も非常に優秀な性能を発揮しており、システム開発においても要件定義からテストまでプロジェクトのあらゆる場面で大きく貢献しています。今回は、コマンドラインから手軽に利用できるAIエージェント「Gemini CLI」の特長や使い方を解説していきます。

Gemini CLIとは

Gemini CLIは、コマンドプロンプトから操作できる汎用のアシスタントツールです。バックグラウンドでGoogle製の大規模言語モデルであるGeminiが動作し、自然言語によるユーザーの様々な指示に応えられます。

コード生成に限らず、情報収集や整理、資料作成など幅広く活用できるため、日常業務の負担軽減への活躍が期待できます。文章や画像、動画を使った対話で作業を進められるため、専門的な知識が少なくても扱いやすいツールです。また、MCPサーバーとの連携がサポートされており、用途に合わせた拡張が可能です。

なお、Gemini CLIには無料プランがあり気軽に始められます。無料の利用枠が大きいため日常の用途や検証に充分な量を試すことができます。GoogleアカウントまたはGemini APIキーを所持していれば、下記の範囲のもとで無料での利用が可能です。

  • 1,000リクエスト/日
  • 60リクエスト/分

また、使用状況を細かく記録したり、機密情報が収集されないような設定が可能でエンタープライズ向けにも配慮されており、ビジネスの現場にも活用できます。

Gemini CLIの特長

高性能な最新版Geminiを利用できる

Gemini CLIでは、2025年8月時点で最新版のGemini 2.5 Proを利用できます。最新モデルでは、会話内容の記憶領域に使われるトークンのサイズが大幅に向上しており、長いやり取りでも話の流れを加味した提案が可能になりました。また、動画や音声を使った指示も行いやすくなり、より利便性が高まっています。

人間主導の対話形式で進行できる

Gemini CLIは提案を行いますが、最終的な判断は利用者に委ねるように設計されています。例えば、ファイルの上書きを伴う提案など重要な作業は、利用者が承諾することで実行される仕組みになっています。人が介入できる余地が意図的に組み込まれており、安全に作業を進行できます。

Gemini CLIとGemini Code Assistの違い

同じくGeminiを活用したツールとしてGemini Code Assistがありますが、用途や得意とする場面が異なります。Gemini Code AssistはVisual Studio CodeなどのIDEに組み込む拡張機能で、コードの提案や補完など主にコーディングに対する補佐を得意としています。

対してGemini CLIは、シンプルなコマンドを用いた対話により、考えを整理したりアイデアを練ったりする長いやり取りにも応えられるよう作られています。また、2025年8月13日に公開されたアップデートによりVisual Studio Codeとの連携が強化され、ワークスペースへの直接アクセス機能や、コード変更の提案をエディタ内で直接比較できる差分ビュー機能が追加されており、より普段の開発で使いやすくなっています。

Gemini CLIを使ってみよう

ここからは、Gemini CLIの導入方法と機能の使い方を解説していきます。

Node.jsのインストール

Gemini CLIにはNode.jsが必要なため、公式サイトにアクセスしてダウンロードしましょう。

ページ下部に表示されているOSとアーキテクチャを選択し、左の緑色のボタンをクリックしてインストーラーのダウンロードを行います。

  • macOSの場合は、「macOSインストーラー」
  • Windowsの場合は、「Windowsインストーラー」
Node.js公式サイト ダウンロードページ

ページ上部にバージョン(2025年8月時点の推奨版は「v22.18.0(LTS)」)の選択肢がありますが、その時点のバージョンをダウンロード頂ければ問題ありません。尚、最新版(Currentの付いたバージョン)は最新機能が使用できる反面、動作が安定しないことがありますので、特別な理由がない限りは推奨版を使用するようにしてください。

インストーラのダウンロードが終わったらダブルクリックで起動し、指示の通りインストールを行ってください。

インストール後、コマンドを実行できるアプリを起動し、Node.jsおよびnpmが使用できるようになっていることを確認します。

  • macOSの場合は、「ターミナル」アプリ
  • Windowsの場合は「PowerShell」または「コマンドプロンプト」

以下のコマンドを実行し、結果を確認します。

node -v
npm -v

実行結果に自分のインストールしたバージョンが表示されれば、使用する準備ができてきます。コマンドが実行できない場合はOSを再起動して再度試すようにしてください。

Gemini CLIの導入

Geimini CLIはコマンドから簡単に実行できます。Windowsの場合はコマンドプロンプト、macOSの場合はターミナルから下記のコマンドを実行しましょう。

npx https://github.com/google-gemini/gemini-cli

実行すると認証方法を聞かれますので、「1. Login with Google」を選びましょう。

Gemini CLIの認証画面

ブラウザが開かれるのでGoogleアカウントでログインし、下記のように承認して進めていきましょう。

Gemini CLIのGoogle認証画面

コマンドの画面に戻ると、指示が入力できるようになります。

Gemini CLIの入力画面

Gemini CLIの機能

指示内容の入力

Gemini CLIに指示を送る方法は次の2種類があります。

  • 対話モード
    • geminiで実行して、画面上の案内に沿って進めていく方式。
  • 非対話モード
    • gemini -p "指示内容"で逐次実行する方式。
    • スクリプトに組み込むことが可能。

コマンドによる操作

自然言語による文章の他に、コマンドによる特定の操作を行えます。

ファイルの入力

@に続けてファイルパスを記述することで、画像や動画、音声を入力できます。例えば、以下のように指示と画像を併せて入力することができます。

この画像に載っている表をHTMLとCSSで作成してください @page.png

今回は以下のWijmoのFlexGridで作成した表の画像を読み込ませます。

作成させたいWebページのキャプチャ画像
ファイルの入力

出力結果として、カレントディレクトリにindex.htmlstyle.cssが作成され、ブラウザで開くと次の画面が表示されます。

作成されたHTMLを表示したブラウザ画面

statsコマンド

/statsを実行すると、Gemini CLIの使用状況の詳細を見ることができます。

Gemini CLIの使用状況

clearコマンド

/clearコマンドを実行すると、それまでにやり取りした会話履歴やコンテキストを消去できます。

quitコマンド

/quitを実行すると、対話モードを終了できます。

その他、利用可能なコマンドは以下より確認可能です。

さいごに

Gemini CLIはGoogle製の優秀なAIエージェントで、コーディングに限らずビジネスにおける壁打ちや調査、情報整理に活用できるコマンドラインツールです。コマンドによる単独での実行が可能なため、スクリプトに組み込んで業務の自動化にも活用できますので、興味のある方は是非お試しください。

メシウスでは様々なWebアプリケーションフレームワークと一緒に使えるJavaScriptライブラリを提供しています。

メシウスのJavaScriptライブラリ

無償のトライアル版や、ブラウザ上で手軽に試せるデモアプリケーションも公開しているので、こちらも是非ご覧ください。

\  この記事をシェアする  /