Gemini CLI
作成日時:2025-07-21
更新日時:2025-07-22
Gemini CLIを試したときのメモ。
資料
- google-gemini/gemini-cli: An open-source AI agent that brings the power of Gemini directly into your terminal.
- gemini-cli/docs/index.md at main · google-gemini/gemini-cli
環境構築
念のためにコンテナー上に構築する。
勝手にデータを消されてもいいように、Git管理もする。
※後述の/restore
コマンドで復元できるかもしれない。
下記の構築手順は前提としてWindows11、WSL2導入済みとする。
Dockerインストール
下記参照。
個人利用ならDocker Desktopでもいい。
docker-compose.yml
最小構成。
ボリュームマウントでデータを永続化する。
services:
gemini:
image: node:latest # Node.js v20以降があれば何でもいい
environment:
TZ: Asia/Tokyo
volumes:
- .:/home # 任意のパス
stdin_open: true
tty: true
Dockerコマンド
# 起動
docker compose up -d
# プロセス確認
docker ps -a
# ログ確認
docker compose logs gemini
# コンテナーに入る
docker compose exec gemini bash
# 停止
docker compose stop
Gemini CLIインストール
コンテナーに入って下記を実施。
# インストール
npm install -g @google/gemini-cli
# 1回目
# 見た目に関する設定
# テーマを決めたら再度geminiを起動する旨のメッセージが表示される。
# テーマは後で`/theme`コマンドを使用して変更可能
gemini
# 2回目
# 認証に関する設定
# 自身にあった認証方式を選択
# 「1. Login with Google」を選んだ場合、URLが表示されるのでそこに遷移
# googleの認証を行うと、トークンが表示されるのでそれをCLIに入力
gemini
コンテキストファイル
gemini-cli/docs/cli/configuration.md at main · google-gemini/gemini-cli
Geminiに渡すコンテキストが記載されたファイル。
自動的にファイル名が「GEMINI.md」のファイルを探索して読み込んでくれる。
読み込まれない場合は/memory add
などで明示的に指定。
これを利用してプロジェクトごとにルールを切り替えたりする。
→コンテキストエンジニアリングにおける「分離」
/memory show
で何が読み込まれているかを確認できる。/memory refreash
でコンテキストファイルを再読み込み。
YOLOモード
エージェントがユーザーの同意を得ずに行動するモード。
基本的に、ファイル操作など何らかのツールを使用する操作を行う場合、
エージェントはユーザーに実行していいかの同意を得るが、それを省く。
Geminiの起動時に、--yolo
をつけるとyoloモードになる。
または、Gemini実行中にctrl + y
で切り替え。
You Only Live Once。
元々は「人生は一度きり」という意味のスラング。
CLIの文脈では「ユーザーへの確認を省略してツールを即時実行する」という挙動を指す。
コマンド
gemini-cli/docs/cli/commands.md
- シェルコマンドを叩きたければ、
!
でシェルモードに切り替える。 - ディレクトリは
gemini
コマンドを実行したディレクトリに固定される。- シェルモードで
cd
しても警告が出ただけで、カレントディレクトリは変わらなかった。
- シェルモードで
/compress
はチャットのコンテキストを圧縮する。参考:Context Engineering/restore
はツール実行直前の状態に復元する。間違えてファイルを消されたりした場合。- ただしチェックポイントが有効である場合に限る。
@コマンド
@ファイル名
や@ディレクトリ名
でファイルやディレクトリの指定
シェル実行
シェルに書ける。
#!/bin/sh
gemini --prompt "何らかのプロンプト"
CLI設定
gemini-cli/docs/cli/configuration.md at main · google-gemini/gemini-cli
個人的な使用スタイル
一括生成的なAgenticなものは、コンテナーを立ち上げてGemini CLI。
ソースの修正、技術記事の添削、簡単な質問はVS CodeのGemini Code Assist。
素早い回答が欲しいとき、壁打ち、技術調査やローカルのリソースを参照する必要性が無いもの全般は、ブラウザのGemini。
設計書をMarkdownで書く
Agentic CodingでAIに読み込ませる設計書をMarkdownで書きていたら、Gemini Code Assistが良き感じに補完してくれる。