Hướng Dẫn Toàn Diện Gemini CLI: Khai Thác Trợ Lý AI Của Google Ngay Tại Dòng Lệnh

Bạn có bao giờ ước mơ một trợ lý AI có thể hoạt động ngay trong cửa sổ terminal của mình không? Giấc mơ đó đã thành hiện thực! Google vừa ra mắt [Gemini CLI](https://blog.google/technology/developers/introducing-gemini-cli-open-source-ai-agent/), một công cụ dòng lệnh mã nguồn mở mạnh mẽ. Trong bài hướng dẫn chi tiết này, chúng ta sẽ cùng khám phá mọi thứ bạn cần biết về Gemini CLI, từ cách cài đặt, sử dụng các tính năng tích hợp, cho đến những mẹo nâng cao và thông tin về chi phí. Hãy cùng bắt đầu để khai thác tối đa sức mạnh của AI trong công việc hàng ngày của bạn!

Gemini CLI Là Gì?

Gemini CLI là một tác nhân AI mã nguồn mở hoàn toàn miễn phí, được thiết kế để hoạt động trực tiếp trong giao diện dòng lệnh (terminal) của bạn. Công cụ mạnh mẽ này mang các mô hình Gemini tiên tiến của Google đến thẳng môi trường phát triển của bạn, cho phép bạn tương tác bằng ngôn ngữ tự nhiên để hoàn thành nhiều tác vụ khác nhau. Với Gemini CLI, bạn có thể:

* **Viết và giải thích mã**: Yêu cầu AI tạo đoạn mã hoặc giải thích logic của các dòng code hiện có.
* **Chỉnh sửa tệp**: Thực hiện các thay đổi trực tiếp vào tệp thông qua tương tác AI.
* **Giải thích lỗi**: Cung cấp các thông báo lỗi và nhận giải thích chi tiết cùng với gợi ý khắc phục.
* **Chạy lệnh shell**: Thực thi các lệnh hệ thống mà không cần rời khỏi giao diện AI.
* Và nhiều hơn thế nữa!

Bạn sẽ không còn phải liên tục chuyển đổi giữa ứng dụng web và terminal. Điều tuyệt vời nhất là Gemini CLI hoàn toàn **miễn phí** và không yêu cầu thiết lập phức tạp, giúp bạn bắt đầu ngay lập tức.

Bắt Đầu Với Gemini CLI

Việc cài đặt và chạy Gemini CLI khá đơn giản. Hãy cùng đi qua từng bước một.

Bước 1: Cài Đặt Gemini CLI Trên Linux (Và Các Hệ Điều Hành Khác)

Bạn có thể cài đặt **Gemini CLI** trên **Linux**, **Mac**, và **Windows**. Tất cả các bước thiết lập sẽ được thực hiện trong terminal. Mặc dù ví dụ này sử dụng Linux, nhưng các lệnh cho Mac và Windows cũng tương tự, bạn có thể dễ dàng làm theo.

Trước khi bắt đầu, hãy đảm bảo bạn đã cài đặt Node.js phiên bản 18 trở lên. Bạn có thể kiểm tra phiên bản Node.js hiện tại bằng lệnh:

bash
node -v
“`

Nếu bạn chưa có Node.js hoặc phiên bản cũ hơn, hãy sử dụng lệnh sau để cài đặt (đối với Linux/Ubuntu):

“`bash
sudo apt update && sudo apt install nodejs npm
“`

Sau khi Node.js đã sẵn sàng, bạn có thể cài đặt Gemini CLI toàn cục bằng lệnh:

“`bash
npm install -g @google/gemini-cli
“`

Nếu bạn không muốn cài đặt toàn cục, bạn cũng có thể sử dụng `npx` để chạy trực tiếp từ kho GitHub:

“`bash
npx https://github.com/google-gemini/gemini-cli
“`

Bước 2: Chạy Và Đăng Nhập

Sau khi cài đặt xong, chỉ cần gõ:

“`bash
gemini
“`

Lần đầu chạy, bạn sẽ cần đăng nhập bằng tài khoản Google cá nhân của mình. Quá trình này sẽ ủy quyền cho Gemini CLI truy cập dịch vụ Gemini.

Việc này sẽ cấp cho bạn quyền truy cập vào giấy phép Gemini Code Assist miễn phí, bao gồm:

* Quyền truy cập vào mô hình **Gemini 2.5 Pro** mạnh mẽ.
* Cửa sổ ngữ cảnh (context window) lên tới **1 triệu token**, cho phép xử lý lượng lớn thông tin.
* Giới hạn **60 yêu cầu mỗi phút**.
* **1.000 yêu cầu mô hình mỗi ngày** mà không mất phí.

Nếu muốn có sự linh hoạt hơn hoặc vượt quá giới hạn miễn phí, bạn cũng có thể sử dụng khóa API từ [Google AI Studio](https://proflead.dev/posts/google-ai-studio-tutorial/).

Bước 3: Thử Nghiệm Gemini CLI

Giờ đây, bạn đã sẵn sàng bắt đầu đặt câu hỏi và giao nhiệm vụ cho trợ lý AI của mình. Bạn có thể yêu cầu tác nhân AI tạo dự án, sửa lỗi, giải thích mã trong các tệp cụ thể, v.v.

**Lưu ý quan trọng:** Hãy đảm bảo bạn chạy tác nhân AI trong thư mục dự án của mình để nó có thể truy cập và tương tác với các tệp liên quan.

Ví dụ: Để hỏi về một tệp cụ thể:

“`
> What does the file index.js do?
“`

Gemini CLI sẽ đọc, phân tích tệp và đưa ra lời giải thích rõ ràng.

Để yêu cầu chỉnh sửa:

“`
> Add error handling to index.js
“`

Bạn cũng có thể chạy trực tiếp các lệnh shell bằng cách thêm tiền tố `!`, ví dụ:

“`
!ls -al
“`

Tạo Một Ứng Dụng To-Do Đơn Giản Với Gemini CLI

Sau khi đã thiết lập xong, hãy thử yêu cầu AI tạo một ứng dụng to-do đơn giản bằng HTML, CSS và JavaScript. Chỉ cần gõ “create a simple to-do app using simple js and html” vào Gemini CLI.

Để xem quy trình từng bước và kết quả, bạn có thể tham khảo video hướng dẫn chi tiết trên YouTube: [Gemini CLI: Complete Tutorial](https://youtu.be/Gm8XjcNQ1Vk?si=PZjKI6pmjuEXb_yT). Video này sẽ cung cấp một cái nhìn trực quan về cách Gemini CLI tương tác để tạo ra dự án.

Sử Dụng Các Công Cụ Tích Hợp (Built-in Tools)

Gemini CLI đi kèm với một số công cụ tích hợp rất tiện lợi, giúp AI tương tác sâu hơn với môi trường của bạn. Bạn có thể sử dụng lệnh `/tools` để xem tất cả các công cụ khả dụng.

Tổng Quan Về Các Công Cụ Gemini CLI

Dưới đây là danh sách các công cụ chính và chức năng của chúng:

* **ReadFolder** (`ls`): Liệt kê các tệp và thư mục trong một thư mục, tương tự như lệnh `ls` của shell.
* **ReadFile** (`read-file`): Đọc toàn bộ nội dung của một tệp duy nhất, hữu ích cho việc tóm tắt hoặc phân tích.
* **ReadManyFiles** (`read-many-files`): Đọc nhiều tệp cùng lúc, thường khớp với một mẫu glob (ví dụ: tất cả các tệp `.js`).
* **FindFiles** (`glob`): Tìm kiếm các tệp theo mẫu (ví dụ: tìm tất cả `config.json` trong dự án của bạn).
* **SearchText** (`grep`): Tìm kiếm văn bản bên trong các tệp, như tìm tất cả các bình luận `TODO`.
* **Edit** (`edit`): Áp dụng các thay đổi mã thông qua diff. Gemini sẽ xem trước các chỉnh sửa và yêu cầu bạn chấp thuận trước khi áp dụng.
* **WriteFile** (`write-file`): Tạo tệp mới (ví dụ: `README.md`) với nội dung do người dùng cung cấp.
* **Shell** (`shell`): Chạy các lệnh bạn tiền tố với `!` (ví dụ: `!npm test`) trực tiếp trong terminal.
* **WebFetch** (`web-fetch`): Lấy nội dung từ web (HTML hoặc JSON), cho phép Gemini phân tích dữ liệu bên ngoài.
* **GoogleSearch** (`web-search`): Thực hiện tìm kiếm trên Google để đưa ra các phản hồi dựa trên thông tin thực tế (ví dụ: giải thích cho một lỗi).
* **Save Memory** (`memoryTool`): Lưu trữ các sự kiện hoặc sở thích trong một phiên làm việc (ví dụ: “Tôi thích async/await”) để cải thiện tính nhất quán trong phản hồi.

Tính Năng Nâng Cao: Tùy Chỉnh Với GEMINI.md

Bạn có thể thêm các chỉ dẫn cụ thể cho AI đối với một dự án cụ thể bằng cách tạo tệp **GEMINI.md** trong thư mục gốc của dự án. Trong tệp này, bạn có thể định nghĩa các quy tắc dự án, kiểu mã hóa (code style), và các công cụ mà tác nhân AI nên sử dụng. Điều này đảm bảo rằng mã được tạo ra nhất quán với các tiêu chuẩn của dự án của bạn, giúp duy trì chất lượng và cấu trúc mã.

Mở Rộng Khả Năng Với Tích Hợp MCP (Model Context Protocol)

Đối với hầu hết các trường hợp sử dụng hàng ngày, các công cụ tích hợp sẵn sẽ là đủ. Nhưng điều gì sẽ xảy ra nếu bạn muốn Gemini CLI thực hiện một điều gì đó rất chuyên biệt, như tương tác với các API cụ thể hoặc sử dụng một mô hình chuyên dụng (ví dụ: công cụ tạo ảnh hoặc công cụ phân tích bảo mật)? Đây chính là lúc **MCP (Model Context Protocol)** phát huy tác dụng.

MCP về cơ bản là một tiêu chuẩn mở cho phép các nhà phát triển **thêm các công cụ/khả năng mới vào AI bằng cách chạy một máy chủ** mà CLI có thể giao tiếp. Trong Gemini CLI, bạn có thể cấu hình “máy chủ MCP” trong một tệp cài đặt JSON, và CLI sẽ coi đó là các công cụ bổ sung mà nó có thể sử dụng.

Cách Thiết Lập Máy Chủ MCP Trong Gemini CLI

Để minh họa, tôi sẽ hướng dẫn bạn cách thiết lập **máy chủ MCP GitHub trong Gemini CLI**.

Trong thư mục dự án của bạn, hãy tạo một thư mục và một tệp cài đặt bằng lệnh:

“`bash
mkdir -p .gemini && touch .gemini/settings.json
“`

Sau đó, thêm đoạn mã sau vào tệp `.gemini/settings.json` vừa tạo:

“`json
{
“mcpServers”: {
“github”: {
“command”: “npx”,
“args”: [“-y”, “@modelcontextprotocol/server-github”],
“env”: { “GITHUB_PERSONAL_ACCESS_TOKEN”: “[YOUR-TOKEN]” }
}
}
}
“`

Hãy nhớ thay thế `[YOUR-TOKEN]` bằng Personal Access Token của GitHub của bạn.

Sau khi lưu tệp, hãy thoát (`/quit`) khỏi Gemini CLI và khởi động lại.

Gõ lệnh `/mcp`, và bạn sẽ thấy danh sách các công cụ **GitHub** mới có sẵn.

Giờ đây, tác nhân AI của bạn đã có thể tương tác với GitHub một cách dễ dàng!

Chi Phí Sử Dụng Gemini CLI

Gemini CLI cung cấp các tùy chọn sử dụng linh hoạt, phù hợp với nhiều nhu cầu khác nhau.

**Bậc dùng thử miễn phí (Free Preview Tier)**

* **Chi phí**: Miễn phí với tài khoản Google cá nhân.
* **Giới hạn**: Lên đến **60 yêu cầu/phút** và **1.000 yêu cầu/ngày**.
* Lý tưởng cho các nhà phát triển cá nhân và sử dụng quy mô nhỏ.

**Sử dụng trả phí / Khóa API (Paid / API Key Usage)**

* Sử dụng **khóa API Gemini** của riêng bạn để có giới hạn sử dụng cao hơn.
* Tính phí dựa trên số lượng token tiêu thụ (phụ thuộc vào mô hình và mức độ sử dụng).

**Tùy chọn dành cho doanh nghiệp (Enterprise Options)**

* Có sẵn thông qua các gói **Gemini Code Assist Standard hoặc Enterprise**.
* Bao gồm các tính năng nâng cao như quản trị, nhật ký kiểm toán và hạn mức dùng chung.

Kết Luận

Như bạn có thể thấy, Gemini CLI là một công cụ thực sự mạnh mẽ với nhiều tiềm năng to lớn. Khả năng tích hợp AI trực tiếp vào dòng lệnh mang lại sự tiện lợi và tăng cường năng suất đáng kể cho các nhà phát triển.

Nếu bạn thường xuyên viết mã, gỡ lỗi hoặc quản lý tệp, công cụ này chắc chắn rất đáng để khám phá. Nó có thể trở thành một phần không thể thiếu trong quy trình làm việc hàng ngày của bạn.

Nếu bạn có bất kỳ phản hồi hoặc câu hỏi nào, đừng ngần ngại chia sẻ trong phần bình luận bên dưới.

Chúc bạn thành công!

Nguồn tham khảo: [https://proflead.dev/posts/gemini-cli-tutorial/](https://proflead.dev/posts/gemini-cli-tutorial/)

Chỉ mục