- Chế độ Lập kế hoạch cung cấp một môi trường có cấu trúc, chỉ đọc để nghiên cứu, thiết kế và soạn thảo các kế hoạch triển khai trước khi sửa đổi bất kỳ mã nào.
- Chế độ này được điều khiển bởi một công cụ chính sách linh hoạt, các kỹ năng của tác nhân và các điểm kết nối, cho phép tùy chỉnh sâu các quy tắc an toàn, quyền truy cập công cụ và quy trình lưu trữ.
- Gemini tự động định tuyến các mô hình Pro có khả năng suy luận cao để lập kế hoạch và các mô hình Flash nhanh để thực thi, tối ưu hóa chất lượng và hiệu suất trong suốt các giai đoạn.
- Chế độ Lập kế hoạch tích hợp với điều khiển tương tác, quy trình không tương tác và các tiện ích mở rộng như Conductor để hỗ trợ mọi thứ, từ các tác vụ nhanh đến các dự án phức tạp, nhiều bước.
Chế độ Lập kế hoạch trong Gemini CLI về cơ bản là một môi trường an toàn, chỉ đọc, nơi bạn có thể suy nghĩ kỹ về những thay đổi phức tạp trước khi chạm vào bất kỳ dòng mã nào. Thay vì bắt tay ngay vào chỉnh sửa, bạn và người đại diện sẽ cùng nhau thực hiện nghiên cứu, thiết kế và lập kế hoạch, trong đó Gemini sẽ rà soát mã nguồn, công cụ và tài liệu của bạn, đồng thời bảo vệ dự án khỏi những thay đổi ngoài ý muốn.
Chế độ này được thiết kế dành cho các nhà phát triển muốn có cấu trúc, sự an toàn và sự rõ ràng trước khi bắt đầu triển khai, mà không làm giảm tốc độ hoặc tính linh hoạt. Bạn có thể sử dụng nó để lập kế hoạch di chuyển cơ sở dữ liệu, thêm tính năng mới, tái cấu trúc mã hoặc kiểm toán, tất cả đều tận dụng các mô hình suy luận cao cấp, chính sách tùy chỉnh, kỹ năng của tác nhân và thậm chí cả quy trình làm việc không giao diện người dùng trong CI/CD. Hãy coi nó như một môi trường thử nghiệm lập kế hoạch, nơi mọi thứ đều được cân nhắc kỹ lưỡng và có thể theo dõi được.
Chế độ Plan Mode trong Gemini CLI là gì?
Chế độ Plan Mode là chế độ hoạt động chỉ đọc trong Gemini CLI, giới hạn tác nhân chỉ được sử dụng một tập hợp các công cụ an toàn nhất định. Trong quá trình hoạt động, Gemini có thể khám phá kho lưu trữ của bạn, kiểm tra tệp, tìm kiếm các mẫu và đọc tài liệu, nhưng nó không thể thay đổi các tệp dự án của bạn hoặc chạy các lệnh tùy ý có thể làm thay đổi trạng thái. Các tệp duy nhất mà nó được phép ghi là các thành phần nội bộ của kế hoạch dự án.
Ý tưởng chính đằng sau Chế độ Lập kế hoạch là tách biệt tư duy khỏi hành động. Đầu tiên, Gemini tập trung vào việc hiểu yêu cầu của bạn, phân tích mã nguồn, các phụ thuộc và môi trường, sau đó lập một kế hoạch chi tiết. Chỉ sau khi bạn chấp thuận kế hoạch đó một cách rõ ràng, giao diện dòng lệnh (CLI) mới chuyển sang chế độ chỉnh sửa hoặc thực thi để thực hiện các thay đổi.
Chế độ Lập kế hoạch được bật mặc định cho người dùng mới của Gemini CLI, điều này có nghĩa là hầu hết các quy trình làm việc đều bắt đầu với tư duy ưu tiên nghiên cứu. Bạn luôn có thể tắt hoặc xóa nó khỏi quy trình làm việc của mình, nhưng hành vi mặc định là coi lập kế hoạch là một giai đoạn quan trọng hàng đầu, đặc biệt đối với những thay đổi lớn hoặc rủi ro cao.
Chế độ này cũng được tích hợp chặt chẽ với các tính năng khác của Gemini như Kỹ năng tác nhân, công cụ chính sách, công cụ MCP và điều khiển mô hình. Điều này biến nó không chỉ thành một cơ chế an toàn mà còn là một môi trường mạnh mẽ để xây dựng các giải pháp vững chắc và hợp lý.
Cách bật và vào Chế độ Lập kế hoạch
Chế độ Lập kế hoạch thường được bật mặc định, nhưng bạn có thể kiểm soát cách thức và thời điểm Gemini CLI khởi động ở chế độ này. Có nhiều cách để cấu hình hoặc vào Chế độ Lập kế hoạch tùy thuộc vào việc bạn muốn sử dụng nó làm hành vi mặc định hay chỉ cho các phiên cụ thể.
Nếu bạn muốn Gemini CLI luôn khởi động ở Chế độ Lập kế hoạch, bạn có thể điều chỉnh cài đặt của mình ngay trong CLI. Chạy / settings Trong lệnh, tìm tùy chọn có tên “Default Approval Mode” và đặt nó thành Kế hoạchTừ thời điểm đó trở đi, mỗi phiên họp mới sẽ bắt đầu trong môi trường lập kế hoạch chỉ đọc này.
Đối với các phiên làm việc riêng lẻ mà bạn muốn khởi động trực tiếp vào Chế độ Lập kế hoạch, bạn có thể sử dụng cờ dòng lệnh. Khởi động giao diện dòng lệnh (CLI) bằng gemini –approval-mode=plan và tác nhân sẽ ngay lập tức hoạt động theo các hạn chế của Chế độ Kế hoạch mà không cần bạn phải thao tác tương tác.
Khi bạn đã ở trong giao diện dòng lệnh Gemini CLI, có nhiều cách để chuyển sang Chế độ Lập kế hoạch một cách nhanh chóng. Bạn có thể nhấn Shift + Tab Để chuyển đổi giữa các chế độ phê duyệt có sẵn (Mặc định → Tự động chỉnh sửa → Lập kế hoạch), hãy sử dụng nút này. /kế hoạch ra lệnh, hoặc đơn giản là yêu cầu bằng ngôn ngữ tự nhiên để tác nhân “bắt đầu lập kế hoạch cho…” một mục tiêu nhất định. Ẩn sau đó, Gemini kích hoạt enter_plan_mode Công cụ để thay đổi chế độ.
Lệnh /plan cũng cho phép bạn cung cấp mục tiêu ngay trong dòng lệnh, điều này rất tiện lợi khi bạn muốn vừa chuyển đổi chế độ vừa bắt đầu lập kế hoạch ngay lập tức. Ví dụ, gõ /kế hoạch triển khai xác thực Công cụ này đưa Gemini vào Chế độ Lập kế hoạch và ngay lập tức gửi yêu cầu của bạn về thiết kế xác thực, khởi động quá trình nghiên cứu và phân tích ngay lập tức.
Quy trình làm việc cốt lõi: nghiên cứu, thiết kế, soạn thảo, phê duyệt
Chế độ Lập kế hoạch (Plan Mode) cấu trúc công việc của bạn thành một quy trình đơn giản nhưng hiệu quả: xác định mục tiêu, nghiên cứu, thiết kế, lập kế hoạch, sau đó phê duyệt hoặc điều chỉnh. Mỗi giai đoạn được tách biệt một cách có chủ đích để bạn có thể kiểm soát mọi việc và tránh những chỉnh sửa ngoài ý muốn hoặc các hành động rủi ro.
Đầu tiên, bạn cần đưa ra một mục tiêu rõ ràng. Bạn có thể nói "lập kế hoạch cho một dịch vụ thông báo mới sử dụng Redis" hoặc "nghiên cứu cách di chuyển cơ sở dữ liệu này". Gemini sử dụng mục tiêu đó để chuyển sang Chế độ Lập kế hoạch (nếu chưa được kích hoạt) và bắt đầu khám phá các phần liên quan trong mã nguồn, cơ sở hạ tầng và tài liệu của bạn theo cách chỉ đọc.
Trong giai đoạn nghiên cứu, Gemini sử dụng các công cụ như liệt kê tập tin, tìm kiếm ký tự đại diện, tìm kiếm kiểu grep và các khả năng chỉ đọc khác để xây dựng bản đồ tư duy về hệ thống của bạn. Trong một số trường hợp, nó có thể dựa vào các tác nhân phụ chuyên biệt như... nhà điều tra mã nguồn Hoặc kích hoạt các Kỹ năng của Agent được tùy chỉnh cho các lĩnh vực cụ thể để hiểu rõ hơn về các mối quan hệ phụ thuộc và kiến trúc hệ thống.
Khi người đại diện đã thu thập đủ thông tin ngữ cảnh, họ sẽ chuyển sang giai đoạn thiết kế và thảo luận. Tại đây, Gemini đề xuất các chiến lược, chỉ ra những sự đánh đổi và có thể đặt cho bạn những câu hỏi làm rõ bằng cách sử dụng... hỏi người dùng công cụ. Sự trao đổi qua lại này giúp đảm bảo phương pháp được chọn phù hợp với sở thích, hạn chế và các quy ước hiện có của bạn.
Sau khi bạn thống nhất hướng đi bằng lời nói, Gemini sẽ soạn thảo một kế hoạch thực hiện chính thức dưới dạng tệp Markdown được lưu trữ trong thư mục kế hoạch dành riêng của bạn. Tài liệu này được mô tả chi tiết và có cấu trúc: nó liệt kê các nhiệm vụ, các bước, các mối liên hệ phụ thuộc, các rủi ro tiềm ẩn và đôi khi cả các phương án thay thế. Bạn có thể đọc, chỉnh sửa hoặc ghi chú vào tài liệu này trước khi thực hiện bất kỳ thao tác nào.
Bước cuối cùng trong quy trình là sự chấp thuận rõ ràng. Gemini CLI sẽ trình bày kế hoạch và đưa ra các tùy chọn như “Có, tự động chấp nhận chỉnh sửa” hoặc “Có, chấp nhận chỉnh sửa thủ công” để bắt đầu triển khai. Nếu cảm thấy có gì không ổn, bạn có thể phản hồi, tự chỉnh sửa tệp kế hoạch hoặc đơn giản là hủy kế hoạch. Esc và thử một cách tiếp cận khác.
Hợp tác xây dựng kế hoạch: thảo luận, chỉnh sửa và nhận xét
Một trong những ưu điểm nổi bật của Chế độ Lập kế hoạch là nó coi kế hoạch như một tài liệu chung mà bạn và Gemini có thể cùng chỉnh sửa. Sự hợp tác này có thể chính xác và nhanh chóng hơn so với việc mô tả những thay đổi phức tạp chỉ bằng ngôn ngữ tự nhiên.
Khi Gemini hoàn thành bản nháp và trình bày kế hoạch để xem xét, bạn có thể mở trực tiếp bản nháp đó trong trình soạn thảo bên ngoài mà bạn ưa thích. Ấn Bản Ctrl + X Từ bên trong giao diện dòng lệnh (CLI), tệp Markdown sẽ được mở trong VS Code, Vim hoặc bất kỳ trình soạn thảo nào bạn đã cấu hình. Không cần phải tìm kiếm tệp thủ công.
Bên trong trình chỉnh sửa, bạn có thể sửa đổi kế hoạch theo bất kỳ cách nào bạn muốn. Bạn có thể sắp xếp lại các bước để phù hợp hơn với quy trình triển khai của mình, viết lại một số hành động cho rõ ràng hơn, loại bỏ các tác vụ mà bạn cho là không cần thiết hoặc mở rộng các phần cần chi tiết hơn. Bạn cũng có thể thêm các nhận xét nội tuyến như “Chúng ta có nên sử dụng lại lớp Logger hiện có ở đây không?” hoặc “Hãy xác minh điều này so với các SLO hiện tại.”
Sau khi bạn lưu và đóng trình chỉnh sửa, Gemini CLI sẽ tự động phát hiện các thay đổi và nhận xét của bạn. Hệ thống sẽ phân tích tài liệu đã cập nhật, kết hợp phản hồi của bạn và tinh chỉnh sự hiểu biết nội bộ về chiến lược. Sau đó, hệ thống sẽ tạo lại một phiên bản hoàn chỉnh của kế hoạch để bạn xem xét lại.
Chu trình chỉnh sửa → hoàn thiện → xem xét này có thể lặp lại nhiều lần cho đến khi bạn hài lòng với kế hoạch. Khi bạn đã sẵn sàng, bạn sẽ đưa ra sự chấp thuận rõ ràng, và chỉ khi đó Gemini mới thoát khỏi Chế độ Lập kế hoạch để bắt đầu chỉnh sửa thực tế hoặc ra lệnh thực thi dựa trên các bước đã được thống nhất.
Thoát khỏi Chế độ Lập kế hoạch và chuyển đổi chế độ phê duyệt
Bạn có thể thoát khỏi Chế độ Lập kế hoạch bất cứ lúc nào, cho dù bạn đã hoàn tất việc lập kế hoạch hay chỉ đơn giản là muốn chuyển sang chế độ phê duyệt khác. Không có yêu cầu nào về việc phải hoàn thiện hoặc phê duyệt kế hoạch trước khi rời khỏi môi trường này.
Cách phổ biến nhất để Chế độ Lập kế hoạch kết thúc là khi bạn phê duyệt một kế hoạch đã hoàn thiện. Ngay khi bạn xác nhận rằng Gemini nên bắt đầu triển khai, CLI sẽ tự động thoát khỏi Chế độ Lập kế hoạch và chuyển sang chế độ cho phép nhiều quyền hơn, nơi cho phép chỉnh sửa và gọi công cụ làm thay đổi trạng thái, theo cài đặt phê duyệt của bạn.
Nếu bạn chỉ muốn chuyển sang chế độ khác mà không cần phê duyệt bất cứ điều gì, bạn có thể sử dụng phím tắt tương tự như khi vào Chế độ Lập kế hoạch. Ấn Bản Shift + Tab Bạn có thể chuyển đổi giữa chế độ Lập kế hoạch, Chế độ mặc định hoặc Tự động chỉnh sửa, tùy thuộc vào sở thích của bạn trong quá trình phát triển sản phẩm.
Các lệnh bằng ngôn ngữ tự nhiên cũng hoạt động cho việc chuyển đổi chế độ. Bạn có thể nhập các cụm từ như “thoát chế độ lập kế hoạch” hoặc “dừng lập kế hoạch” và Gemini sẽ gọi công cụ chuyển đổi chế độ tương ứng để khôi phục hành vi trước đó của bạn. Điều này giúp bạn dễ dàng chuyển đổi giữa các ngữ cảnh lập kế hoạch khi quy trình làm việc của bạn phát triển.
Mô hình an toàn và các công cụ được phép sử dụng trong Chế độ Lập kế hoạch
Về mặt kỹ thuật, Chế độ Lập kế hoạch được thực thi bởi các chính sách an toàn nghiêm ngặt, đảm bảo dự án của bạn luôn ở trạng thái chỉ đọc trong suốt quá trình lập kế hoạch. Chế độ này được hỗ trợ bởi công cụ chính sách Gemini CLI và một tệp cấu hình chuyên dụng có tên là plan.toml, trong đó quy định những công cụ nào được phép sử dụng và cách chúng hoạt động.
Chính sách tích hợp sẵn cho Chế độ Lập kế hoạch được coi là chính sách cấp 1 và luôn tập trung vào việc ngăn chặn các thao tác ghi hoặc phá hoại. Theo mặc định, chỉ những công cụ vốn dĩ an toàn—như đọc, tìm kiếm hoặc liệt kê tập tin—mới được cho phép. Bất cứ thứ gì có thể sửa đổi tập tin, chạy lệnh hoặc thay đổi hệ thống bên ngoài đều bị chặn trừ khi bạn chủ động ghi đè các quy tắc.
Công cụ quản lý chính sách coi các quy tắc không chỉ định chế độ là có hiệu lực toàn cục, nghĩa là chúng cũng sẽ được áp dụng trong Chế độ Lập kế hoạch. Nếu bạn muốn một quy tắc chỉ áp dụng trong các chế độ khác và không áp dụng trong Chế độ Lập kế hoạch, bạn phải liệt kê rõ ràng các chế độ mục tiêu trong quy tắc đó. Ví dụ: nếu bạn muốn kiểm tra npm Để cho phép sử dụng ở chế độ Mặc định và Tự động chỉnh sửa nhưng không bao giờ được phép ở chế độ Lập kế hoạch, bạn cần cấu hình nó với một danh sách các chế độ loại trừ chế độ Lập kế hoạch.
Một tính năng an toàn quan trọng khác là cách thức xác định phạm vi phê duyệt công cụ lâu dài. Các phê duyệt được cấp ở các chế độ dễ dãi hơn (như Mặc định hoặc Tự động chỉnh sửa) không tự động được áp dụng sang Chế độ Lập kế hoạch. Điều này ngăn chặn các công cụ mà bạn tin tưởng để triển khai chạy ngầm trong khi bạn vẫn đang trong giai đoạn nghiên cứu. Tuy nhiên, các phê duyệt được đưa ra trong Chế độ Lập kế hoạch được coi là có chủ đích và có thể được áp dụng chung cho các chế độ khác sau đó.
Nhìn chung, Chế độ Kế hoạch (Plan Mode) được bảo mật theo mặc định nhưng vẫn có khả năng tùy chỉnh cao. Bạn có thể tùy chỉnh các công cụ có sẵn, cách thức phê duyệt chúng và loại hook hoặc nhật ký nào bạn muốn sử dụng xung quanh quá trình tạo kế hoạch và chuyển đổi thực thi.
Chính sách tùy chỉnh, công cụ MCP và các hook
Ngoài các chính sách Cấp 1 được tích hợp sẵn, bạn có thể tiếp tục điều chỉnh Chế độ Lập kế hoạch cho phù hợp với quy trình làm việc của tổ chức hoặc cá nhân bằng cách thêm các tệp chính sách riêng của mình. Chúng sống ở ~/.gemini/policies/ thư mục và được coi là Cấp 2, vì vậy chúng có thể tinh chỉnh hoặc mở rộng hành vi mặc định được định nghĩa trong plan.toml.
Một trường hợp sử dụng phổ biến là kiểm soát cách các công cụ Giao thức Ngữ cảnh Mô hình (MCP) chỉ đọc hoạt động trong Chế độ Lập kế hoạch. Theo mặc định, Gemini có thể yêu cầu người dùng xác nhận trước khi sử dụng các công cụ này, ngay cả khi chúng không gây ảnh hưởng đến dữ liệu gốc. chú thích công cụ và mcpName Với ký tự đại diện, bạn có thể xác định các mẫu hoặc bộ công cụ cụ thể được tự động phê duyệt hoặc yêu cầu ít thao tác nhắc nhở hơn, giúp việc lập kế hoạch diễn ra suôn sẻ hơn trong môi trường phụ thuộc nhiều vào các dịch vụ bên ngoài.
Bạn cũng có thể gắn các hook kích hoạt khi Chế độ Lập kế hoạch chuyển sang chế độ thực thi. Ví dụ, nếu tổ chức của bạn cần nhật ký kiểm toán cho mọi kế hoạch đã được phê duyệt, bạn có thể thêm một mục. AfterTool Móc nối này sao chép các thành phần kế hoạch đã hoàn thiện lên Google Cloud Storage hoặc hệ thống lưu trữ khác mỗi khi Gemini thoát khỏi Chế độ lập kế hoạch để bắt đầu thực hiện các thay đổi.
Một hook điển hình có thể là một tập lệnh như ~/.gemini/hooks/archive-plan.sh, nhận thông tin về phiên làm việc và tập tin kế hoạch. Điều này cho phép bạn thực thi các yêu cầu về tuân thủ và truy xuất nguồn gốc mà không cần thay đổi quy trình làm việc thủ công của mình — mỗi khi một kế hoạch được phê duyệt, nó sẽ tự động được sao lưu để xem xét lại hoặc phân tích sự cố sau này.
Bằng cách kết hợp các chính sách và hook tùy chỉnh, các nhóm có thể mã hóa trực tiếp phương pháp luận của riêng họ vào Chế độ Lập kế hoạch. Cho dù bạn muốn các quy trình phê duyệt nghiêm ngặt hơn, ghi nhật ký bắt buộc hay các hạn chế công cụ dành riêng cho từng môi trường, công cụ quản lý chính sách đều cung cấp cho bạn các tùy chọn cần thiết.
Kỹ năng của đại lý và quy trình lập kế hoạch chuyên biệt
Kỹ năng của tác nhân là một cơ chế quan trọng để điều chỉnh cách Gemini CLI lập kế hoạch cho các loại công việc cụ thể trong khi vẫn ở Chế độ Lập kế hoạch. Một gói kỹ năng bao gồm các hướng dẫn chuyên biệt, các bước thủ tục và các quy tắc kinh nghiệm giúp định hướng cách tác nhân nghiên cứu, thiết kế và cấu trúc một nhiệm vụ cụ thể.
Ví dụ, kỹ năng “Di chuyển cơ sở dữ liệu” có thể yêu cầu mọi kế hoạch phải bao gồm các chiến lược sao lưu, kiểm tra tính hợp lệ của dữ liệu và quy trình hoàn tác. Thay vì phải nhớ tất cả những chi tiết này mỗi lần, bạn có thể dựa vào kỹ năng này để đảm bảo mỗi kế hoạch di chuyển đều an toàn và phù hợp với tiêu chuẩn của bạn.
Tương tự, kỹ năng "Kiểm tra bảo mật" có thể thúc đẩy Gemini chủ động tìm kiếm các lỗ hổng hoặc cấu hình sai trong quá trình khám phá mã nguồn. Nó có thể hướng dẫn tác nhân quét các thiết lập mặc định không an toàn, các bước kiểm tra xác thực bị thiếu hoặc các bí mật chưa được mã hóa, sau đó tóm tắt các phát hiện và các bước khắc phục bên trong tệp kế hoạch.
Về phía giao diện người dùng, kỹ năng "Thiết kế giao diện người dùng" có thể hướng dẫn người lập trình sử dụng các thư viện thành phần giao diện người dùng cụ thể và các hướng dẫn về khả năng truy cập. Các bản thiết kế được tạo ra bằng kỹ năng này sẽ tự động tham chiếu đến hệ thống thiết kế, các quy tắc ARIA hoặc các ràng buộc về hiệu năng của bạn, giúp duy trì tính nhất quán và toàn diện của giao diện người dùng.
Để sử dụng một kỹ năng ở Chế độ Lập kế hoạch, bạn có thể yêu cầu Gemini CLI một cách rõ ràng "sử dụng kỹ năng lập kế hoạch…” hoặc đơn giản là mô tả nhiệm vụ của bạn theo cách cho phép tác nhân tự động kích hoạt kỹ năng liên quan. Khi được kích hoạt, kỹ năng này sẽ định hình lại cách thức hoạt động của các giai đoạn lập kế hoạch, từ việc ưu tiên nghiên cứu đến cấu trúc của kế hoạch Markdown cuối cùng.
Nhờ tích hợp mượt mà các kỹ năng với mô hình an toàn của Chế độ Lập kế hoạch, ngay cả các quy trình làm việc chuyên biệt cao cũng vẫn được hưởng lợi từ các đảm bảo chỉ đọc và các cổng phê duyệt. Bạn có được khả năng lập kế hoạch chuyên sâu, am hiểu lĩnh vực cụ thể mà không gây ra các tác dụng phụ không mong muốn cho môi trường của mình.
Định tuyến mô hình: Pro để lập kế hoạch, Flash để thực thi.
Gemini CLI bao gồm tính năng định tuyến mô hình tự động, tận dụng Chế độ Lập kế hoạch để cân bằng giữa chất lượng suy luận và tốc độ thực thi. Khi bạn sử dụng cấu hình mô hình tự động, giao diện dòng lệnh (CLI) sẽ chọn các mô hình Gemini khác nhau tùy thuộc vào việc bạn đang ở giai đoạn lập kế hoạch hay triển khai.
Khi bạn đang ở Chế độ Lập kế hoạch, các yêu cầu sẽ được chuyển đến một mô hình Pro có khả năng xử lý cao, chẳng hạn như Gemini 3.1 Pro. Mô hình này được tối ưu hóa cho việc phân tích phức tạp, các quyết định kiến trúc, lập luận trong bối cảnh dài hạn và lập kế hoạch chi tiết. Mục tiêu là tối đa hóa chất lượng và độ tin cậy của chính kế hoạch, ngay cả khi điều đó đòi hỏi nhiều tính toán hơn.
Sau khi kế hoạch được phê duyệt và bạn thoát khỏi Chế độ lập kế hoạch, giao diện dòng lệnh (CLI) sẽ phát hiện giai đoạn triển khai đã bắt đầu và tự động chuyển sang mô hình Flash tốc độ cao. Ở đây, ưu tiên hàng đầu là khả năng phản hồi và hiệu quả chi phí: tác nhân chủ yếu thực hiện các bước được xác định rõ ràng thay vì đưa ra các quyết định chiến lược lớn, vì vậy một mô hình nhanh hơn thường là đủ.
Chế độ hoạt động mặc định này mang lại sự cân bằng thông minh: chậm rãi và cẩn trọng trong khâu thiết kế, nhanh chóng và hiệu quả trong khâu xây dựng. Nếu vì bất kỳ lý do nào bạn muốn thiết lập khác, bạn có thể tắt chế độ chuyển đổi tự động trong cài đặt và cấu hình thủ công từng chế độ cụ thể.
Các mẫu mới hơn như Gemini 2.5 Flash và Gemini 2.5 Flash-Lite tiếp tục cải thiện sự cân bằng này. Với khả năng sử dụng công cụ tốt hơn, độ trễ thấp hơn và khả năng tuân thủ hướng dẫn được cải thiện, chúng có thể thực hiện các bước trong kế hoạch một cách đáng tin cậy hơn đồng thời kiểm soát việc sử dụng token và chi phí.
Lưu trữ phiên, dọn dẹp và thư mục gói tùy chỉnh
Để giữ cho môi trường phát triển của bạn luôn gọn gàng, Gemini CLI tự động quản lý dữ liệu phiên và các tệp kế hoạch liên quan. Theo mặc định, mỗi phiên làm việc—bao gồm cả kế hoạch và công cụ theo dõi nhiệm vụ—sẽ được lưu giữ trong 30 ngày trước khi được dọn dẹp.
Bạn có thể thay đổi thời gian lưu giữ này bằng lệnh /settings hoặc bằng cách chỉnh sửa trực tiếp tệp cấu hình settings.json của mình. Hãy tìm mục “Thời gian lưu giữ phiên” và điều chỉnh sao cho phù hợp với nhu cầu của bạn; đối với các dự án dài hạn, bạn có thể muốn thời gian lưu giữ lâu hơn, trong khi đối với các thử nghiệm ngắn hạn, bạn có thể thích thời gian lưu giữ ngắn hơn.
Ngoài tính năng dọn dẹp tự động, bạn cũng có thể kích hoạt việc xóa thủ công các phiên làm việc bất cứ lúc nào. Từ dòng lệnh, hãy sử dụng gemini –delete-session Để xóa một phiên cụ thể và các thành phần của nó. Hoặc, mở Trình duyệt phiên bằng / tóm tắt, điều hướng bằng giao diện và nhấn x Để xóa phiên đã chọn.
Nếu bạn đã cấu hình thư mục kế hoạch tùy chỉnh, điều quan trọng cần lưu ý là việc xóa tự động không loại bỏ các tệp kế hoạch đó. Bạn chịu trách nhiệm quản lý thư mục đó theo cách thủ công, điều này có thể là một lợi thế nếu bạn muốn coi các kế hoạch như tài liệu cố định hoặc lưu trữ chúng trong hệ thống kiểm soát phiên bản cùng với mã nguồn của mình.
Cách tiếp cận này mang lại cho bạn sự linh hoạt: sử dụng các kế hoạch ngắn hạn khi bạn chỉ quan tâm đến việc thực hiện ngay lập tức, hoặc duy trì một kho lưu trữ các kế hoạch chiến lược được chọn lọc để tham khảo và tuân thủ trong tương lai.
Quy trình làm việc không tương tác và CI/CD với Chế độ Lập kế hoạch
Chế độ Lập kế hoạch không chỉ dành cho các phiên làm việc tương tác trên thiết bị đầu cuối; nó cũng hoạt động tốt với các môi trường không tương tác như các tập lệnh và quy trình CI/CD. Trong những trường hợp này, công cụ quản lý chính sách được cấu hình để tự động phê duyệt một số công cụ lập kế hoạch nhất định, nhờ đó quy trình làm việc không bị gián đoạn khi chờ người dùng nhập liệu.
Cụ thể, khi Gemini CLI phát hiện ngữ cảnh không tương tác, nó sẽ tự động phê duyệt các công cụ enter_plan_mode và exit_plan_mode. Điều này có nghĩa là quy trình của bạn có thể tự động kích hoạt việc lập kế hoạch, cho phép Gemini tạo ra một kế hoạch, và sau đó chuyển sang giai đoạn thực thi mà không cần hộp thoại xác nhận thủ công.
Một điểm khác biệt quan trọng nữa trong quy trình làm việc không tương tác là những gì xảy ra sau khi Chế độ Lập kế hoạch kết thúc và quá trình thực thi bắt đầu. Thay vì chuyển sang chế độ Mặc định tiêu chuẩn, giao diện dòng lệnh (CLI) chuyển sang chế độ khác. Chế độ YOLO, được thiết kế để thực hiện các bước tự động mà không bị kẹt ở các bước phê duyệt công cụ tương tác.
Tính chất thân thiện với tự động hóa này cho phép xây dựng các quy trình làm việc được lập trình hoàn chỉnh, trong đó việc lập kế hoạch và thực thi diễn ra từ đầu đến cuối. Bạn vẫn được hưởng lợi từ giai đoạn lập kế hoạch có cấu trúc, nhưng quy trình có thể vận hành với tốc độ máy móc sau khi kế hoạch được hoàn thiện và phê duyệt theo chính sách của bạn.
Mô hình điều khiển bên trong Chế độ Lập kế hoạch
Tính năng điều khiển mô hình cho phép bạn tác động nhẹ nhàng lên Gemini trong thời gian thực khi nó đang nghiên cứu hoặc lập kế hoạch, điều này có thể giúp cải thiện đáng kể vòng phản hồi và hỗ trợ quá trình này. giảm thiểu ảo giác mô hình. Thay vì chờ một chu kỳ hoàn tất, bạn có thể đưa ra gợi ý hoặc chỉnh sửa trong khi các công cụ đang hoạt động.
Hãy tưởng tượng bạn bắt đầu với một lời nhắc như "/plan Tôi muốn triển khai một dịch vụ thông báo mới sử dụng Redis." Gemini chuyển sang Chế độ Lập kế hoạch, bắt đầu quét mã nguồn và khám phá các thư mục. Trong khi bạn quan sát các lệnh gọi của công cụ — có thể nó đang liệt kê các đường dẫn sai — bạn có thể nhập một câu như “Đừng quên kiểm tra packages/common/queues để tìm cấu hình Redis hiện có.”
Ngay cả khi bộ quay đang hoạt động, Gemini vẫn có thể tích hợp gợi ý đó vào nghiên cứu hiện tại của mình. Sau đó, bạn sẽ thấy nó kiểm tra thư mục được đề xuất ở lượt tiếp theo và điều chỉnh hiểu biết của nó về vị trí mà dịch vụ mới nên được đặt.
Việc điều khiển mô hình cũng hữu ích không kém trong giai đoạn thiết kế. Nếu kế hoạch ban đầu nghiêng về kiến trúc hàng đợi đơn giản nhưng bạn lại thích mô hình Pub/Subscriber hơn, bạn có thể nói “Hãy sử dụng mô hình Publisher/Subscriber thay vì hàng đợi đơn giản cho dịch vụ này.” Gemini sẽ tạm dừng, xem xét lại thiết kế và bắt đầu soạn thảo một phiên bản kế hoạch mới phù hợp với sở thích của bạn.
Để tận dụng tối đa khả năng điều khiển, hãy cố gắng cụ thể và can thiệp sớm. Các hướng dẫn rõ ràng như “sử dụng lớp Logger hiện có trong src/utils” hoặc “chúng tôi dự định loại bỏ mô-đun này vào tháng tới” cung cấp ngữ cảnh mà có thể không rõ ràng chỉ bằng phân tích mã tĩnh.
Khả năng mở rộng với Conductor và các quy trình làm việc phức tạp
Đối với các dự án lớn hoặc nhiều bước, tiện ích mở rộng Conductor cho thấy Chế độ Lập kế hoạch có thể trở thành xương sống của các quy trình làm việc nâng cao hơn như thế nào. Conductor được thiết kế cho Phát triển theo ngữ cảnh (Context-Driven Development), đóng vai trò như một người điều phối hướng dẫn bạn thực hiện các quá trình di chuyển phức tạp, triển khai tính năng hoặc tái cấu trúc.
Bằng cách tận dụng Chế độ Lập kế hoạch, Conductor có thể thực hiện các bước kiểm tra trước chuyến bay toàn diện và các lượt nghiên cứu chuyên sâu trong một môi trường hoàn toàn an toàn. Nó chia nhỏ các nhiệm vụ lớn thành các mốc quan trọng, sử dụng... hỏi người dùng Công cụ này giúp xác nhận các quyết định quan trọng ở mỗi giai đoạn và đảm bảo người đại diện không bao giờ vội vàng thực hiện thay đổi mà không có sự chấp thuận cấp cao của bạn.
Trong suốt quá trình này, Conductor dựa vào các nguyên tắc chỉ đọc và lập kế hoạch có cấu trúc của Chế độ Lập kế hoạch để tạo ra các nhiệm vụ phụ và các bước chi tiết. Tại mỗi điểm kiểm tra, hệ thống sẽ xác nhận các giả định, thu thập thông tin còn thiếu và cập nhật lộ trình tổng thể để việc triển khai cuối cùng vừa kỹ lưỡng vừa phù hợp với chiến lược của bạn.
Thiết kế của Chế độ Lập kế hoạch (Plan Mode) với các công cụ như enter_plan_mode và exit_plan_mode được cố ý tạo ra để có thể mở rộng, nhờ đó các giải pháp như Conductor có thể xây dựng dựa trên nền tảng đó. Mục tiêu không chỉ là cung cấp cho bạn một công tắc lập kế hoạch an toàn, mà còn là một nền tảng bạn có thể sử dụng cho các lớp điều phối tùy chỉnh và phương pháp phát triển của riêng mình.
Nhóm Gemini CLI đang nỗ lực đưa Conductor đến gần hơn với trải nghiệm cốt lõi dưới dạng một chế độ tích hợp sẵn, làm mờ hơn nữa ranh giới giữa lập kế hoạch, điều phối và thực thi. Hướng đi đó nhấn mạnh tầm quan trọng của Chế độ Lập kế hoạch đối với tương lai của phát triển có cấu trúc, được hỗ trợ bởi trí tuệ nhân tạo.
Nhìn chung, Chế độ Lập kế hoạch trong Gemini CLI không chỉ đơn thuần là một công tắc an toàn; nó là một môi trường lập kế hoạch hoàn chỉnh, kết hợp giữa khả năng khám phá chỉ đọc, cộng tác phong phú, các chính sách có thể tùy chỉnh, các mô hình suy luận cao và hành vi thân thiện với tự động hóa. Bằng cách áp dụng phương pháp này cho tính năng lớn tiếp theo, quá trình chuyển đổi hoặc kiểm tra, bạn sẽ có không gian rõ ràng để suy nghĩ, đặt câu hỏi và lặp lại trước khi bất kỳ thay đổi mã nào được đưa vào, điều này cuối cùng dẫn đến việc triển khai sạch sẽ hơn và ít bất ngờ khó chịu hơn.


