Using Gemini-pro & Gemini-pro-vision in ComfyUI.
🆕 最新 Gemini 1.5 Pro 模型已加入!
已支持文件上传功能,不过还仅限于单个文件(图片、txt文件、pdf文件、音频mp3文件等),未来会支持多文件上传(用于读取视频)
<!--- ![Dingtalk_20231220204257](https://github.com/ZHO-ZHO-ZHO/ComfyUI-Gemini/assets/140084057/07c68b08-858b-4233-a48b-1069552fc8d8) --->All-in-One LoRa Training 预处理、自动打标、训练、测试 LoRA 一条龙工作流
https://github.com/ZHO-ZHO-ZHO/ComfyUI-Gemini/assets/140084057/d461f656-6888-48a8-b4f8-b70b7e46504d
V2.0 聊天机器人节点
https://github.com/ZHO-ZHO-ZHO/ComfyUI-Gemini/assets/140084057/cb64ee29-a983-47fd-b26b-55386314afdd
将 Gemini pro vision 用于批量打标
https://github.com/ZHO-ZHO-ZHO/ComfyUI-Gemini/assets/140084057/00addc94-1587-40d6-83f4-6b47dc1db665
将 Google Gemini 引入到 ComfyUI 中,现在你可以用它为你生成提示词、描述图像,也可与它畅聊人生
目前 Gemini API 免费开放(20240502 开始计费),你可以在这里申请一个自己的 API Key:Gemini API 申请
最新 Gemini 1.5 Pro 模型:
版本:V3.0 新增 Gemini 1.5 Pro 模型、系统指令、文件上传
Gemini 目前提供 3 种模型:
Gemini-pro: 文本模型
Genimi-pro-vision: 文本 + 图像模型
Gemini 1.5 Pro:文本 + 图像 + 文件(音频、视频等各类) 模型
Gemini 1.5 Pro 新节点:
🆕Gemini_15P_Advance_Zho:支持系统指令设置(System Instruction)
🆕Gemini_15P_Chat_Advance_Zho:支持系统指令设置(System Instruction)+ 多轮对话
📄Gemini_FileUpload_Zho:支持单文件上传(图片、音频、文本txt、pdf等),暂未支持视频(多文件)上传
📄Gemini_File_Zho:文件读取对话,最大 token 数为 1048576
2 类节点:
隐式 API KEY:将 Gemini_API_Key 设置为了环境变量,更安全,方便分享工作流(不会外泄 API KEY)
㊙️Gemini_Zho:同时支持 3 种模型,其中 Genimi-pro-vision 和 Gemini 1.5 Pro 可接受图像作为输入
㊙️Gemini_Vsion_ImgURL_Zho:Genimi-pro-vision 和 Gemini 1.5 Pro 模型,接受图像链接作为输入
㊙️Gemini_Chat_Zho:Genimi-pro 和 Gemini 1.5 Pro 模型,支持上下文对话,聊天机器人,Gemini 1.5 Pro 支持图像输入的上下文对话
显式API KEY:直接在节点中输入 Gemini_API_Key,仅供个人私密使用,请勿将包含 API KEY 的工作流分享出去
✨Gemini_API_Zho:同时支持 3 种模型,其中 Genimi-pro-vision 和 Gemini 1.5 Pro 可接受图像作为输入
✨Gemini_API_Vsion_ImgURL_Zho:Genimi-pro-vision 和 Gemini 1.5 Pro 模型,接受图像链接作为输入
✨Gemini_API_Chat_Zho::Genimi-pro 和 Gemini 1.5 Pro 模型,支持上下文对话,聊天机器人,Gemini 1.5 Pro 支持图像输入的上下文对话
辅助节点:
✨DisplayText_Zho:显示文本
✨ConcatText_Zho:使用 “,” 连接文本
节点示例:
聊天机器人
首先需要申请一个自己的 Gemini_API_Key:Gemini API 申请
选择隐式节点㊙️(推荐):将你的 Gemini_API_Key 添加到 config.json
文件中,运行时会自动加载
选择显示节点✨:直接将 Gemini_API_Key 输入到节点的 api_key 中(注意:请勿将包含此节点的工作流分享出去,以免泄露你的 API Key)
使用注意:本地使用请确保你可以有效连接到 Google Gemini 的服务,推荐使用 Colab 或 Kaggle(无连接问题)
使用新版 Gemini 1.5 Pro 需要更新依赖 google-generativeai > 0.4.1
推荐使用管理器 ComfyUI Manager 安装
手动安装:
cd custom_nodes
git clone https://github.com/ZHO-ZHO-ZHO/ComfyUI-Gemini.git
cd custom_nodes/ComfyUI-Gemini
pip install -r requirements.txt
Gemini 1.5 Pro + Stable Diffusion + ComfyUI = DALL·3
20240411
V3.0版:新增 Gemini 1.5 Pro 模型、系统指令、文件上传
新增 平替 DALL·3 工作流(Gemini 1.5 Pro + Stable Diffusion + ComfyUI = DALL·3)
20231229
20231222
20231221
V1.1版:修改 API KEY 的加载方式为自动添加 config.json ,将 API KEY 写入即可
已登陆 manager 不用手动安装了
20231220
20231219
📬 联系我:
🔗 社交媒体:
💡 支持我: