核心特性
- 多模态输入:支持文本、图像、视频、音频混合输入。
- Function Calling:支持工具调用。
- 代码执行:支持模型生成并执行代码。
- Token 追踪:精确的 Token 使用统计。
- Context Caching:支持上下文缓存。
Python SDK 示例
需使用 Google Generative AI SDK。功能对比
| 功能 | 原生格式 | OpenAI 兼容格式 |
|---|---|---|
| 文本生成 | ✅ | ✅ |
| 图像/视频输入 | ✅ | ✅ (通过 image_url) |
| Function Calling | ✅ | ✅ |
| 代码执行 | ✅ | ❌ |
| 搜索工具 | ✅ | ❌ |