视频理解 API

视频理解 API (Video Understanding) 基于 Gemini 2.5 Pro 等先进模型，提供视频内容识别、场景描述和动作分析功能。

核心特性

模型支持：
- gemini-2.5-pro: 复杂分析。
- gemini-2.5-flash: 快速、高性价比。
输入方式：支持 Base64 编码的视频文件 (推荐 20MB 以内)。
中文优化：针对中文语境进行了优化。

使用场景

视频内容总结
教育视频分析
监控视频分析
营销视频评估

代码示例 (Python)

import base64
from openai import OpenAI

# 读取视频并转为 Base64
video_path = "path/to/video.mp4"
with open(video_path, "rb") as video_file:
    video_base64 = base64.b64encode(video_file.read()).decode('utf-8')

client = OpenAI(
    api_key="YOUR_API_KEY",
    base_url="https://api.weelinking.com/v1"
)

response = client.chat.completions.create(
    model="gemini-1.5-pro", # 使用支持视频理解的模型
    messages=[
        {
            "role": "user",
            "content": [
                {"type": "text", "text": "Describe this video in detail."},
                {
                    "type": "image_url", # 注意：部分库可能需要特定的视频类型字段，或复用image_url传入base64
                    "image_url": {
                        "url": f"data:video/mp4;base64,{video_base64}"
                    }
                }
            ]
        }
    ]
)

print(response.choices[0].message.content)

注意：具体传入视频的方式请参考最新的 OpenAI 兼容多模态格式文档，通常涉及将视频作为 Base64 数据或 URL 传入。

图像理解（识图）API 文本生成（对话补全）

⌘I

产品基础

基础 API

视频 API

图片 API

多模态 API

文本 API

API 参考

视频理解API

视频理解 API

核心特性

使用场景

代码示例 (Python)

产品基础

基础 API

视频 API

图片 API

多模态 API

文本 API

API 参考

​视频理解 API

​核心特性

​使用场景

​代码示例 (Python)

视频理解 API

核心特性

使用场景

代码示例 (Python)