LLaMA 系列

LLaMA（Large Language Model Meta AI）是 Meta（原 Facebook）开发的开源大语言模型系列，是目前最强大的开源 LLM 家族。

发展历程

版本	发布时间	参数规格	主要特点
LLaMA 1	2023年2月	7B-65B	首个版本，研究用途
LLaMA 2	2023年7月	7B-70B	商用开源，Chat 版本
Code Llama	2023年8月	7B-34B	专注代码生成
LLaMA 3	2024年4月	8B-70B	大幅性能提升
LLaMA 3.1	2024年7月	8B-405B	128K 上下文，超大规模
LLaMA 3.2	2024年9月	1B-90B	多模态能力
LLaMA 3.3	2024年12月	70B	媲美 405B 的能力
LLaMA 4	2025年4月	Scout/Maverick	新一代架构

核心特点

1. 完全开源

LLaMA 是真正意义上的开源模型：

开放模型权重
允许商业使用（需遵守许可证）
可以自由微调和部署
推动了开源 AI 生态发展

2. 高效架构

LLaMA 在相同参数量下表现更优：

优化的 Transformer 架构
更高效的训练方法
更好的推理效率

3. 多规格选择

提供多种参数规格满足不同需求：

小型（1B-8B）： 边缘设备、移动端
中型（70B）： 服务器部署、通用任务
大型（405B）： 最强能力、研究用途

当前主力模型

LLaMA 3.3 70B

模型 ID： llama-3.3-70b
上下文窗口： 128K tokens
特点： 开源最强，媲美闭源模型
适用场景： 企业部署、复杂任务

LLaMA 3.1 405B

模型 ID： llama-3.1-405b
上下文窗口： 128K tokens
特点： 参数量最大，能力最强
适用场景： 科研、高端应用

LLaMA 3.2 90B Vision

模型 ID： llama-3.2-90b-vision
上下文窗口： 128K tokens
特点： 多模态能力，图像理解
适用场景： 图文分析、多模态任务

LLaMA 3.1 8B

模型 ID： llama-3.1-8b
上下文窗口： 128K tokens
特点： 轻量高效，易于部署
适用场景： 本地部署、边缘计算

API 调用示例

from openai import OpenAI

client = OpenAI(
    api_key="your-api-key",
    base_url="https://api.weelinking.com/v1"
)

response = client.chat.completions.create(
    model="llama-3.3-70b",
    messages=[
        {"role": "system", "content": "你是一个专业的技术助手。"},
        {"role": "user", "content": "解释容器化技术的优势"}
    ],
    temperature=0.7
)

print(response.choices[0].message.content)

LLaMA 的生态系统

1. 衍生模型

基于 LLaMA 微调的优秀模型：

Vicuna： 对话优化版本
Alpaca： 指令微调版本
WizardLM： 复杂指令增强
Chinese-LLaMA： 中文增强版

2. 部署工具

Ollama： 本地一键部署
vLLM： 高性能推理引擎
llama.cpp： CPU 推理优化
Text Generation Inference： HuggingFace 推理服务

3. 微调框架

PEFT： 参数高效微调
LoRA： 低秩适应
QLoRA： 量化 LoRA

与其他模型对比

特性	LLaMA 3.3 70B	GPT-4o	Claude 3.5
开源	✅	❌	❌
本地部署	✅	❌	❌
上下文窗口	128K	128K	200K
综合能力	极强	极强	极强
成本控制	灵活	API 计费	API 计费

最佳实践

选择合适规格： 根据硬件和需求选择参数量
考虑量化： 使用 4-bit/8-bit 量化降低显存需求
微调定制： 针对特定任务微调获得更好效果
多模态场景： 使用 3.2 Vision 版本处理图像

发展历程​

核心特点​

1. 完全开源​

2. 高效架构​

3. 多规格选择​

当前主力模型​

LLaMA 3.3 70B​

LLaMA 3.1 405B​

LLaMA 3.2 90B Vision​

LLaMA 3.1 8B​

API 调用示例​

LLaMA 的生态系统​

1. 衍生模型​

2. 部署工具​

3. 微调框架​

与其他模型对比​

最佳实践​

发展历程

核心特点

1. 完全开源

2. 高效架构

3. 多规格选择

当前主力模型

LLaMA 3.3 70B

LLaMA 3.1 405B

LLaMA 3.2 90B Vision

LLaMA 3.1 8B

API 调用示例

LLaMA 的生态系统

1. 衍生模型

2. 部署工具

3. 微调框架

与其他模型对比

最佳实践