Llama3

释放大型语言模型的强大潜力

2024-04-14

Llama3是Meta推出的先进大语言模型(LLM),旨在为个人、创作者、研究人员和各规模企业提供支持。本次发布包含8B至70B参数规模的预训练模型和指令调优模型的权重文件及启动代码。该代码库提供了加载Llama3模型并运行推理的最小示例,更多详细用例可参阅《Llama开发手册》。

核心特性

  • 模型规格:提供8B至70B参数版本,支持最长8192个标记的上下文窗口
  • 安全设计:集成PurpleLlama安全风险检测及推理阶段缓解方案
  • 灵活部署:支持原生格式和Hugging Face transformers格式
  • 智能代理:通过llama-agentic-system可构建高级智能代理应用

快速开始

使用Llama3需要:

  1. 访问Meta Llama官网申请模型权限并接受许可协议
  2. 使用提供的download.sh脚本或通过Hugging Face下载模型权重
  3. 配置含PyTorch/CUDA的conda环境并安装依赖项
  4. 运行示例脚本进行推理

安全使用

Llama3包含安全分类器和《负责任使用指南》等工具。鼓励用户通过指定渠道反馈问题或不安全输出内容。

许可协议

Llama3支持科研和商业用途,强调AI伦理发展。随附的《可接受使用政策》明确了负责任部署的准则。

更多实例与集成方案请参阅Llama开发手册

Artificial Intelligence Large Language Models Machine Learning Natural Language Processing AI Safety