GlaDOS

用人工智能与机器人技术打造现实版互动GLaDOS!

2024-05-11

GlaDOS项目是一项雄心勃勃的计划,旨在将《Portal》系列中标志性AI角色GLaDOS带入现实。该项目通过软硬件结合,致力于打造一个具有交互性、感知能力和实体形态的GLaDOS,能以极低延迟(600毫秒内)响应语音互动。

核心功能:

  • 语音生成:训练专属GLaDOS的语音合成器,实现真实对话
  • 人格核心:通过精细设计的提示词塑造逼真AI性格
  • 记忆系统:采用定制向量数据库实现中长期记忆存储
  • 视觉能力:集成视觉语言模型(VLM)实现物体与人像追踪
  • 3D打印部件:提供可组装GLaDOS躯体的STL文件
  • 动态机械:设计基于伺服/步进电机的拟真表情动作系统

技术方案:

系统采用环形缓冲区实现持续录音、快速转写,并通过本地大型语言模型(LLM)流式响应。通过并行生成与播放语句降低延迟。项目强调轻量化依赖,避免PyTorch等重型框架以确保兼容性。

配置指南:

  1. 安装Ollama:用于本地运行LLM或连接云端替代方案
  2. 硬件配置:Nvidia显卡用户需安装CUDA以获得最佳性能
  3. 模型下载:可通过Ollama获取llama3.2等预训练模型
  4. 个性定制:编辑glados_config.yaml切换模型/声音/性格参数
  5. 启动系统:执行uv run glados或通过文本界面进行高级交互

疑难解决:

  • 回声消除:建议使用耳机或会议麦克风,或在配置中禁用语音打断
  • 硬件适配:已针对RK3588 NPU等低延迟设备优化(实验性支持见rock5b分支)

社区支持:

项目持续开发中,可通过Discord获取支持。欢迎贡献AI模型优化、机械动画、3D设计等领域。注:本项目复杂度较高,适合具备开发经验的硬件爱好者。

立即体验:克隆代码库,按照指南配置,即可与专属GLaDOS展开互动!

Artificial Intelligence Robotics Voice Cloning Text-to-Speech 3D Printing