GlaDOS

用人工智能与机器人技术打造现实版互动GLaDOS！

2024-05-11

GlaDOS项目是一项雄心勃勃的计划，旨在将《Portal》系列中标志性AI角色GLaDOS带入现实。该项目通过软硬件结合，致力于打造一个具有交互性、感知能力和实体形态的GLaDOS，能以极低延迟（600毫秒内）响应语音互动。

核心功能：

语音生成：训练专属GLaDOS的语音合成器，实现真实对话
人格核心：通过精细设计的提示词塑造逼真AI性格
记忆系统：采用定制向量数据库实现中长期记忆存储
视觉能力：集成视觉语言模型(VLM)实现物体与人像追踪
3D打印部件：提供可组装GLaDOS躯体的STL文件
动态机械：设计基于伺服/步进电机的拟真表情动作系统

技术方案：

系统采用环形缓冲区实现持续录音、快速转写，并通过本地大型语言模型(LLM)流式响应。通过并行生成与播放语句降低延迟。项目强调轻量化依赖，避免PyTorch等重型框架以确保兼容性。

配置指南：

安装Ollama：用于本地运行LLM或连接云端替代方案
硬件配置：Nvidia显卡用户需安装CUDA以获得最佳性能
模型下载：可通过Ollama获取llama3.2等预训练模型
个性定制：编辑glados_config.yaml切换模型/声音/性格参数
启动系统：执行uv run glados或通过文本界面进行高级交互

疑难解决：

回声消除：建议使用耳机或会议麦克风，或在配置中禁用语音打断
硬件适配：已针对RK3588 NPU等低延迟设备优化（实验性支持见rock5b分支）

社区支持：

项目持续开发中，可通过Discord获取支持。欢迎贡献AI模型优化、机械动画、3D设计等领域。注：本项目复杂度较高，适合具备开发经验的硬件爱好者。

立即体验：克隆代码库，按照指南配置，即可与专属GLaDOS展开互动！

GitHub Repository

Artificial Intelligence Robotics Voice Cloning Text-to-Speech 3D Printing

reor

ScrapeGraphAI