GlaDOS项目是一项雄心勃勃的计划,旨在将《Portal》系列中标志性AI角色GLaDOS带入现实。该项目通过软硬件结合,致力于打造一个具有交互性、感知能力和实体形态的GLaDOS,能以极低延迟(600毫秒内)响应语音互动。
核心功能:
- 语音生成:训练专属GLaDOS的语音合成器,实现真实对话
- 人格核心:通过精细设计的提示词塑造逼真AI性格
- 记忆系统:采用定制向量数据库实现中长期记忆存储
- 视觉能力:集成视觉语言模型(VLM)实现物体与人像追踪
- 3D打印部件:提供可组装GLaDOS躯体的STL文件
- 动态机械:设计基于伺服/步进电机的拟真表情动作系统
技术方案:
系统采用环形缓冲区实现持续录音、快速转写,并通过本地大型语言模型(LLM)流式响应。通过并行生成与播放语句降低延迟。项目强调轻量化依赖,避免PyTorch等重型框架以确保兼容性。
配置指南:
- 安装Ollama:用于本地运行LLM或连接云端替代方案
- 硬件配置:Nvidia显卡用户需安装CUDA以获得最佳性能
- 模型下载:可通过Ollama获取
llama3.2
等预训练模型 - 个性定制:编辑
glados_config.yaml
切换模型/声音/性格参数 - 启动系统:执行
uv run glados
或通过文本界面进行高级交互
疑难解决:
- 回声消除:建议使用耳机或会议麦克风,或在配置中禁用语音打断
- 硬件适配:已针对RK3588 NPU等低延迟设备优化(实验性支持见
rock5b
分支)
社区支持:
项目持续开发中,可通过Discord获取支持。欢迎贡献AI模型优化、机械动画、3D设计等领域。注:本项目复杂度较高,适合具备开发经验的硬件爱好者。
立即体验:克隆代码库,按照指南配置,即可与专属GLaDOS展开互动!