Was ist MoMoAGI?
MoMoAGI ist ein selbst-gehosteter KI-Assistent-Stack, der auf einem VPS laeuft. Er kombiniert mehrere Open-Source-Komponenten zu einem System, das aehnlich wie ChatGPT funktioniert, aber unter voller eigener Kontrolle steht. Statt direkt bei OpenAI oder Anthropic zu bezahlen, routet MoMoAGI Anfragen ueber guenstigere KI-Anbieter (DeepSeek, Kimi) und speichert dabei alles in einer eigenen Wissensdatenbank.
Einfach gesagt: Ein privater ChatGPT mit Gedaechtnis, der auf dem eigenen Server laeuft.
VPS-IP: 187.77.91.180 | Domains: *.worki.cloud | Stand: 2026-04-06
Quick Stats
System Status
gehirn-api
MoMoAGI Frontend
MoMoAGI Gateway
LiteLLM
Langfuse
Redis
Prometheus
Grafana
Qdrant
Whisper STT
Piston
NATS
nginx
Ruflo
free-code
Architektur-Diagramm
Klicke auf einen Service-Block, um zur Detail-Sektion zu springen.
6-Schichten-Modell
| # | Schicht | Komponenten | Erklaerung |
|---|---|---|---|
| 1 | User Access | Browser, SSH, Tailscale VPN, free-code CLI | Wie Benutzer auf das System zugreifen. Browser fuer Web-Chat, SSH fuer Server-Verwaltung, VPN fuer sicheren Zugang. |
| 2 | Proxy / Edge | nginx (:443), nginx-proxy-manager (:80) | Verschluesselt die Verbindung (HTTPS/TLS) und leitet Anfragen an den richtigen Service weiter. Wie ein Pfoertner. |
| 3 | Application | Frontend (:3080), gehirn-api (:8000), Gateway (:3081), LiteLLM (:4000), Langfuse (:3100) | Die eigentlichen Programme. Frontend zeigt den Chat, gehirn-api speichert Wissen, Gateway leitet KI-Anfragen, LiteLLM waehlt das guenstigste KI-Modell. |
| 4 | Orchestration | Ruflo (claude-flow), Hatchet | Koordiniert mehrere KI-Agenten gleichzeitig. Ruflo steuert Schwarm-Aufgaben, Hatchet verwaltet Hintergrund-Jobs. |
| 5 | Data | Redis, SQLite (omega.db), Qdrant, Postgres (langfuse-db, hatchet-postgres) | Wo alle Daten gespeichert werden. Redis ist ein schneller Zwischenspeicher, SQLite/Postgres sind Datenbanken, Qdrant sucht aehnliche Texte. |
| 6 | Infrastructure | Piston, Whisper, SearXNG, NATS, Gitea, Prometheus, Grafana, Exporter | Hilfsdienste: Code ausfuehren (Piston), Sprache erkennen (Whisper), Web durchsuchen (SearXNG), Metriken sammeln (Prometheus/Grafana). |
Docker Container (19 laufend)
| # | Container | Image | Port | Binding | Status | Funktion |
|---|---|---|---|---|---|---|
| 1 | gehirn-api | python:3.11-slim | 8000 | 127.0.0.1 | Up | KI-Gedaechtnis-Engine mit 518 Memories, BGE-M3 Embeddings |
| 2 | gehirn-cache | redis:7-alpine | 6379 | 127.0.0.1 | Up | Schneller Zwischenspeicher fuer gehirn-api (790 Keys) |
| 3 | langfuse-server | langfuse/langfuse:2 | 3100 | 127.0.0.1 | Unhealthy | LLM-Observability: Traces, Kosten, Latenz. langfuse.worki.cloud |
| 4 | langfuse-db | postgres:15-alpine | 5432 (intern) | Docker | Healthy | Datenbank fuer Langfuse (Traces, User) |
| 5 | prometheus | prom/prometheus | 9090 | 127.0.0.1 | Up | Metriken-Sammler. 3 Exporter (node/redis/pg) + Self-Scrape konfiguriert. |
| 6 | grafana | grafana/grafana | 3003 | 127.0.0.1 | Up | Dashboard-Visualisierung. Version 12.4.1 |
| 7 | nats | nats:2.10-alpine | 4222 | 127.0.0.1 | Up | Event-Bus fuer asynchrone Nachrichten. Aktuell 0 Verbindungen. |
| 8 | qdrant | qdrant/qdrant | 6333/6334 | 127.0.0.1 | Up | Vektor-Datenbank. 5 Collections, nicht aktiv von gehirn-api genutzt. |
| 9 | momoagi-whisper | openai-whisper-asr | 9000 | 127.0.0.1 | Healthy | Sprache-zu-Text Konvertierung (Whisper Modell) |
| 10 | piston | engineer-man/piston | 2000 | 127.0.0.1 | Up | Sandboxed Code-Ausfuehrung (Python, JS, etc.) |
| 11 | searxng | searxng/searxng | 8888 | 127.0.0.1 | Up | Meta-Suchmaschine (Web-Suche ohne Tracking) |
| 12 | gitea | gitea/gitea:1.23.5 | 3000/2222 | 0.0.0.0 | Up | Eigener Git-Server fuer Code-Verwaltung |
| 13 | hatchet-postgres | postgres:15.6 | 5433 | 0.0.0.0 | Healthy | Datenbank fuer Hatchet Task-Queue (40+ Tabellen) |
| 14 | redis-replica | redis:7-alpine | 6380 | 0.0.0.0 | Up | Redis Hochverfuegbarkeits-Kopie |
| 15 | redis-sentinel | redis:7-alpine | 26379 | 0.0.0.0 | Up | Redis Failover-Ueberwachung |
| 16 | node-exporter | prom/node-exporter | 9100 | 0.0.0.0 | Up | System-Metriken (CPU, RAM, Disk) fuer Prometheus |
| 17 | redis-exporter | redis_exporter | 9121 | 0.0.0.0 | Up | Redis-Metriken fuer Prometheus |
| 18 | postgres-exporter | postgres-exporter | 9187 | 0.0.0.0 | Up | Postgres-Metriken fuer Prometheus |
| 19 | nginx-proxy-mgr | nginx-proxy-manager | 80/81/8443 | 0.0.0.0 | Up | Docker-basierter HTTP Reverse Proxy mit Web-UI |
127.0.0.1 = nur lokal erreichbar (sicher) 0.0.0.0 = oeffentlich erreichbar (Risiko!)
Systemd Services
| Service | Auto-Start | Status | Port | Funktion |
|---|---|---|---|---|
| nginx | Ja | Aktiv | 443 | TLS-Termination fuer alle *.worki.cloud Domains |
| litellm | Ja | Aktiv | 4000 | LLM-Routing Proxy (DeepSeek/Kimi) |
| momoagi | Ja | Aktiv | 3080 | LibreChat/MoMoAGI Web-Frontend |
| momoagi-gateway | Ja | Aktiv | 3081 | SSE API Gateway fuer Desktop-App |
| free-code | Ja | Aktiv | - | CLI v2.1.87, KAIROS aktiv, --dangerously-skip-permissions, 49 Tools |
| claude-flow-daemon | @reboot cron | Aktiv | - | Ruflo Daemon startet bei VPS-Boot via cron, 5 Worker |
| tailscaled | Ja | Aktiv | - | Tailscale VPN (100.101.58.108) |
| docker | Ja | Aktiv | - | Docker Engine fuer alle Container |
| ufw | Ja | Aktiv | - | Firewall |
nginx Routes (*.worki.cloud)
| Domain | Backend | Service | SSL | Status |
|---|---|---|---|---|
| worki.cloud | 127.0.0.1:3080 | LibreChat/MoMoAGI UI | Let's Encrypt | 200 |
| api.worki.cloud | 127.0.0.1:8000 | gehirn-api (FastAPI) | Let's Encrypt | 404 (kein Root-Handler) |
| momoagi.worki.cloud | /v1/ -> :3081, /* -> :3080 | Gateway + Frontend | Let's Encrypt | 200 |
| langfuse.worki.cloud | 127.0.0.1:3100 | Langfuse | Let's Encrypt | 200 |
| autoflow.worki.cloud | 301 Redirect -> worki.cloud | - | NPM-Cert | Redirect |
| docs.worki.cloud | /opt/docs-worki/ | System Dashboard | Let's Encrypt | 200 |
free-code CLI (v2.1.87)
Fork von Claude Code (Anthropic). Bun-gebundelte CLI-Binary mit 49 Tools, KAIROS proaktivem Assistenten, Gedaechtnis-Bridge zu gehirn-api und Sprach-Eingabe via Whisper.
Pfad: /opt/free-code-main/ | Runtime: Bun | Module: 5.648 | Status: Aktiv (--dangerously-skip-permissions)
49 Tools
KAIROS Features
| Komponente | Dateien | Funktion |
|---|---|---|
| assistant/ | gate.ts, index.ts, sessionDiscovery/History | Gate-Check und Team-Initialisierung |
| proactive/ | index.ts, useProactive.ts | Proaktive Vorschlaege (autonome Ticks) |
| daemon/ | main.ts, workerRegistry.ts | Hintergrund-Supervisor |
| skills/bundled/dream.ts | 1 Datei | /dream Memory-Konsolidierung |
| MonitorTool | 1 Datei | Echtzeit-Stream-Ueberwachung |
Ausgehende Verbindungen
| Ziel | Adresse | Zweck |
|---|---|---|
| Anthropic API | api.anthropic.com (HTTPS) | Direkte LLM-Aufrufe (Claude Modelle) |
| gehirn-api | localhost:8000 (HTTP) | PostToolUse Hook: Memory Write (Fire-and-Forget) |
| LiteLLM | localhost:4000 (HTTP) | Delegierte LLM-Aufrufe (DeepSeek/Kimi) |
| Whisper STT | localhost:9000 (HTTP) | Sprach-Eingabe |
| Ruflo MCP | stdio (Subprocess) | Agent-Orchestrierung |
server/ Module (72 Dateien, 7 Verzeichnisse)
| Modul | Dateien | Funktion |
|---|---|---|
| server/security/ | 7 | Path-Validator, Command-Sandbox, Rate-Limiter, Audit-Log, Sanitize, Key-Encryption, CSP |
| server/db/ | 13 | Drizzle ORM (Postgres + SQLite), 6 Repositories (user, conversation, message, session, toolUse, sharedLink) |
| server/observability/ | 6 | Pino Logger, Prometheus Metrics, Health-Checks, Cost-Tracker, PII-Scrubber, Sentry |
| server/analytics/ | 4 | NDJSON Event Storage, Processor (32 Events), Aggregation, REST-Router |
| server/auth/ | 7 | Auth-Factory (Token, API-Key, OAuth, SAML), CSRF, RBAC (admin/user/viewer) |
| server/api/ | 20 | REST API (Conversations, Files, Exec, MCP, Search, Settings), SSE Streaming |
| server/web/ | 12 | WebSocket PTY-Server (xterm.js), Session-Manager, Admin-Dashboard |
gehirn-api (OMEGA Engine v4.1.0)
FastAPI-basierte Wissens-Engine. Speichert Erinnerungen als Vektoren (BGE-M3, 1024-dim), verwaltet einen Wissens-Graphen und bietet proaktive Erinnerungen. API-Doku (Swagger)
Container: gehirn-api | Port: 127.0.0.1:8000 | DB: omega.db (5 MB) | Agents: 20 | Memories: 518
Alle 51 Endpoints
| Kategorie | Method | Endpoint | Funktion |
|---|---|---|---|
| Brain (9) | GET | /api/v1/brain/agents | Alle bekannten Agents |
| POST | /api/v1/brain/estimate | Task-Aufwand schaetzen | |
| POST | /api/v1/brain/intent | Intent klassifizieren (TASK/CHAT/BATCH) | |
| POST | /api/v1/brain/intent/correct | Intent-Korrektur (Feedback) | |
| POST | /api/v1/brain/rate-check | Rate-Limit pruefen | |
| GET | /api/v1/brain/rate-stats | Rate-Limit Statistiken | |
| POST | /api/v1/brain/route | Agent-Routing (Zuweisung) | |
| POST | /api/v1/brain/trace | Trace-Event schreiben | |
| GET | /api/v1/brain/trace/stats | Trace-Statistiken | |
| Embed (1) | POST | /api/v1/embed | Text -> Vektor (BGE-M3, 1024-dim) |
| Health (1) | GET | /api/v1/health | Health-Check |
| Memory Core (5) | POST | /api/v1/memory/write | Memory speichern |
| GET | /api/v1/memory/item/{id} | Einzelnes Memory abrufen | |
| PUT | /api/v1/memory/item/{id} | Memory aktualisieren | |
| DELETE | /api/v1/memory/item/{id} | Memory loeschen | |
| GET | /api/v1/memory/agents/list | Agents mit Memory-Count | |
| Search (3) | POST | /api/v1/memory/semantic-search | Semantische Suche (Vektoren) |
| POST | /api/v1/memory/hybrid-search | Hybrid-Suche (Semantik + Keyword) | |
| POST | /api/v1/memory/smart-context | Smart Context Retrieval | |
| Hierarchy (2) | POST | /api/v1/memory/hierarchy/write | Tier-System (episodic/semantic/procedural) |
| GET | /api/v1/memory/hierarchy/summary | Hierarchie-Uebersicht | |
| Graph (5) | POST | /api/v1/memory/graph/edge | Kante hinzufuegen (Entity-Relation) |
| GET | /api/v1/memory/graph/edges/{id} | Kanten eines Knotens | |
| GET | /api/v1/memory/graph/connected/{id} | Verbundene Memories (BFS) | |
| GET | /api/v1/memory/graph/path/{from}/{to} | Kuerzester Pfad | |
| POST | /api/v1/memory/graph/auto-link | Automatische Verlinkung | |
| Tags (4) | POST | /api/v1/memory/tags/add | Tags hinzufuegen |
| GET | /api/v1/memory/tags/get | Tags abrufen | |
| GET | /api/v1/memory/tags/popular | Populaere Tags | |
| POST | /api/v1/memory/tags/search | Tag-Suche | |
| Maintenance (6) | POST | /api/v1/memory/decay/run | Memory-Decay (Relevanz senken) |
| GET | /api/v1/memory/decay/stats | Decay-Statistiken | |
| POST | /api/v1/memory/consolidation/run | Duplikate zusammenfuehren | |
| GET | /api/v1/memory/consolidation/stats | Konsolidierungs-Stats | |
| POST | /api/v1/memory/archive/run | Auto-Archivierung | |
| GET | /api/v1/memory/archive/stats | Archiv-Stats | |
| Conflict (2) | POST | /api/v1/memory/conflict/check | Widerspruecke erkennen |
| POST | /api/v1/memory/conflict/resolve | Widerspruecke aufloesen | |
| Intelligence (3) | POST | /api/v1/memory/auto-categorize | Auto-Kategorisierung |
| POST | /api/v1/memory/context-injection | Memory in Prompt einfuegen | |
| POST | /api/v1/memory/summary/generate | Zusammenfassung erzeugen | |
| Session (1) | POST | /api/v1/memory/session/extract | Memories aus Konversation extrahieren |
| Sharing (2) | POST | /api/v1/memory/share | Memory zwischen Agents teilen |
| POST | /api/v1/memory/shared/list | Geteilte Memories auflisten | |
| Proactive (3) | GET | /api/v1/memory/proactive/check | Proaktive Erinnerungen |
| POST | /api/v1/memory/proactive/acknowledge | Erinnerung bestaetigen | |
| GET | /api/v1/memory/proactive/daily-summary | Taegliche Zusammenfassung | |
| Reminders (2) | GET | /api/v1/memory/reminders/check | Erinnerungen pruefen |
| POST | /api/v1/memory/reminders/create | Erinnerung erstellen | |
| Tools (2) | GET | /api/v1/memory/tools/export | Alle Memories exportieren |
| POST | /api/v1/memory/tools/import | Memories importieren |
Ruflo / claude-flow (v3.5.48)
Multi-Agent Schwarm-Orchestrierung. Koordiniert mehrere KI-Agenten gleichzeitig fuer komplexe Aufgaben. Laeuft als MCP-Server ueber stdio (wird von free-code als Subprocess gestartet).
Pfad: /opt/ruflo/ruflo-main/ | Global CLI: /usr/bin/claude-flow | MCP Tools: 259 | Agent-Typen: 60+
14 Hooks (aktiv)
| Hook | Typ | Wann |
|---|---|---|
| pre-edit / post-edit | PreToolUse / PostToolUse | Vor/nach Datei-Bearbeitung |
| pre-bash | PreToolUse | Vor Shell-Befehl (30+ gefaehrliche Befehle blockiert) |
| post-command | PostToolUse | Nach Shell-Befehl |
| pre-task / post-task | PreToolUse / PostToolUse | Vor/nach Aufgabe |
| route / explain | intelligence | Agent-Routing (Deutsch + Englisch: implementiere, recherchiere, etc.) |
| session-start / -end / -restore | Session* | Sitzungs-Verwaltung |
| pretrain / build-agents / transfer | intelligence | Neuronales Lernen |
Hook-Verbesserungen
| Feature | Detail |
|---|---|
| pre-bash Blocklist | 30+ gefaehrliche Befehle blockiert (rm -rf, docker rm, systemctl stop, etc.) |
| Router (DE+EN) | Erkennt deutsche und englische Keywords (implementiere, recherchiere, analyze, etc.) |
| feedback() | Echtes Lernen: feedback-history.jsonl + learned-patterns.json |
| consolidate() | Persistente Konsolidierung: consolidated-knowledge.json |
| YAML-Parser | Robuster Zeilen-Parser mit Typerkennung (kein yaml-Modul noetig) |
5 Daemon Worker
| Worker | Intervall | Runs | Erfolg |
|---|---|---|---|
| map | 15 min | 2 | 100% |
| audit | 10 min | 3 | 100% |
| optimize | 15 min | 2 | 100% |
| consolidate | 30 min | 1 | 100% |
| testgaps | 20 min | 1 | 100% |
LiteLLM Proxy
Reverse-Proxy der KI-Modellnamen auf guenstigere Provider mappt. Wer "Claude Sonnet" anfragt, bekommt DeepSeek V3. Wer "Opus" anfragt, bekommt Kimi K2.5. Langfuse-Callbacks loggen jeden Aufruf.
Port: 127.0.0.1:4000 (nur localhost) | Config: /opt/litellm/config.yaml | RAM: 344 MB
7 Model-Mappings
| LiteLLM Name | Echtes Modell | Provider | Zweck |
|---|---|---|---|
| claude-sonnet-4-5 | deepseek-chat (V3) | DeepSeek | Standard-Modell fuer Code/Chat |
| claude-haiku-4-5 | deepseek-reasoner (R1) | DeepSeek | Thinking/Reasoning |
| claude-opus-4-5 | kimi-k2.5 | Moonshot (Kimi) | Grosser Kontext |
| deepseek-v3 | deepseek-chat | DeepSeek | Direkt ansprechbar |
| deepseek-r1 | deepseek-reasoner | DeepSeek | Direkt ansprechbar |
| kimi-k2.5 | kimi-k2.5 | Moonshot | Direkt ansprechbar |
| kimi-k2-thinking | kimi-k2-thinking | Moonshot | Kimi Thinking Mode |
MoMoAGI Gateway (:3081)
Express.js Server der die MoMoAGI Desktop-App bedient. Ersetzt das Anthropic-Backend (claude.ai) und streamt Antworten per SSE im Anthropic-Wire-Format.
Pfad: /opt/momoagi/gateway/src/ | Protokoll: SSE Streaming
Model-Mapping (Desktop-App)
| Desktop-App zeigt | Gateway mappt auf | Echtes Backend |
|---|---|---|
| claude-sonnet-4-* | Kimi K2.5 (Hauptmodell) | via LiteLLM |
| claude-opus-4-* | Kimi K2.5 (via opus) | via LiteLLM |
| claude-haiku-3-5-* | DeepSeek V3.2 (Subagent) | via LiteLLM |
API-Keys gesichert: verschoben in .env.claude (chmod 600).
Security
Port-Bindings (Risikoanalyse)
| Port | Service | Binding | Risiko |
|---|---|---|---|
| 9100 | node-exporter | 0.0.0.0 | System-Metriken oeffentlich einsehbar |
| 9121 | redis-exporter | 0.0.0.0 | Redis-Metriken oeffentlich einsehbar |
| 9187 | postgres-exporter | 0.0.0.0 | Postgres-Metriken oeffentlich einsehbar |
| 5433 | hatchet-postgres | 0.0.0.0 | Datenbank oeffentlich erreichbar |
| 6380 | redis-replica | 0.0.0.0 | Redis-Kopie oeffentlich erreichbar |
| 26379 | redis-sentinel | 0.0.0.0 | Redis HA oeffentlich erreichbar |
| 3000/2222 | gitea | 0.0.0.0 | Git-Server ohne nginx TLS |
Empfehlung: Alle Exporter und interne Datenbanken auf 127.0.0.1 umstellen oder per UFW/iptables blockieren.
Sicherheitsmassnahmen (aktiv)
- OK fail2ban: aktiv (sshd jail)
- OK LiteLLM: 127.0.0.1:4000 (nur localhost)
- OK iptables: 13 DROP Regeln (DOCKER-USER Chain)
- OK .env.claude: API Keys gesichert (chmod 600)
- OK Redis: Passwort-Auth aktiv
- OK Qdrant: API-Key erforderlich
- OK Exporter: iptables DROP fuer externe Zugriffe auf 9100/9121/9187
Verbleibende Hinweise
- Langfuse: Container unhealthy (kosmetisch, API funktioniert)
- Docker Swarm Ports offen (2377, 7946) -- unnoetig wenn Swarm nicht genutzt
Operations / Backups
4 taegliche Backup-Scripts
| Script | Cron | Methode | Retention | Letztes Backup |
|---|---|---|---|---|
| backup_postgres.sh | 0 2 * * * | pg_dumpall + gzip + SHA-256 | 14 Tage | 2026-04-06 02:00 (1.3 MB, OK) |
| backup_redis.sh | 15 2 * * * | BGSAVE + RDB Copy + SHA-256 | 14 Tage | 2026-04-06 02:15 (595 KB, OK) |
| backup_qdrant.sh | 30 2 * * * | Snapshot API + tar.gz | 7 Tage | 2026-04-06 02:30 (3.4 MB, OK) |
| backup_config.sh | 45 2 * * * | Config Files + Redis Export | 30 Tage | 2026-04-06 02:45 (850 B, fast leer!) |
Health-Check (alle 5 Minuten)
healthcheck.sh prueft 3 Systemd Services, 10 Docker Container, 3 HTTP Endpoints und den Ruflo Daemon. Bei FAIL wird automatisch neu gestartet.
Systemd Timer
| Timer | Intervall | Funktion |
|---|---|---|
| certbot.timer | 2x taeglich | SSL-Zertifikat-Erneuerung |
| apt-daily.timer | taeglich | APT Package-Listen Update |
| logrotate.timer | taeglich | Log-Rotation |
| fstrim.timer | woechentlich | SSD TRIM |
Verbindungs-Matrix
| # | Von | Nach | Protokoll | Port | Status |
|---|---|---|---|---|---|
| 1 | nginx | MoMoAGI Frontend | HTTP Reverse Proxy | 443 -> 3080 | OK |
| 2 | nginx | gehirn-api | HTTP Reverse Proxy | 443 -> 8000 | OK |
| 3 | nginx | Langfuse | HTTP Reverse Proxy | 443 -> 3100 | OK |
| 4 | nginx | MoMoAGI Gateway | HTTP Reverse Proxy | 443 -> 3081 | OK |
| 5 | Gateway | LiteLLM | HTTP API | 3081 -> 4000 | OK |
| 6 | LiteLLM | DeepSeek API | HTTPS outbound | 4000 -> extern | OK |
| 7 | LiteLLM | Kimi API | HTTPS outbound | 4000 -> extern | OK |
| 8 | LiteLLM | Langfuse | HTTP callback | 4000 -> 3100 | OK |
| 9 | gehirn-api | Redis | TCP (Docker-Netz) | 8000 -> 6379 | OK |
| 10 | gehirn-api | SQLite (omega.db) | File I/O | lokal | OK |
| 11 | gehirn-api | Qdrant | HTTP | 8000 -> 6333 | Verfuegbar |
| 12 | Langfuse | langfuse-db | TCP Postgres | intern 5432 | OK |
| 13 | Prometheus | Self-scrape | HTTP | 9090 | OK |
| 14 | Grafana | Prometheus | HTTP query | 3003 -> 9090 | OK |
| 15 | Redis Sentinel | Redis Primary+Replica | TCP | 26379 -> 6379/6380 | OK |
| 16 | free-code | Anthropic API | HTTPS outbound | extern | OK |
| 17 | free-code | gehirn-api | HTTP (PostToolUse) | localhost:8000 | Konfiguriert |
| 18 | free-code | Ruflo MCP | stdio | subprocess | OK |
| 19 | free-code | Whisper STT | HTTP | localhost:9000 | Konfiguriert |
Known Issues
| Status | Problem | Detail | Fix / Loesung |
|---|---|---|---|
| GEFIXT | free-code Auth-Fehler | "Not logged in" -- CLI brauchte Auth, -p Mode blockiert | --dangerously-skip-permissions + start-user.sh (sudo -u claude) |
| GEFIXT | API-Keys im Klartext | Anthropic-Key in start-user.sh/start.sh, DeepSeek/Kimi in Gateway config.js | Verschoben in .env.claude (chmod 600) |
| GEFIXT | Prometheus: nur Self-Scrape | 3 Exporter liefen, aber nicht als Targets konfiguriert | 3 Exporter als Scrape-Targets konfiguriert |
| GEFIXT | Langfuse: unhealthy | Healthcheck im Container fehlerhaft (wget auf falscher Adresse) | API funktioniert OK, kosmetisches Docker-Flag |
| GEFIXT | claude-flow-daemon FAIL-Loop | Faellt alle 5 Min, Health-Check restartet, systemd erkennt nicht | systemd disabled, @reboot cron stattdessen |
| GEFIXT | backup_config.sh fast leer | openclaw-workers Container fehlt, 13/14 Quellpfade existieren nicht | In crontab deaktiviert |
| GEFIXT | Exporter auf 0.0.0.0 | node-exporter, redis-exporter, postgres-exporter oeffentlich | iptables DOCKER-USER DROP Regeln gesetzt |
| GEFIXT | Grafana Admin-PW unbekannt | Default admin:admin funktioniert nicht | Passwort auf momoagi-grafana-2026 gesetzt |
| OFFEN | Langfuse: 0 Traces | free-code geht direkt an Anthropic API (nicht durch LiteLLM) | Architektur-Entscheidung: LiteLLM nur fuer Gateway, nicht fuer free-code |
| INFO | Ruflo Repo-CLI | npx claude-flow im Repo: ERR_MODULE_NOT_FOUND (dist/ nie gebaut) | Global v3.5.48 funktioniert, Repo-Version nicht gebaut |
| INFO | Port 3001 | Ruflo MCP-Bridge Prozess | Kein Zombie, bewusst laufend |