Funktionen

Die Runtime ist der Teil,
den du nicht zweimal bauen willst.

Drei Säulen. Jede ist etwas, das Demos schaffen und Production nicht. Wir haben die Production-Hälfte gebaut, damit dein Team das agentische Erlebnis shippen kann.

01 Säule

Erreicht deine Daten

Demo

Antwortet aus öffentlichen Docs.

Production

Liest durch dein Backend — PocketBase, Supabase, dein eigenes Go. MindVM besitzt keine Kopie deiner Daten; der Agent ruft deine APIs per MCP auf, gescoped auf dein Project.

session compose · live ● scoped

// eine Zeile — MindVM scoped die Runtime aufs Project

const session = await mindvm.sessions.create({

agent: "billing-assistant",

});

// Runtime löst aus dem API-Key-Project auf:

memory_store_id: "mem_acme"

secret_vault_id: "vlt_acme"

audit-slice: project="acme-corp"

✓ scoped

Memory + Secrets + Audit leben im Project

Deine DB bleibt deine — Agent liest sie per MCP

Primitive

→ Pro-Project Runtime-State

Ein Project ist die Isolationseinheit. Memory, Secrets und Audit sind automatisch darauf gescoped; du gibst keinen Customer-Ref bei jedem Call mit.

→ MCP-Integration

Exponier dein Backend als MCP-Server; der Agent greift über die Tools, die du veröffentlichst, auf deine Daten zu — gegated durch deine Auth. Referenz-Adapter für PocketBase und Supabase liefert MindVM.

→ Verschlüsselte Secret-Vaults

Pro-Project-Vaults mit Envelope-Encryption. Der Agent liest Provider-Keys / Webhook-Secrets / SaaS-Tokens via secret(name) in der Sandbox. Die Plattform gibt nie Klartext über die Wire zurück.

→ Pro-Project Working Memory

Jedes Project bekommt einen isolierten Memory-Store, den der Agent mit remember() / recall() liest und schreibt. Überlebt das Session-Ende; isoliert von anderen Projects.

02 Säule

Handelt in deiner Project

Demo

Gibt einen String zurück.

Production

Erstattet Beträge, aktualisiert Datensätze, öffnet Tickets — über deine APIs, mit Approval-Flows für brisante Aktionen.

Approval-Queue · pausiert

wartet auf menschliche Freigabe

Der Agent will $847 an customer_4f2a erstatten.

Grund: Bestellung #38291 nie versendet
Policy: §4.2 (über $500 → Human Review)
Project: acme · Auslöser: agent.refund-flow

Primitive

→ Tool-Definitionen

Deklariere deine APIs als Tools. MindVM übernimmt Calling-Loop, Retries und Strukturparsing.

→ Approval-Gates

Jedes Tool kann ab einem Schwellwert menschliche Freigabe verlangen. Agent pausiert; Operator bestätigt; Run läuft weiter.

→ Idempotenz

Jeder Tool-Call trägt einen Key. Retries laden nicht doppelt ab, erstatten nicht doppelt, legen nicht doppelt an.

→ Sandboxed Code-Execution

Wenn das Modell JavaScript schreibt statt Tools aufzurufen, läuft es in einer gehärteten JS-Sandbox — kein Netzwerk, Memory-Cap.

03 Säule

Beurteilbar, nicht Bauchgefühl

Demo

Sieht richtig aus.

Production

Zeigt den JS-Code, den der Agent ausgeführt hat, die aufgerufenen Tools, die berührten Daten. Replay für jeden Turn. Eval-geprüft vor dem Deploy.

replay · turn_19f8e2 ← Schritt → · Scrub

0.0s planner intent klassifizieren

0.4s tool getCustomer(id: "4f2a")

0.9s tool getOrders(customer: "4f2a", limit: 5)

1.3s code computeRefundEligibility(orders, policy)

1.7s tool requestApproval(amount: 847)

— pausiert wartet auf menschliche Freigabe

Primitive

→ Replay für jeden Turn

Klick einen Production-Turn; sieh exakten Plan, Tool-Calls, Modell-Outputs und Daten, die der Agent gesehen hat. Step-by-Step durchgehen.

→ Eval-Suites

Definiere Eval-Fälle als evals/*.json-Dateien in deinem mindvm/-Ordner. Lass sie in CI laufen. Verfolge Regression-Scores pro Deploy.

→ Drift-Erkennung

Sample Production-Traffic, fahr ihn durch deine Evals, alert, wenn die Live-Verteilung vom Eval-Set abweicht.

→ Audit-Log pro Project

Jeder Plan, Tool-Call und Datenzugriff wird pro Project geloggt. Suchbar. Exportierbar. SOC-2-ready.

Auch dabei

Alles andere, was du
vor dem Launch gebaut hättest.

Die langweilige Infrastruktur darunter. Nichts davon ist für sich genommen spannend. Alles ist nötig, um einen Agent vor Kunden zu bringen.

LLM-Gateway

OpenAI-kompatibles /chat/completions auf derselben Provider-Registry, die die Agenten nutzen. Eine MindVM-Rechnung über Agent- und Non-Agent-LLM-Calls. Provider-Abstraktion, Audit, Policy-Gating.

Streaming + Cancellation

Token-by-Token-Streaming mit sauberer Cancellation. Stopp einen 30-Sekunden-Run mitten im Flug, ohne Tool-Calls zu leaken.

Multi-Model-Routing

Schnelle Pfade auf kleine Modelle, harte Fälle auf große. Pro-Project Provider-Auswahl über agent_versions.provider.

Structured Outputs

Schema-validierte JSON-Antworten mit Retries bei Parse-Failures. Das Modell bekommt den Diff und probiert erneut.

Sandboxed agentisches Email

sendEmail() in der Agent-Runtime — MindVM-gemessen oder BYOK gegen deinen Resend- / Postmark- / SES-Key im Secret-Vault.

SDK in Go & TypeScript

First-Class-Clients für beide. Gleiche Oberfläche, gleiche Primitive, gleiche Docs.

Self-Host oder Managed

MindVM in unserer Cloud oder deiner. Gleiche Binary. Gleiche App. Bring-Your-Own-VPC verfügbar.

OpenTelemetry-Traces

Jeder Plan, Tool-Call und Modell-Aufruf emittiert OTel-Spans. Direkt in deinen bestehenden Observability-Stack.

CLI + Terraform

Agenten als Code definieren. Versionieren. Diffen. Rollback. So, wie du den Rest deiner Infra ausrollst.

Lies die Docs — oder installier einfach die CLI.

Drei Befehle — mindvm init, mindvm dev, mindvm deploy — und dein erster Agent läuft.

App öffnen Docs lesen →

Die Runtime ist der Teil, den du nicht zweimal bauen willst.

Erreicht deine Daten

Handelt in deiner Project

Beurteilbar, nicht Bauchgefühl

Alles andere, was duvor dem Launch gebaut hättest.

Lies die Docs — oder installier einfach die CLI.

Die Runtime ist der Teil,
den du nicht zweimal bauen willst.

Alles andere, was du
vor dem Launch gebaut hättest.