AI-Toolkit Architektúra – JSON Bus Edition
┌─────────────────────────────┐
│ User CLI │
│ ai [options] [command] │
│ - prompt, -m, -c, -o ... │
└─────────────┬───────────────┘
│
▼
┌─────────────────────────────┐
│ Input Preprocessing │
│ - Pipe / File / Args │
│ - RAG context builder │
│ - Max context calculation │
└─────────────┬───────────────┘
│
▼
┌─────────────────────────────┐
│ JSON Bus Layer │
│ - Standardized JSON format │
│ - Streams CONTENT/REASONING│
│ - TTFT & token metrics │
│ - Event-driven (publish) │
└─────────────┬───────────────┘
│
┌───────┴────────┐
▼ ▼
┌───────────────┐ ┌───────────────┐
│ AI Model │ │ Logger / UI │
│ (llama3, gpt) │ │ - Metrics │
│ - Receives JSON│ │ - JSON log │
│ - Streams back │ │ - TPS, TTFT │
│ chunks │ │ - Cost calc │
└───────────────┘ └───────────────┘
│
▼
┌─────────────────────────────┐
│ Output Processing / Render │
│ - Markdown / Terminal │
│ - Tool call parsing │
│ - JSON bus events │
└─────────────────────────────┘
Tok dát
-
User CLI input → text / súbor / pipe
-
Preprocessing: RAG, systémový prompt, max context
-
JSON Bus publish:
-
každý chunk obsahuje
{content, reasoning, timestamp} -
TTFT a content_len sa pridávajú dynamicky
-
-
AI Model: spracuje JSON, vracia stream
-
Logger / Metrics:
-
zapisuje JSON log s tokeny, TTFT, TPS, cost, context
-
môže byť samostatný subscriber na JSON bus
-
-
Output Renderer: markdown/terminal/fallback file
-
Optional modules (future): monitoring, analytics, external tools
Kľúčové vlastnosti JSON bus architektúry
-
Jednotný formát dát → všetky moduly čítajú a zapisujú rovnaké JSON objekty
-
Modularita → nový modul len subscribuje na bus → žiadny rewrite existujúceho kódu
-
Streaming-friendly → TTFT a partial output sa publikuje v reálnom čase
-
Robustné logovanie → všetky metriky sú vždy dostupné, fallback tokeny zabezpečené
-
RAG-ready → externé knowledge zdroje sa dajú jednoducho prepojiť
-
Analytika a monitoring → JSON bus môže feedovať grafy, dashboards, automatické reporty
Bonus blog tip:
-
Pri vizualizácii ukáž dynamický tok TTFT a token metrics, aby čitatelia videli, že CLI sleduje reálny výkon modelu v reálnom čase.
-
Zdôrazni, že JSON bus umožňuje asynchrónnu prácu s dátami, čo je presne to, čo moderné AI CLI nástroje robia.