AI OS Layer v 1.63 — Release Notes
Overview
AI OS Layer v2 prináša plne funkčný nový runtime model založený na capability dispatch, workflow orchestration a event-driven execution. Systém je teraz konzistentný naprieč LLM, STT a TTS, s jednotným execution flow.
Core Architecture
Unified Runtime
- Zavedený nový execution model:
events.jsonlako source of truthstate.jsonako snapshot
- Deterministický reduce pipeline (
event → state) - Oddelenie:
- planning (workflow)
- execution (runtime)
- capabilities (LLM/STT/TTS/tools)
Capability Layer
- Štandardizovaný dispatch cez:
dispatch_capability
- Implementované capability typy:
- LLM (stable)
- STT (ported)
- TTS (ported)
Workflow System
- Zavedený plnohodnotný workflow engine:
- planner → scheduler → runner
- Podporované workflows:
dictate(audio → text)audio_summaryvoice(STT → LLM → TTS)speak(text → audio)
- Automatická detekcia execution mode:
- text vs audio vstupy
- routing do správneho workflow
Audio Stack
Recording
ai micako entrypoint pre audio interakciu- VAD (voice activity detection)
- Loop režim
- Playback integrácia
STT / TTS
- Portované do nového capability runtime
- Napojené na workflow systém
- Oddelené od recording vrstvy (čistý kontrakt)
Tool Runtime
- Oddelený tool execution layer
- Podpora:
cat,ls,grep,find,write_file, atď.
- Jednokrokový model:
- 1 step = 1 tool call
Testing
- Runtime test suite stabilný:
- execution reduce
- workflow state roundtrip
- tool dispatch
- Validované:
- deterministický execution
- workflow integrita
CLI
- Konzistentné rozhranie:
ai(core)ag(agent)at(test)aw(watch)
- Nové entrypointy:
ai micai --workflow
Stability
- Core runtime: stabilný
- Workflow engine: stabilný
- Capability dispatch: stabilný
- Audio pipeline: funkčný
⚠️ Known Limitations
- CLI argument parsing pre
mic:ai -p/-m ... micnie je podporené (order-sensitive)
- Audio device selection:
- závislé od ALSA konfigurácie (Linux)
- STT/TTS model selection:
- zatiaľ cez env/config, nie CLI flags
Summary
AI OS Layer v2 dosahuje:
- jednotný execution model
- konzistentný capability systém
- funkčný multimodálny pipeline (text + audio)
- stabilnú základňu pre ďalší vývoj
Next Direction (kandidáti)
- CLI ergonomics (argument parsing fix)
- dynamic device detection (audio)
- capability config unification
- daemon mode (
aw) - richer board/observability