From 6761a73364092cd381882e527ab08a35ef764bc7 Mon Sep 17 00:00:00 2001 From: Oliver Hofmann Date: Fri, 8 May 2026 09:25:44 +0200 Subject: [PATCH] Add /api/ps example to Kurzanleitung --- KURZANLEITUNG.md | 18 ++++++++++++++++++ 1 file changed, 18 insertions(+) diff --git a/KURZANLEITUNG.md b/KURZANLEITUNG.md index 27958eb..2381ef5 100644 --- a/KURZANLEITUNG.md +++ b/KURZANLEITUNG.md @@ -86,6 +86,24 @@ for m in models.data: --- +## Aktuell geladenes Modell abfragen + +Da immer nur ein Modell gleichzeitig im Speicher sein kann, lässt sich mit folgendem Aufruf prüfen, welches Modell gerade aktiv ist: + +```python +import httpx + +r = httpx.get( + "http://141.75.33.244:8000/api/ps", + headers={"Authorization": "Bearer sk-..."} +) +print(r.json()) +``` + +Die Antwort enthält Modellname, Größe und wie lange das Modell noch im Speicher bleibt. + +--- + ## Empfehlungen zur Nutzung - **Kleines Modell zuerst** (`gemma4:31b` oder `gpt-oss:20b`) – viel schneller, für viele Aufgaben ausreichend.