diff --git a/KURZANLEITUNG.md b/KURZANLEITUNG.md index 27958eb..2381ef5 100644 --- a/KURZANLEITUNG.md +++ b/KURZANLEITUNG.md @@ -86,6 +86,24 @@ for m in models.data: --- +## Aktuell geladenes Modell abfragen + +Da immer nur ein Modell gleichzeitig im Speicher sein kann, lässt sich mit folgendem Aufruf prüfen, welches Modell gerade aktiv ist: + +```python +import httpx + +r = httpx.get( + "http://141.75.33.244:8000/api/ps", + headers={"Authorization": "Bearer sk-..."} +) +print(r.json()) +``` + +Die Antwort enthält Modellname, Größe und wie lange das Modell noch im Speicher bleibt. + +--- + ## Empfehlungen zur Nutzung - **Kleines Modell zuerst** (`gemma4:31b` oder `gpt-oss:20b`) – viel schneller, für viele Aufgaben ausreichend.