Add /api/ps example to Kurzanleitung
This commit is contained in:
parent
0d1ce96c99
commit
6761a73364
@ -86,6 +86,24 @@ for m in models.data:
|
||||
|
||||
---
|
||||
|
||||
## Aktuell geladenes Modell abfragen
|
||||
|
||||
Da immer nur ein Modell gleichzeitig im Speicher sein kann, lässt sich mit folgendem Aufruf prüfen, welches Modell gerade aktiv ist:
|
||||
|
||||
```python
|
||||
import httpx
|
||||
|
||||
r = httpx.get(
|
||||
"http://141.75.33.244:8000/api/ps",
|
||||
headers={"Authorization": "Bearer sk-..."}
|
||||
)
|
||||
print(r.json())
|
||||
```
|
||||
|
||||
Die Antwort enthält Modellname, Größe und wie lange das Modell noch im Speicher bleibt.
|
||||
|
||||
---
|
||||
|
||||
## Empfehlungen zur Nutzung
|
||||
|
||||
- **Kleines Modell zuerst** (`gemma4:31b` oder `gpt-oss:20b`) – viel schneller, für viele Aufgaben ausreichend.
|
||||
|
||||
Loading…
x
Reference in New Issue
Block a user