Add /api/ps example to Kurzanleitung
This commit is contained in:
parent
0d1ce96c99
commit
6761a73364
@ -86,6 +86,24 @@ for m in models.data:
|
|||||||
|
|
||||||
---
|
---
|
||||||
|
|
||||||
|
## Aktuell geladenes Modell abfragen
|
||||||
|
|
||||||
|
Da immer nur ein Modell gleichzeitig im Speicher sein kann, lässt sich mit folgendem Aufruf prüfen, welches Modell gerade aktiv ist:
|
||||||
|
|
||||||
|
```python
|
||||||
|
import httpx
|
||||||
|
|
||||||
|
r = httpx.get(
|
||||||
|
"http://141.75.33.244:8000/api/ps",
|
||||||
|
headers={"Authorization": "Bearer sk-..."}
|
||||||
|
)
|
||||||
|
print(r.json())
|
||||||
|
```
|
||||||
|
|
||||||
|
Die Antwort enthält Modellname, Größe und wie lange das Modell noch im Speicher bleibt.
|
||||||
|
|
||||||
|
---
|
||||||
|
|
||||||
## Empfehlungen zur Nutzung
|
## Empfehlungen zur Nutzung
|
||||||
|
|
||||||
- **Kleines Modell zuerst** (`gemma4:31b` oder `gpt-oss:20b`) – viel schneller, für viele Aufgaben ausreichend.
|
- **Kleines Modell zuerst** (`gemma4:31b` oder `gpt-oss:20b`) – viel schneller, für viele Aufgaben ausreichend.
|
||||||
|
|||||||
Loading…
x
Reference in New Issue
Block a user