LLMs lokal verwenden (LM Studio + Open WebUI)

Datum

1. Worum es geht

Ein lokales LLM-Setup bedeutet: Das Sprachmodell läuft auf deinem eigenen Rechner oder Server, nicht bei OpenAI, Anthropic, Google oder einem anderen Cloud-Anbieter. Deine Prompts, Dokumente und Tests verlassen das System nicht, solange du keine externen APIs einbindest.

Eine sinnvolle Kombination ist:

LM Studio als lokale Modell-Laufzeit
Open WebUI als ChatGPT-ähnliche Weboberfläche

LM Studio lädt und startet lokale Modelle, zum Beispiel Llama, Qwen, Mistral, DeepSeek-Coder-Varianten oder andere Modelle. Open WebUI stellt eine komfortable Oberfläche bereit, mit Chatverlauf, Benutzern, Dokumenten-Chat, Einstellungen und Provider-Verbindungen. Open WebUI unterstützt OpenAI-kompatible APIs und kann deshalb mit LM Studio verbunden werden.

Open WebUI spricht dann nicht direkt „mit dem Modell“, sondern mit dieser API. Genau das macht die Kombination robust: Alles, was OpenAI-kompatibel ist, kann Open WebUI grundsätzlich anbinden.

Programme installieren

LM Studio: Download
Open WebUI Desktop: Download

LM Studio Einstellungen

Nach dem Start siehst du im Wesentlichen drei wichtige Bereiche:

Discover/Search – Modelle suchen und herunterladen
Chat – direkt in LM Studio mit einem Modell chatten
Developer / Local Server – lokalen API-Server starten

Die genaue Oberfläche kann sich ändern, aber das Prinzip bleibt: Modell laden, testen, Server starten.

Ein Modell wählen
LLMs können links im Menü unter „Model Search“ (Ctrl+Shift+M) Modelle suchen und herunterladen. Für den Anfang würde ich nicht direkt das größte Modell nehmen. Starte mit etwas, das zuverlässig läuft.

Gute Einstiegskategorien:

Allgemeiner Chat —> Llama-, Mistral-, Qwen-Instruct-Modelle
Programmieren —> Qwen-Coder, DeepSeek-Coder, CodeQwen, StarCoder-Varianten
Deutsch —> Modelle mit guter multilingualer Leistung, z. B. Qwen oder Llama-Instruct

Server starten

Links im Menüpunkt „Developer“ kann man die heruntergeladenen Modelle laden und einen lokalen API-Server dafür starten.

In den Server-Einstellungen kann man zwischen starten auf 127.0.0.1 oder Netzwerk-IP wechseln (Serve on local Network) wechseln.
Entsprechend wird die API-URL angezeigt:

Verbindung in Open WebUI einrichten

Öffne nach der Installation Open WebUI im Browser (http://localhost:8080) und klicke unten links auf dein Profilbild / Namen und gehe auf Admin-Bereich.
Dort im reiter „Einstellungen“ — > „Verbindungen“, dort fügt man bei OpenAI-API-Verbindungen verwalten eine neue Verbindung hinzu und trägt bei URL die API-URL mit /v1 am Ende ein. Z.B.: http://10.34.219.63:1234/v1.

Des weiteren empfiehlt es sich die Ollama Verbindungen zu deaktivieren sofern kein entsprechendes Model separat eingerichtet wird.

Testen

Sofern ein Modell im LM Studio geladen und der API-Server gestartet wurde sollte Open WebUI eine Verbindung aufbauen können und kann wie andere LLMs auch verwendet werden…

Autor
Kategorien KI, Automatisierung

PRTG Map