Lokale KI: Was das ist und was sie kann

Datensparsame Nutzung:Was ist und was kann lokale KI?

von Stefan Mey

30.06.2026 | 15:39

|

KI privat betreiben, sodass sie keine Daten nach draußen schickt? Das geht, wenn auch mit Einschränkungen. Einige KI-Entwickler verschenken ihre Modelle ganz oder teilweise.

Interview mit Daniel Abbou vom KI-Bundesverband — Wie groß die Abhängigkeit von amerikanischen KI-Unternehmen ist, zeigt sich am Beispiel von Anthropic. KI-Experte Daniel Abbou spricht sich deshalb für eine Förderung europäischer Modelle aus.
16.06.2026 | 3:18 min

Konventionelle KI kann stets mithorchen: Alle Fragen, die man eingibt, landen in großen Clouds - den Rechenzentren der Entwickler. Läuft Künstliche Intelligenz nur lokal auf dem eigenen Gerät, besteht das Problem nicht. Damit das möglich ist, bräuchte es allerdings frei zugängliche KI-Modelle, die sich einfach so herunterladen und installieren lassen, vergleichbar mit einem nichtkommerziellen Browser oder Schreibprogramm.

KI-Modelle zum Herunterladen

Und tatsächlich gibt es verschiedene frei nutzbare Modelle. Einige der großen KI-Entwickler geben die sogenannten Gewichte frei - die Kerne von KI-Modellen. Man könnte sagen: Sie verschenken ihre KI.

Gewichte sind Milliarden von Zahlen, die für sich genommen nichts bedeuten. In einem komplizierten mathematischen Zusammenspiel sorgen sie aber dafür, dass KI (mehr oder weniger gut) Quantenphysik erklären, Gedichte schreiben, Alltagsfragen beantworten und Bilder erzeugen kann.

Bei der Freigabe von KI gibt es zwei Stufen: Die KI-Entwickler geben nur die Gewichte zur Nutzung frei, dieser Ansatz heißt "Open Weight". Bei "Open Source"-KI hingegen dokumentieren sie auch, wie und mit welchen Daten die KI trainiert wurde, was für zusätzliche Transparenz sorgt.

Mit Einschränkungen kann man deshalb auf dem eigenen Rechner und Smartphone eine ganz private KI-Anwendung betreiben. Man lädt über ein Hilfsprogramm die Gigabyte-großen Modelle herunter - und chattet mit ihnen. Dabei verlassen keine Daten das eigene Gerät. Man muss nicht online sein und die Nutzung ist dauerhaft kostenlos.

Anthropic AI, Symbolbild — Anthropic hat den Zugang zu den KI-Modellen Fable 5 und Mythos 5 blockiert - auf Anweisung der USA. Betroffen sollten nur Ausländer sein, doch die Firma sperrt den Zugang für alle.
13.06.2026 | 3:13 min

Meta gibt Llama frei

Im Sommer 2023 hat der Social-Media-Konzern Meta die Gewichte seines Sprachmodells Llama freigegeben. Man kann Llama deshalb entweder innerhalb von Facebook, WhatsApp und Instagram nutzen - oder alternativ das KI-Modell datensparsam selbst betreiben. Auch das Sprachmodell des französischen KI-Startups Mistral AI ist frei zugänglich.

Andere KI-Entwickler veröffentlichen nicht ihre kompletten Modelle, sondern abgespeckte Versionen unter eigenen Namen: Gemma (von Google), Phi (Microsoft) und GPT-OSS (OpenAI). Daneben gibt es frei nutzbare Bildmodelle sowie Transkriptionsmodelle, die Sprache in Text verwandeln.

Ein Prozess in einer Fabrik ist zu sehen. — Deutschland baut zunehmend KI in industrielle Prozesse ein. Warum gerade das für die Wertschöpfung von KI wichtig ist.
28.06.2026 | 1:03 min

Leistung mit Abstrichen

Die Tücke: Handelsübliche Geräte sind meist nur in der Lage, kleinere Modellversionen auszuführen. Bei lokalen KI-Modellen kommt es deshalb zu mehr Halluzinationen und sprachlichen Patzern. Je größer ein Modell ist, desto mehr Weltwissen und sprachliche Fähigkeiten hat es gespeichert. Außerdem arbeitet lokal betriebene KI langsamer.

Trotzdem lässt sich mit lokaler KI im Alltag viel anfangen: Lokale Modelle können Texte übersetzen und korrigieren und Witze erzählen. Man kann mit ihnen über den Sinn des Lebens plaudern, sich Alltags-Tipps holen, Audioaufnahmen transkribieren und - je nach verfügbarer Hardware - auch Bilder erzeugen.

Zur Auswahl stehen mehr als zehn lokal nutzbare Sprachmodelle. Die wichtigsten sind: Llama (von Meta), Mistral (Mistral AI, aus Frankreich) sowie Qwen (Alibaba, aus China). Als abgespeckte Versionen verfügbar sind: Gemma (Google), GPT-OSS (OpenAI) und Phi (Microsoft).

Als erstes installiert man ein kostenloses Hilfsprogramm, auf PCs etwa LM Studio (besonders einsteigerfreundlich) oder Ollama, auf Smartphones die App PocketPal AI. Dann lädt man über eine Auswahloption im Programm ein Modell oder mehrere Modelle herunter und chattet damit.

Bei der Nutzung von lokaler Sprach-KI muss man experimentieren und tolerant sein: Manche Sachen funktionieren trotz der kleinen Modellversion. Manchmal aber produziert lokale Sprach-KI inhaltlichen oder sprachlichen Unsinn. In jedem Fall ist die Fehlerquote höher und die Informationsdichte niedriger als bei der Nutzung von Cloud-KI. Gute Ergebnisse auch in einer kleinen Version liefert meist das abgespeckte Google-Modell Gemma 3 4B.

Meist gut funktionieren einfache Wissensfragen (etwa: "Was weißt du über Paris?"), Alltagsfragen ("Schlag mir Small-Talk-Themen vor.") und Plaudereien ("Was ist der Sinn des Lebens?"). Außerdem kann man Texte übersetzen lassen. Und man kann Textdokumente durchsuchen und zusammenfassen lassen.

Das meist genutzte offene Transkriptionsmodell ist Whisper von OpenAI, auf Platz zwei folgt Parakeet vom Grafik- und KI-Chiphersteller Nvidia. Das nichtkommerzielle PC-Programm NoScribe basiert auf Whisper. Man wählt eine Audiodatei aus und kann sich zwischen zwei Modellversionen entscheiden: precise (extrem genau, aber recht langsam) und fast (etwas ungenauer, aber schneller). Auch das Hilfsprogramm Vibe nutzt Whisper von OpenAI.

Transkriptions-KI wandelt Sprachaufnahmen in geschriebenen Text um. Das kann im privaten Bereich praktisch sein, wenn man etwa eine längere E-Mail oder einen Tagebuch-Eintrag einspricht - und die sensiblen Inhalte nicht in eine Cloud hochladen möchte. Die Genauigkeit von Whisper ist sehr hoch. Das Modell beherrscht 99 Sprachen und kommt auch mit Dialekten gut zurecht. Dafür arbeitet Whisper in NoScribe langsam und benötigt etwa genauso lange, wie die Sprachaufnahme läuft. Die Modelle erkennen problemlos Sätze, aber keine Absätze. Das Transkript wird als ein großer Text ausgegeben. Vibe ist schneller, aber weniger genau.

Lokale Bildmodelle sind unter anderem Stable Diffusion (vom Start-up Stability.ai) und Flux (Black Forest Labs). Das freie Modell von Flux kann unbegrenzt genutzt werden, auch kommerziell. Bei Stable Diffusion gilt das nur bis zu einem Jahresumsatz von einer Million US-Dollar.

Die Hilfsprogramme Automatic1111, Comfy, EasyDiffusion nutzen den auf dem PC installierten Browser als Programmoberfläche. Die Installation der besonders funktionsreichen Hilfsprogramme Automatic1111 und Comfy ist sehr kompliziert. Für lokale Bild-KI empfiehlt sich ein Gaming- oder KI-Laptop mit eigenständiger Grafikkarte oder ein Mac der neueren Generation. Im Netz gibt es verschiedene detaillierte Anleitungen zur Installation und Nutzung von lokaler Bild-KI.

Auf handelsüblichen Laptops ohne eigenständige Grafikkarte ist die Bilderzeugung quälend langsam (bis zu zehn Minuten oder mehr.) Gaming-Laptops, KI-Laptops oder neuere Macs können Bilder in wenigen Sekunden erzeugen. Die Qualität der Bilder ist hoch – allerdings nicht von Anfang an. Man muss lernen, sehr genau zu prompten (am besten auf Englisch) und sich mit den Einstellungen vertraut machen.

Digitale Schenkökonomie

Insgesamt gibt es mehr als zehn frei nutzbare Sprachmodelle. Wieso entscheiden sich Big-Tech-Konzerne und KI-Startups überhaupt, ihre teuren Modelle freizugeben?

Dirk Riehle wundert das nicht. Der Informatikprofessor an der Friedrich-Alexander-Universität Erlangen-Nürnberg weiß, dass die Öffnung eines Digitalprodukts eine funktionierende Geschäftsstrategie sein kann:

Man hat als IT-Unternehmen ein gutes Produkt. Partiell wird es geöffnet, sodass Anwender kostenfrei Wert abschöpfen können. Aber sie erhalten noch mehr Wert, wenn sie auf die Bezahlversion wechseln.

Dirk Riehle, Informatikprofessor

Konkret könne das beispielsweise so aussehen: Andere Unternehmen nutzen am Anfang das frei verfügbare, kleine Google-Sprachmodell Gemma. Wenn sie die Möglichkeiten der Google-KI aber maximal ausschöpfen wollen, entscheiden sie sich vielleicht eines Tages doch für das kostenpflichtige Spitzenmodell Gemini.

Thüringens Ministerpräsident Mario Voigt (CDU) — Thüringens Ministerpräsident Mario Voigt (CDU) steht in der Kritik, weil er Reden und Gastbeiträge mit Hilfe von KI erstellt haben soll. Bei was darf die KI wie stark helfen?
16.06.2026 | 3:04 min

Win-Win-Situation für Meta

Beim Meta-Konzern hingegen vermutet er eine andere Logik: "Meta hat gar nicht vor, mit seiner KI im großen Stil direkt Geld zu verdienen. Meta macht sein Geld mit Werbung." Die Öffnung der Llama-KI könne dabei helfen, das Modell zu verbessern - etwa weil externe Nutzer wertvolles Feedback geben oder neue Anwendungen für das Modell entwickeln. Das wiederum komme Meta zugute, da der Konzern Llama in seine Social-Media-Plattformen einbaut. Deswegen gelte: "Wenn die Modelle aufgrund der Öffnung besser werden, verdient Meta mehr Geld."

Wichtiger Hinweis in eigener Sache

Wer bei Google etwas sucht, bekommt neben den Suchergebnissen auch eine Box mit Schlagzeilen angezeigt.

Mit ZDFheute als hinterlegter Quelle bekommen Sie unsere Inhalte häufiger in die Schlagzeilen-Box gespielt - geprüfte Inhalte, direkt in Ihrem Überblick.

→ Hier ZDFheute als bevorzugte Quelle einstellen.

Über dieses Thema berichtete ZDFheute Xpress am 16.06.2026 im Beitrag "KI-Experte: Aufgeben kann nicht der Anspruch sein'" um 16:17 Uhr.

Themen

Künstliche Intelligenz Meta Google

Mehr zum Thema Künstliche Intelligenz

KI in der deutschen Industrie:Warum die Fabrik wichtiger sein könnte als der Chatbot
von Arlette Geburtig
mit Video1:03
Freibäder rüsten technisch auf :Wie Künstliche Intelligenz am Beckenrand Leben retten soll
von Malin Ihlau
mit Video2:37
Hype um Künstliche Intelligenz:KI-Riesen vor Börsengang: Erst Boom, dann Crash?
von Silas Thelen
mit Video27:26
Rechenleistung für KI:SpaceX schließt Milliarden-Deal mit Google ab
mit Video6:28