Übersicht ethisch vertretbarer KI-Modelle

Diese Liste zeigt Modelle, die auf Transparenz setzen: Offene Datensätze, permissive Lizenzen und der Verzicht auf urheberrechtlich geschütztes Material ohne Zustimmung.

Kategorie	Empfehlung & Link	Warum es "sauber" ist
Text	OLMo (Allen Institute)	Vollständige Transparenz: Nicht nur die Gewichte, sondern der gesamte Datensatz (Dolma) und der Trainingscode sind offen zugänglich.
Programmierung	StarCoder2	Trainiert auf "The Stack v2", das nur Code mit permissiven Lizenzen enthält und Opt-out bietet.
Bilder	Mitsua Diffusion	Explizit nur auf Public Domain- und CC0-lizenzierten Bildern trainiert. Keine geschützte Kunst ohne Konsens.
Audio/Musik	Stable Audio Open	Nutzt lizenzierte Daten von AudioSparx und Freesound für rechtliche Sicherheit.
Sprachausgabe	Piper (TTS)	Basiert auf Mozilla Common Voice (freiwillig gespendete Sprachdaten).

Für meine Projekte nutze ich die oben aufgefundenen Modelle, um Urheberrechtsinhaber zu respektieren und zu zeigen, was mit diesen Alternativen zu kommerziellen Modellen möglich ist.