Übersicht ethisch vertretbarer KI-Modelle

Diese Liste zeigt Modelle, die auf Transparenz setzen: Offene Datensätze, permissive Lizenzen und der Verzicht auf urheberrechtlich geschütztes Material ohne Zustimmung.

Kategorie Empfehlung & Link Warum es "sauber" ist
Text OLMo (Allen Institute) Vollständige Transparenz: Nicht nur die Gewichte, sondern der gesamte Datensatz (Dolma) und der Trainingscode sind offen zugänglich.
Programmierung StarCoder2 Trainiert auf "The Stack v2", das nur Code mit permissiven Lizenzen enthält und Opt-out bietet.
Bilder Mitsua Diffusion Explizit nur auf Public Domain- und CC0-lizenzierten Bildern trainiert. Keine geschützte Kunst ohne Konsens.
Audio/Musik Stable Audio Open Nutzt lizenzierte Daten von AudioSparx und Freesound für rechtliche Sicherheit.
Sprachausgabe Piper (TTS) Basiert auf Mozilla Common Voice (freiwillig gespendete Sprachdaten).

Für meine Projekte nutze ich die oben aufgefundenen Modelle, um Urheberrechtsinhaber zu respektieren und zu zeigen, was mit diesen Alternativen zu kommerziellen Modellen möglich ist.