Übersicht ethisch vertretbarer KI-Modelle
Diese Liste zeigt Modelle, die auf Transparenz setzen: Offene Datensätze, permissive Lizenzen und der Verzicht auf urheberrechtlich geschütztes Material ohne Zustimmung.
| Kategorie | Empfehlung & Link | Warum es "sauber" ist |
|---|---|---|
| Text | OLMo (Allen Institute) | Vollständige Transparenz: Nicht nur die Gewichte, sondern der gesamte Datensatz (Dolma) und der Trainingscode sind offen zugänglich. |
| Programmierung | StarCoder2 | Trainiert auf "The Stack v2", das nur Code mit permissiven Lizenzen enthält und Opt-out bietet. |
| Bilder | Mitsua Diffusion | Explizit nur auf Public Domain- und CC0-lizenzierten Bildern trainiert. Keine geschützte Kunst ohne Konsens. |
| Audio/Musik | Stable Audio Open | Nutzt lizenzierte Daten von AudioSparx und Freesound für rechtliche Sicherheit. |
| Sprachausgabe | Piper (TTS) | Basiert auf Mozilla Common Voice (freiwillig gespendete Sprachdaten). |
Für meine Projekte nutze ich die oben aufgefundenen Modelle, um Urheberrechtsinhaber zu respektieren und zu zeigen, was mit diesen Alternativen zu kommerziellen Modellen möglich ist.