LAION ist eine gemeinnützige Organisation, die Datensätze, Werkzeuge und Modelle für die Forschung zum maschinellen Lernen bereitstellt. Sie setzen sich für eine offene öffentliche Bildung ein und wollen durch die Wiederverwendung bestehender Datensätze und Modelle einen umweltfreundlichen Umgang mit Ressourcen fördern. Sie haben eine Community auf Discord und arbeiten daran, eine Open-Source-Version von ChatGPT zu entwickeln. Sie haben mehrere Datensätze zur Verfügung, darunter LAION-400M, der 400 Millionen englische Bild-Text-Paare enthält, und LAION-5B, ein Datensatz mit 5,85 Milliarden mehrsprachigen Bild-Text-Paaren. Sie verfügen auch über ein großes CLIP-Vision-Transformer-Modell und eine Teilmenge von LAION-5B, die nach ästhetisch ansprechenden Bildern gefiltert wurde.