Apertus: Ein vollständig offenes, transparentes und mehrsprachiges Sprachmodell
Die EPFL, die ETH Zürich und das Schweizerische Supercomputing-Zentrum CSCS haben am 2. September Apertus ver?ffentlicht: das erste umfangreiche, offene und mehrsprachige Sprachmodell aus der Schweiz. Damit setzen sie einen Meilenstein für eine transparente und vielf?ltige generative KI.?
- Vorlesen
- Anzahl der Kommentare

In Kürze
- Forschende der EPFL, ETH Zürich und des CSCS haben mit Apertus ein vollst?ndig offenes Large Language Model (LLM) entwickelt – eines der gr?ssten seiner Art.
- Als Basistechnologie erm?glicht Apertus weitere Innovationen und st?rkt die KI-Expertise in Forschung, Gesellschaft und Wirtschaft, indem andere darauf aufbauen k?nnen.
- Apertus ist derzeit über den strategischen Partner Swisscom, die KI-Plattform Hugging Face und beim Netzwerk Public AI verfügbar.
Im Juli haben EPFL, ETH Zürich und CSCS bekanntgegeben, dass sie gemeinsam ein grosses Sprachmodell (Large Language Model, LLM) entwickeln. Nun ist dieses Modell verfügbar. Es dient als Grundlage, auf der Entwickler:innen und Organisationen künftige Anwendungen – wie Chatbots, ?bersetzungssysteme oder digitale Lernwerkzeuge – aufbauen k?nnen.
Der Name des Modells ist Apertus – lateinisch für offen. Er betont ein wesentliches Merkmal des Modells: Der gesamte Entwicklungsprozess, einschliesslich Architektur, Modellgewichten sowie Trainingsdaten und -methoden, ist frei zug?nglich und umfassend dokumentiert.
Für KI-Forschende, Fachpersonen und erfahrene Anwender:innen ist das Modell entweder über die strategische Partnerin Swisscom zug?nglich oder sie k?nnen es über die Plattform Hugging Face – eine Plattform für KI-Modelle und -Anwendungen – herunterladen und für eigene Projekte einsetzen.
Apertus steht in zwei frei verfügbaren Modellgr?ssen bereit – mit 8 Milliarden sowie mit 70 Milliarden Parametern. Die kleinere Variante eignet sich besonders für eine individuelle Nutzung. Beide Modelle werden unter einer permissiven, das heisst nutzungsfreundlichen Open-Source-Lizenz ver?ffentlicht. Diese l?sst einen Gebrauch in Bildung und Forschung ebenso zu wie breite gesellschaftliche und wirtschaftliche Anwendungen.
Ein vollst?ndig offenes LLM
Als vollst?ndig offenes Sprachmodell erm?glicht es Apertus Forschenden, Fachpersonen und erfahrenen Anwender:innen, dass sie auf dem Modell aufbauen, es an ihre individuellen Bedürfnisse anpassen sowie jeden Teil des Trainingsprozesses transparent nachvollziehen k?nnen. Damit unterscheidet sich Apertus deutlich von Modellen, bei denen nur ausgew?hlte Komponenten zug?nglich sind.
?Mit dieser Ver?ffentlichung m?chten wir ein Musterbeispiel dafür geben, wie sich ein vertrauenswürdiges, souver?nes und inklusives KI-Modell bauen l?sst?, sagt Martin Jaggi, Professor für Maschinelles Lernen an der EPFL und Mitglied des Steering Committees der Swiss AI Initiative. Das Modell wird regelm?ssig vom Entwicklungsteam aktualisiert, dem spezialisierte Ingenieur:innen sowie zahlreiche Forschende von CSCS, ETH Zürich und EPFL angeh?ren.
Impulsgeber für Innovationen
Mit ihrem offenen Ansatz betreten EPFL, ETH Zürich und CSCS Neuland. ?Apertus ist kein klassischer Technologietransfer von der Forschung zum Produkt. Vielmehr verstehen wir das Modell als Impulsgeber für Innovationen und als Mittel zum Ausbau der KI-Expertise in Forschung, Gesellschaft und Wirtschaft?, sagt Thomas Schulthess, Direktor des CSCS und Professor an der ETH Zürich. Ihrer Tradition folgend stellen EPFL, ETH Zürich und CSCS Basis-Technologie und Infrastruktur bereit, um Innovationen in der Wirtschaft zu erm?glichen.
Apertus wurde auf 15 Billionen Worteinheiten (engl. Tokens) aus über 1000 Sprachen trainiert – 40 Prozent der Daten sind nicht-englischsprachig . Damit umfasst Apertus zahlreiche Sprachen, die in bisherigen LLMs untervertreten sind, darunter Schweizerdeutsch, R?toromanisch und viele andere.
?Apertus wurde als Beitrag zum Gemeinwohl entwickelt. Es geh?rt zu den wenigen vollst?ndig offenen LLMs in dieser Gr?ssenordnung und ist das erste seiner Art, das Mehrsprachigkeit, Transparenz und Compliance als grundlegende Designprinzipien vereint?, sagt Imanol Schlag, technischer Leiter des LLM-Projekts und Research Scientist an der ETH Zürich.
?Swisscom ist stolz darauf, zu den ersten zu geh?ren, die dieses wegweisende Sprachmodell einsetzen – auf unserer souver?nen Swiss AI Platform. Als strategische Partnerin der Swiss AI Initiative unterstützen wir den Zugang zu Apertus w?hrend der Swiss-AI-Weeks. Damit unterstreichen wir unser Engagement für ein sicheres und verantwortungsvolles KI-?kosystem, das dem Gemeinwohl dient und die digitale Souver?nit?t der Schweiz st?rkt?, sagt Daniel Dobos, Research Director bei Swisscom.
Zug?nglichkeit von Apertus
Die Einrichtung von Apertus gestaltet sich für Fachpersonen und versierte Nutzer:innen unkompliziert. Für den praktischen Einsatz sind jedoch zus?tzliche Komponenten wie Server, Cloud-Infrastruktur oder spezifische Benutzeroberfl?chen erforderlich. Die bevorstehenden Hackathons im Rahmen der Swiss-AI-Weeks bieten Entwickler:innen erstmals die Gelegenheit, Apertus praktisch auszuprobieren, seine Leistungsf?higkeit zu testen und Feedback für die Weiterentwicklung zukünftiger Versionen zu geben.
Swisscom stellt den Hackathon-Teilnehmenden eine speziell entwickelte Schnittstelle zur Verfügung, die das Arbeiten mit dem Modell erleichtert. Ab sofort haben Gesch?ftskunden von Swisscom Zugriff auf das Apertus-Modell über die souver?ne Swiss AI Platform von Swisscom.
Für Personen ausserhalb der Schweiz wird Apertus ausserdem über die Public AI Inference Utility zug?nglich sein – als Teil einer globalen Bewegung für ?ffentliche KI.
?Derzeit ist Apertus das führende ?ffentliche KI-Modell: ein Modell, entwickelt von ?ffentlichen Institutionen im Dienste des Gemeinwohls. Es ist der bislang st?rkste Beweis dafür, dass Künstliche Intelligenz eine ?ffentliche Infrastruktur sein kann – wie Autobahnen, Wasserleitungen oder Stromnetze?, sagt Joshua Tan, Hauptverantwortlicher der Public AI Inference Utility.
Transparenz und Compliance
Apertus setzt ganz auf Transparenz – um die Reproduzierbarkeit des Trainingsprozesses zu gew?hrleisten. Neben dem Modell selbst hat das Forschungsteam verschiedene Unterlagen ver?ffentlicht: eine umfassende Dokumentation, den Quellcode des Trainingsprozesses sowie der verwendeten Datens?tze, die Modellgewichte inklusive der Zwischenst?nde des Trainingsprozesses (sogenannter ?Intermediate Checkpoints?) – und alles unter einer permissiven, nutzungsfreundlichen Open-Source-Lizenz, die auch kommerzielle Nutzung erlaubt. Die Nutzungsbedingungen sind auf Hugging Face abrufbar.
Die Entwicklung von Apertus erfolgte unter Berücksichtigung der Schweizer Datenschutzgesetze, des Schweizer Urheberrechts und der Transparenzanforderungen der EU KI-Verordnung (EU AI Act). Ein besonderes Augenmerk wurde auf Datenintegrit?t und ethische Standards gelegt: Das Trainingskorpus beruht ausschliesslich auf Daten, die ?ffentlich zug?nglich sind. Diese wurden gefiltert, um maschinenlesbare Opt-out-Hinweise von Websites – auch rückwirkend – zu respektieren sowie personenbezogene Daten zu entfernen und andere unerwünschte Inhalte vor Beginn des Trainings auszuschliessen.
Am Anfang einer langen Reise
?Apertus zeigt, dass generative KI sowohl leistungsf?hig als auch offen sein kann?, sagt Antoine Bosselut, Professor und Leiter des Natural Language Processing Laboratory der EPFL und Co-Leiter der Swiss AI Initiative. ?Die Ver?ffentlichung von Apertus ist kein Endpunkt, sondern der Beginn einer Reise – ein langfristiges Engagement für offene, vertrauenswürdige und souver?ne KI-Grundlagen für das weltweite Gemeinwohl. Wir freuen uns darauf zu sehen, wie Entwickler:innen beim Hackathon der Swiss-AI-Weeks mit dem Modell arbeiten. Ihre Kreativit?t und ihr Feedback helfen uns dabei, zukünftige Versionen des Modells zu verbessern.?
Zukünftige Versionen sollen die Modellfamilie erweitern, die Effizienz steigern und spezifische Anpassungen für Fachbereiche wie Recht, Gesundheit oder Bildung erm?glichen. Sie sollen auch neue Funktionen integrieren und zugleich die hohen Anforderungen an die Transparenz wahren.
?ber Apertus und die Swiss AI Initiative
Apertus wurde im Rahmen der Swiss AI Initiative entwickelt, die von der EPFL und der ETH Zürich geleitet wird. Das Modell ist das Ergebnis eines gemeinsamen Efforts von Forschenden, Ingenieur:innen sowie Studierenden aus der ganzen Schweiz – unterstützt durch die technische Infrastruktur und das Know-how des Schweizerischen Supercomputing-Zentrums CSCS.
Diese gebündelte Expertise aus verschiedenen Institutionen und Disziplinen hat die Entwicklung von Apertus erm?glicht.
?ber die Finanzierung und strategische Partnerschaft
Die Entwicklung des Large Language Models sowie die Forschungsarbeiten zu themenspezifischen Basismodellen werden durch eine Investition von über 10 Millionen GPU-Stunden auf dem Supercomputer Alps des Swiss National Supercomputing Centre (CSCS) sowie durch den ETH-Rat finanziert – das strategische Führungs- und Aufsichtsorgan des ETH-Bereichs, zu dem ETH Zürich, EPFL, WSL, PSI, Empa und Eawag geh?ren. Diese Finanzierung wird erg?nzt durch Beitr?ge strategischer Partner, namentlich Swisscom, der gr?ssten Telekommunikationsanbieterin der Schweiz.
?ber die Swiss-AI-Weeks
Die externe Seite Swiss-AI-Weeks sind eine gemeinsame Initiative mit dem Ziel, die wegweisende KI-Forschung in der Schweiz in gesellschaftlichen und wirtschaftlichen Nutzen zu überführen. Durch Hackathons, Fachveranstaltungen, ?ffentliche Dialogformate und die F?rderung von Start-ups vernetzt die Initiative Forschende, Entwickler:innen, Unternehmer:innen und Bürger:innen rund um ein gemeinsames Ziel: den ethischen, offenen und vertrauenswürdigen Einsatz von Künstlicher Intelligenz zu gestalten.
Im Zentrum steht das erste quelloffene Large Language Model der Schweiz – entwickelt im Einklang mit Schweizer Werten wie Transparenz, Verantwortung und Mehrsprachigkeit. Die Swiss-AI-Weeks setzen einen kollektiven Impuls für eine verantwortungsvolle Anwendung von KI – dezentral, praxisnah und im Sinne des Gemeinwohls.
Zu den Initiator:innen der Initiative z?hlen das EPFL AI Center, das ETH AI Center, Swisscom, Impact Hub Switzerland, Kickstart Innovation, Panter und Wildcard Media.