Swiss National AI Institute uvolnil Apertus, plně otevřený a svobodný vícejazyčný velký jazykový model (LLM) trénovaný na 15 bilionech tokenů ve více než 1 000 jazycích. Na rozdíl od populárních proprietárních modelů, kde mohou uživatelé komunikovat pouze prostřednictvím API nebo hostovaných rozhraní, Apertus poskytuje otevřený přístup k váhám svých modelů, trénovacím datovým sadám, dokumentaci a dokonce i k mezilehlým kontrolním bodům.
Zdrojový kód a všechny tréninkové materiály jsou vydány pod otevřenou licencí Apache, která umožňuje komerční využití. Jelikož je celý tréninkový proces zdokumentován a reprodukovatelný, mohou výzkumníci a kontrolní orgány provádět audit datových zdrojů, ověřovat soulad s právními předpisy na ochranu osobních údajů a kontrolovat, jak byl model trénován,
píšou autoři v oznámení. Vývoj Apertusu navíc výslovně dodržoval švýcarské zákony na ochranu osobních údajů a autorská práva a zahrnoval retroaktivní mechanismy odhlášení, aby respektoval preference datových zdrojů.
Apertus představuje významný posun v oblasti ochrany soukromí. Model využívá pouze veřejně dostupné údaje, které jsou filtrovány tak, aby neobsahovaly osobní informace a respektovaly signály o odmítnutí ze zdrojů obsahu. To je nejen v souladu s nově vznikajícími regulačními rámci, jako je zákon EU o umělé inteligenci, ale také poskytuje konkrétní příklad toho, jak může být umělá inteligence výkonná a zároveň respektovat soukromí.
Podle Imanola Schlaga, technického vedoucího projektu na ETH Zurich, je Apertus „vytvořen pro veřejné blaho“ a je ukázkou toho, jak lze AI nasadit jako veřejnou digitální infrastrukturu.
Apertus je volně dostupný ve dvou velikostech – s 8 miliardami a 70 miliardami parametrů, přičemž menší model je vhodnější pro individuální použití. Oba modely jsou vydány pod licencí Apache, která umožňuje jejich použití ve vzdělávání a výzkumu, stejně jako v širokých společenských a komerčních aplikacích. Model je možné stáhnout nebo vyzkoušet v online chatu.