Apple выпускает модели искусственного интеллекта с открытым исходным кодом, которые работают на устройстве

Сегодня Apple выпустила несколько моделей больших языков (LLM) с открытым исходным кодом, которые предназначены для работы на устройстве, а не через облачные серверы. Программы LLM, называемые OpenELM (эффективные языковые модели с открытым исходным кодом), доступны на концентратор «Обнимающее лицо»сообщество для обмена кодом искусственного интеллекта.

  Мы в Telegram

Функция Siri, оптимизированная для Apple Silicon AI
Как указано в официальном документе [PDF]Всего существует восемь моделей OpenELM, четыре из которых были предварительно обучены с использованием библиотеки CoreNet, а также четыре модели, настроенные с помощью инструкций. Apple использует стратегию послойного масштабирования, направленную на повышение точности и эффективности.

Apple предоставила код, журналы обучения и несколько версий, а не только окончательную обученную модель, и исследователи, стоящие за проектом, надеются, что это приведет к более быстрому прогрессу и «более заслуживающим доверия результатам» в области искусственного интеллекта на естественном языке.

OpenELM, современная модель открытого языка. OpenELM использует стратегию послойного масштабирования для эффективного распределения параметров внутри каждого уровня модели трансформатора, что приводит к повышению точности. Например, при бюджете параметров примерно в один миллиард параметров OpenELM демонстрирует улучшение точности на 2,36% по сравнению с OLMo, при этом требуя в 2 раза меньше токенов предварительного обучения.

В отличие от прежних практик, которые предоставляют только веса модели и код вывода, а также предварительное обучение на частных наборах данных, наша версия включает в себя полную структуру для обучения и оценки языковой модели на общедоступных наборах данных, включая журналы обучения, несколько контрольных точек и предварительные конфигурации обучения.

Apple заявляет, что выпускает модели OpenELM, чтобы «расширить возможности и обогатить открытое исследовательское сообщество» новейшими языковыми моделями. Совместное использование моделей с открытым исходным кодом дает исследователям возможность исследовать риски, данные и предвзятости моделей. Разработчики и компании могут использовать модели как есть или вносить изменения.


Открытый обмен информацией стал для Apple важным инструментом для привлечения лучших инженеров, ученых и экспертов, поскольку он предоставляет возможности для исследовательских работ, которые обычно не могли быть опубликованы в соответствии с секретной политикой Apple.

Apple еще не реализовала подобные возможности искусственного интеллекта на своих устройствах, но ожидается, что iOS 18 будет включать в себя ряд новых функций искусственного интеллекта, и, по слухам, Apple планирует запускать свои большие языковые модели на устройствах в целях конфиденциальности.

Нажмите здесь, чтобы узнать больше новостей


Leave a Comment

Your email address will not be published. Required fields are marked *