Apple은 6월 WWDC에서 iOS 18의 데뷔를 앞두고 대규모 오픈 소스 언어 모델 세트를 출시했습니다. Apple은 OpenELM이라고 부르는 이러한 요소를 다음과 같이 설명합니다. 열림-원천 시간능률 에게언어 오델.

테스트에서 Apple은 OpenELM이 다른 개방형 언어 모델과 유사한 성능을 제공하지만 교육 데이터가 더 적다고 밝혔습니다.

애플은 다음과 같이 설명합니다.

이를 위해 우리는 진화하는 개방형 언어 모델인 OpenELM을 출시했습니다. OpenELM은 레이어 스케일링 전략을 사용하여 변환기 모델의 각 레이어 내에 매개변수를 효율적으로 할당함으로써 정확성을 향상시킵니다. 예를 들어, 약 10억 개의 매개변수로 구성된 매개변수 예산을 사용하는 OpenELM은 OLMo에 비해 정확도가 2.36% 향상되는 동시에 필요한 사전 훈련 토큰이 2배 더 적습니다.

모델 가중치, 추론 코드, 비공개 데이터세트에 대한 사전 훈련만 제공하는 이전 관행에서 벗어나, 우리 버전에는 훈련 로그, 다중 체크포인트 및 사전 학습을 포함하여 공개적으로 사용 가능한 데이터세트에서 언어 모델을 훈련하고 평가하기 위한 완전한 프레임워크가 포함되어 있습니다. 포인트들. 훈련 구성. 또한 Apple 장치에서 추론 및 미세 조정을 위해 모델을 MLX 라이브러리로 변환하는 코드도 출시합니다. 이 포괄적인 릴리스는 개방형 연구 커뮤니티에 권한을 부여하고 강화하여 미래의 개방형 연구 노력을 위한 길을 닦는 것을 목표로 합니다.

아래 링크에서 자세한 내용을 확인할 수 있습니다.

iOS 18에는 다양한 새로운 AI 기능이 포함될 예정이며, 오늘 출시된 OpenELM은 Apple이 이면에서 진행 중인 최신 작업에 불과합니다.

블룸버그 지난 주 저는 iOS 18의 AI 기능이 기기 전체의 대규모 언어 모델에 의해 구동되어 개인 정보 보호 및 속도 이점을 제공할 것이라고 보고했습니다.

기회를 따르세요: 스레드, 트위터, 인스 타 그램그리고 마스토돈.

FTC: 우리는 수입을 얻기 위해 자동 제휴 링크를 사용합니다. 더.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

You May Also Like

트위치에서 배너를 활성화하여 전화번호로 댓글 작성자를 제한합니다.

그림: 트위치 / 코타쿠 Twitch 사용자는 곧 누가 채팅에 참여할 수 있는지…

CRKD Nitro Deck 리뷰: 기능이 가득한 대규모 스위치 액세서리

드리프트 방지 스틱 및 기타 세부 사항이 포함되어 있지만 그 과정에서 약간의…

Google Pixel 7 Pro가 사전 출시 언박싱 비디오에 등장한다고 주장

차세대 Google Pixel 7 Pro로 보이는 것이 등장했습니다. 상자를 여는 방법에 대한…

부시로드, 에이팅(Eighting), 헌터x헌터 격투 게임 공개 – 뉴스

부시로드 자세한 내용은 1월 6일 공개 예정 이미지를 통해 Amazon.co.jp © 토가시…