애플이 텍스트 명령을 기반으로 사진을 편집할 수 있는 인공지능 모델을 출시한다.

Apple은 현재 AI 게임에서 최고의 플레이어 중 하나는 아니지만 사진 편집을 위한 회사의 새로운 오픈 소스 AI 모델은 해당 분야에 어떤 기여를 할 수 있는지 보여줍니다. 이 모델은 MGIE(MLLM 유도 이미지 편집)라고 하며, MLLM(다중 모드 대형 언어 모델)을 사용하여 이미지를 처리할 때 텍스트 기반 명령을 해석합니다. 즉, 이 도구에는 사용자가 입력하는 텍스트를 기반으로 이미지를 편집하는 기능이 있습니다. 이를 수행할 수 있는 최초의 도구는 아니지만 “인간의 지시는 때로는 기존 방법으로 캡처하고 따르기에는 너무 짧습니다.” 프로젝트 시트 (PDF) 읽어보세요.

이 회사는 캘리포니아 대학교 산타바바라 캠퍼스의 연구원들과 함께 MGIE를 개발했습니다. MLLM은 단순하거나 모호한 텍스트 프롬프트를 이미지 편집기가 직접 따를 수 있는 보다 자세하고 명확한 지침으로 바꾸는 기능을 갖추고 있습니다. 예를 들어, 사용자가 페퍼로니 피자의 이미지를 “건강하게 만들기” 위해 편집하려는 경우 MLLM은 이를 “야채 토핑 추가”로 해석하고 이미지를 편집할 수 있습니다.

MGIE는 이미지를 크게 변경하는 것 외에도 텍스트 프롬프트를 통해 이미지 자르기, 크기 조정 및 회전은 물론 밝기, 대비 및 색상 균형을 향상시킬 수도 있습니다. 또한 이미지의 특정 영역을 수정할 수 있으며, 예를 들어 사진 속 사람의 머리카락, 눈, 옷을 수정하거나 배경의 개체를 제거할 수 있습니다.

좋다 벤처비트 Notes, Apple을 통해 모델 출시 깃허브하지만 관심 있는 사람들은 다음을 시도해 볼 수도 있습니다. 실험적인 현재 Hugging Face Spaces에서 호스팅되고 있습니다. Apple은 이 프로젝트에서 배운 내용을 자사 제품에 통합할 수 있는 도구나 기능에 사용할 계획인지 아직 명확하게 밝히지 않았습니다.

Seung Jae-Hwa

“재화는 뛰어난 분석 능력을 가진 분석가로, 다양한 주제에 대한 깊은 통찰력을 가지고 있습니다. 그는 창조적인 아이디어를 바탕으로 여러 프로젝트를 주도해왔으며, 좀비 문화에 특별한 애정을 갖고 있습니다. 여행을 사랑하며, 대중 문화에 대한 그의 지식은 깊고 폭넓습니다. 알코올에 대한 그의 취향도 독특합니다.”

READ Cyberpunk 2077 Devs & More는 러시아의 우크라이나 침공을 규탄합니다.

애플이 텍스트 명령을 기반으로 사진을 편집할 수 있는 인공지능 모델을 출시한다.

Up next

한국, 젊은 여행객을 위한 스포츠 테마 투어 만든다

Author

Seung Jae-Hwa

답글 남기기 응답 취소

일일 거래: Amazon, GameStop에서 2개 구매 1개 무료

블리자드는 디아블로가 만화 개와 혼동되는 것을 원하지 않습니다.

삼성, 최초의 HDR10+ 게이밍 모니터 출시

일본과 아시아의 PlayStation Partner Awards 2022가 12월 2일로 예정되어 있습니다.

한국 멀티 클라우드 보안: 자동화된 CSPM의 핵심 역할

가상 대기실이 사이트를 안정적으로 유지하는 방법

“죽은 인터넷 이론”이 새로운 AI 기반 소셜 미디어 앱으로 다시 살아납니다.

텍사스 대사 대화 – 한미경제연구원

애플이 텍스트 명령을 기반으로 사진을 편집할 수 있는 인공지능 모델을 출시한다.

Up next

Author

Seung Jae-Hwa

답글 남기기 응답 취소

You May Also Like