지난 해에는 텍스트 프롬프트를 사용하여 이미지, 예술 작품 또는 비디오를 만들 수 있는 인공 지능(AI) 도구가 등장했습니다.

또한 앞으로 큰 발전을 이루었습니다. AI 타이핑OpenAI의 ChatGPT 사용 광범위한 흥분을 일으켰습니다. – 그리고 두려움 – 글쓰기의 미래에 대한.

이제 2023년을 며칠 앞두고 또 다른 강력한 AI 사용 사례가 주목받고 있습니다. 바로 사람의 목소리를 정확하게 시뮬레이션할 수 있는 텍스트 음성 변환 도구입니다.

마이크로소프트가 개발한 VALL-E는 3초 동안 사람의 목소리를 녹음하고, 그 목소리를 반복하고, 텍스트의 맥락에 따라 사실적인 어조와 감정으로 쓰여진 단어를 음성으로 변환할 수 있습니다.

60,000시간의 영어 음성 녹음 교육을 받은 그는 “무의미한 상황”에서 연설을 할 수 있습니다.

VALL-E를 소개합니다 코넬 대학교에서 발행한 논문개발자들은 녹음 데이터가 7,000명 이상의 고유한 화자로 구성되어 있다고 설명했습니다.

팀은 TTS(텍스트 음성 변환) 시스템이 기존 텍스트 음성 변환 시스템보다 수백 배 더 많은 데이터를 사용하여 미결제 문제를 극복하는 데 도움이 되었다고 말합니다.

이 도구는 현재 공개적으로 사용할 수 없지만 누군가의 목소리에서 나오는 모든 텍스트를 생성하는 데 실질적으로 사용될 수 있다는 점에서 안전성에 대한 의문을 제기합니다.

Microsoft는 인공 지능에 큰 투자를 하고 있습니다.

그러나 그는 졌다. 나는 제안을 했다여러 3초 스피커 프롬프트와 실행 중인 텍스트 음성 변환 프로세스에 대한 설명을 표시하여 음성을 적절하게 시뮬레이션합니다.

스피커 프롬프트 및 VALL-E 출력과 함께 결과를 “ground truth”(인스턴트 텍스트를 읽는 실제 스피커)와 기존 텍스트 음성 변환 기술의 “ground” 결과와 비교할 수 있습니다.

Microsoft는 인공 지능에 막대한 투자를 했으며 ChatGPT 및 텍스트를 이미지로 변환하거나 아트 도구인 DALL-E를 지원하는 회사인 OpenAI의 후원자 중 하나입니다.

이 거대 소프트웨어 회사는 2019년에 OpenAI에 10억 달러(9억 3천만 유로)를 투자했으며 이번 주 semafor.com의 보고서에 따르면 이 회사에 100억 달러(93억 유로)를 추가로 투자할 계획이라고 밝혔습니다.

READ  Nintendo Switch는 더 강력해야했습니다.
답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

You May Also Like

Apple, iPhone 15 Pro 및 M3 Mac용 TSMC 3nm 칩셋의 전체 공급 주문

애플은 곧 출시될 아이폰 15 프로 라인업과 2023년 하반기로 예정된 새로운 맥북에…

Baldur’s Gate 3, Zelda: Tears of the Kingdom을 제치고 2023년 최고 평점 게임 ‘현재까지’

사진: 라리안 스튜디오 The Legend of Zelda: Tears of the Kingdom이 마침내…

스파이더맨 2 PS5 번들은 지금 정말 저렴해요

아직도 찾고 계시다면 플레이스테이션 5Best Buy가 도와드리겠습니다. 지금 당장 Sony의 최신 콘솔을…

Animal Crossing Game : New Horizons 버전 1.8.0 출시-슈퍼 마리오 아이템 등

Nintendo는 Super Mario 업데이트를 출시했습니다. Animal Crossing : New Horizons. 이것은 게임을…