지난 해에는 텍스트 프롬프트를 사용하여 이미지, 예술 작품 또는 비디오를 만들 수 있는 인공 지능(AI) 도구가 등장했습니다.

또한 앞으로 큰 발전을 이루었습니다. AI 타이핑OpenAI의 ChatGPT 사용 광범위한 흥분을 일으켰습니다. – 그리고 두려움 – 글쓰기의 미래에 대한.

이제 2023년을 며칠 앞두고 또 다른 강력한 AI 사용 사례가 주목받고 있습니다. 바로 사람의 목소리를 정확하게 시뮬레이션할 수 있는 텍스트 음성 변환 도구입니다.

마이크로소프트가 개발한 VALL-E는 3초 동안 사람의 목소리를 녹음하고, 그 목소리를 반복하고, 텍스트의 맥락에 따라 사실적인 어조와 감정으로 쓰여진 단어를 음성으로 변환할 수 있습니다.

60,000시간의 영어 음성 녹음 교육을 받은 그는 “무의미한 상황”에서 연설을 할 수 있습니다.

VALL-E를 소개합니다 코넬 대학교에서 발행한 논문개발자들은 녹음 데이터가 7,000명 이상의 고유한 화자로 구성되어 있다고 설명했습니다.

팀은 TTS(텍스트 음성 변환) 시스템이 기존 텍스트 음성 변환 시스템보다 수백 배 더 많은 데이터를 사용하여 미결제 문제를 극복하는 데 도움이 되었다고 말합니다.

이 도구는 현재 공개적으로 사용할 수 없지만 누군가의 목소리에서 나오는 모든 텍스트를 생성하는 데 실질적으로 사용될 수 있다는 점에서 안전성에 대한 의문을 제기합니다.

Microsoft는 인공 지능에 큰 투자를 하고 있습니다.

그러나 그는 졌다. 나는 제안을 했다여러 3초 스피커 프롬프트와 실행 중인 텍스트 음성 변환 프로세스에 대한 설명을 표시하여 음성을 적절하게 시뮬레이션합니다.

스피커 프롬프트 및 VALL-E 출력과 함께 결과를 “ground truth”(인스턴트 텍스트를 읽는 실제 스피커)와 기존 텍스트 음성 변환 기술의 “ground” 결과와 비교할 수 있습니다.

Microsoft는 인공 지능에 막대한 투자를 했으며 ChatGPT 및 텍스트를 이미지로 변환하거나 아트 도구인 DALL-E를 지원하는 회사인 OpenAI의 후원자 중 하나입니다.

이 거대 소프트웨어 회사는 2019년에 OpenAI에 10억 달러(9억 3천만 유로)를 투자했으며 이번 주 semafor.com의 보고서에 따르면 이 회사에 100억 달러(93억 유로)를 추가로 투자할 계획이라고 밝혔습니다.

READ  Microsoft 임원 Phil Spencer, Nintendo, Sony와의 Xbox 콘솔 전쟁 패배 인정
답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

You May Also Like

마이크로소프트, 크롬북에서 안드로이드 오피스 앱 지원 종료

Microsoft는 Chromebook 사용자가 인터넷에 연결되지 않은 Office 문서 작업을 더 어렵게 만들…

AMD Ryzen Threadripper 5990X CPU는 4.82GHz로 오버클럭되어 Cinebench R23에서 100,000포인트를 스매싱하고 기본 칩에 대해 80% 고성능을 달성합니다.

익스트림 오버클러커인 SkatterBencher는 전용 워터 루프 설정에서 AMD의 Ryzen Threadripper 5990X HEDT…

iPhone 사용자는 Apple로 로그인해야합니다. 작동 방식은 다음과 같습니다.

Apple로 로그인이 앱에 나타납니다. 대신 이메일 주소를 사용할 수도 있습니다. 제임스 마틴…

Trusted Leaker는 오늘 WWDC에서 MacBook Pro 또는 기타 하드웨어 발표를 제안하지 않습니다.

WWDC 2021에서 하드웨어 발표가있을 것인지 묻는 트윗에 대한 응답으로, 비밀 스럽지만 신뢰할…