지난 해에는 텍스트 프롬프트를 사용하여 이미지, 예술 작품 또는 비디오를 만들 수 있는 인공 지능(AI) 도구가 등장했습니다.

또한 앞으로 큰 발전을 이루었습니다. AI 타이핑OpenAI의 ChatGPT 사용 광범위한 흥분을 일으켰습니다. – 그리고 두려움 – 글쓰기의 미래에 대한.

이제 2023년을 며칠 앞두고 또 다른 강력한 AI 사용 사례가 주목받고 있습니다. 바로 사람의 목소리를 정확하게 시뮬레이션할 수 있는 텍스트 음성 변환 도구입니다.

마이크로소프트가 개발한 VALL-E는 3초 동안 사람의 목소리를 녹음하고, 그 목소리를 반복하고, 텍스트의 맥락에 따라 사실적인 어조와 감정으로 쓰여진 단어를 음성으로 변환할 수 있습니다.

60,000시간의 영어 음성 녹음 교육을 받은 그는 “무의미한 상황”에서 연설을 할 수 있습니다.

VALL-E를 소개합니다 코넬 대학교에서 발행한 논문개발자들은 녹음 데이터가 7,000명 이상의 고유한 화자로 구성되어 있다고 설명했습니다.

팀은 TTS(텍스트 음성 변환) 시스템이 기존 텍스트 음성 변환 시스템보다 수백 배 더 많은 데이터를 사용하여 미결제 문제를 극복하는 데 도움이 되었다고 말합니다.

이 도구는 현재 공개적으로 사용할 수 없지만 누군가의 목소리에서 나오는 모든 텍스트를 생성하는 데 실질적으로 사용될 수 있다는 점에서 안전성에 대한 의문을 제기합니다.

Microsoft는 인공 지능에 큰 투자를 하고 있습니다.

그러나 그는 졌다. 나는 제안을 했다여러 3초 스피커 프롬프트와 실행 중인 텍스트 음성 변환 프로세스에 대한 설명을 표시하여 음성을 적절하게 시뮬레이션합니다.

스피커 프롬프트 및 VALL-E 출력과 함께 결과를 “ground truth”(인스턴트 텍스트를 읽는 실제 스피커)와 기존 텍스트 음성 변환 기술의 “ground” 결과와 비교할 수 있습니다.

Microsoft는 인공 지능에 막대한 투자를 했으며 ChatGPT 및 텍스트를 이미지로 변환하거나 아트 도구인 DALL-E를 지원하는 회사인 OpenAI의 후원자 중 하나입니다.

이 거대 소프트웨어 회사는 2019년에 OpenAI에 10억 달러(9억 3천만 유로)를 투자했으며 이번 주 semafor.com의 보고서에 따르면 이 회사에 100억 달러(93억 유로)를 추가로 투자할 계획이라고 밝혔습니다.

READ  가장 우스꽝스러운 워해머 40K 모델 인 오리지널 썬더 호크 건쉽을 확인하세요
답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다

You May Also Like

‘Save Titanfall’메시지가 10 억 달러 규모의 Apex Legends 프랜차이즈를 방해합니다.

Respawn Entertainment의 배틀 로얄 슈터 Apex 레전드 그것은 성공적으로 입증되었습니다 1 억…

[Released] Samsung Galaxy S10 One UI 3.0 (Android 11) 안정적인 업데이트 확인 중 …

이 이야기의 맨 아래에 새로운 업데이트가 추가됩니다 ……. 원본 이야기 (2021 년…

GTA 6, 누출 후 비공식 지도를 얻다 | GameSpot 뉴스 – GS 뉴스 업데이트

Rockstar는 초기 게임에서 인터넷을 정리하느라 바빴지만 팬들은 유출된 영상의 단서를 기반으로 GTA…

포켓몬스터 월드 챔피언십에서 포켓몬스터 스칼렛과 바이올렛의 새로운 예고편이 공개되었습니다.

포켓몬 컴퍼니는 포켓몬 스칼렛과 바이올렛의 새로운 예고편으로 2022년 포켓몬 월드 챔피언십을 마무리합니다.…