작년은 가히 AI 인공지능의 해라고 말해도 부족함이 없을 듯하네요. 챗GPT를 시작으로 AI 이미지를 생성해 주는 미드저니와 빙 이미지 크리에이터, 문서 작성을 대신 해주는 코-파일럿과 구글 바드까지, AI만 있으면 많은 일을 할 수 있게 되었습니다.

오늘은 그중에서도 AI를 활용해 텍스트와 음성을 다양하게 변환하고 활용할 수 있는 기능에 대해 조금 더 알아보겠습니다.

5분 안에 이런 내용을 알려 드려요!
  1. 인공지능, 무엇을 할 수 있을까?
  2. Top 6 텍스트 음성 변환 사이트
  3. 더 강력하고 편리한 TTS 프로그램은?

Part 1 인공지능, 무엇을 할 수 있을까?

처음에 이야기한 것처럼 AI로 할 수 있는 일은 참 많습니다. 그중에서도 텍스트와 음성 관련 부분만 살펴보면, 우선 1) 텍스트 음성 변환(TTS) 기능이 있습니다. TTS를 활용하면 오디오북을 만들거나 유튜브 콘텐츠의 자막 및 AI 음성 추가 등을 할 수 있습니다.

인공지능

TTS의 반대 기능으로 2) 음성 텍스트 변환(STT) 기능이 있습니다. 이는 녹음 파일 같은 오디오를 문서로 만들어야 할 때 편리한 기능입니다. 또 3) 보이스 체인지(Voice change) 같은 변환 기능도 있습니다. 남자 목소리를 여자 목소리로, 또 아이나 로봇처럼 가짜 목소리로 바꿀 수 있습니다.

지금까지 설명해 드린 기능은 예전 같았으면 성우가 며칠 동안 책 전체를 읽거나, 녹음을 들으며 직접 타자를 하거나 하는 방법으로 사람이 꼭 필요했습니다. 하지만 이제 AI 기능을 활용하면 단 몇 분, 몇 시간 만에 끝낼 수 있으니, 세상이 정말 달라진 것 같습니다.

원더쉐어 데모크리에이터
화면 녹화부터 게임, 회의, 인강, 교육 영상 제작을 위한 PPT 녹화, 그리고 동영상 편집까지 강력한 컴퓨터 화면 녹화 프로그램
DemoCreator DemoCreator

Part 2 Top 6 텍스트 음성 변환 사이트

파트 2에서는 텍스트 음성 변환 기능을 제공하는 추천 사이트를 정리하였습니다. 아래 사이트를 잘 활용하면 각종 자료 작성부터 업무 능률 향상까지 손쉽게 할 수 있습니다.

추천 1. 스피치파이

스피치파이는 온라인과 앱 스토어/구글 플레이 스토어 앱을 제공하는 텍스트 음성 변환 사이트입니다. 무료 버전에서도 다양한 목소리를 테스트 해 볼 수 있으며, 데모 오디오 생성 시 읽기 속도를 조정하고, 부분 앞뒤 이동이 가능합니다.

영어, 한국어를 포함한 주요 언어와 베트남어, 태국어, 일본어 등도 지원하므로 여러 상황에서 활용할 수 있습니다.

스피치파이

장점
  • 맥 전용 앱, 구글 크롬 및 MS 에지 브라우저 확장 플러그인 지원
단점
  • 오디오 파일을 저장하려면 회원 가입 필요(무료 버전도 가입 필수)

추천 2. 구글 클라우드 TTS

구글 클라우드 서비스 제품 중 하나로 지원되는 TTS 기능은 강력한 텍스트 음성 변환 사이트 중 하나입니다. 자연스러운 AI 음성 봇을 만들 수 있으며, 특히 사용자 음성을 AI에 학습시켜 TTS를 위한 커스텀 음성을 만들 수 있는 것이 다른 서비스에는 없는 특징입니다.

그리고 오디오를 출력하는 환경(홈 오디오, 유선 전화, 대형 오디오 시스템 등)에 맞춰 최적화하는 기능도 지원합니다.

구글 클라우드 TTS

장점
  • 50개 이상의 언어 및 400여 개의 음성 제공
단점
  • 무료 크레딧($300 제공) 소진 이후, 반드시 유료 구매 필요

추천 3. 일레븐랩스

일레븐랩스도 사용자가 많은 텍스트 음성 변환 서비스입니다. 보이스 랩 메뉴에서 다른 유저가 만든 AI 생성 목소리를 듣고, 이용할 수 있는 것이 특징입니다. 그리고 일레븐랩스 유저 커뮤니티에서 AI 보이스 생성 팁을 배울 수도 있습니다.

다만 서비스 이용을 위해 반드시 회원 가입이 필요하며, 무료 버전 이용자는 결과물을 상업용으로 활용할 수 없습니다.

일레븐랩스

장점
  • 음성 to 음성 (목소리 변환) 메뉴 지원
단점
  • 무료 이용자도 최소 금액 결제 필요

추천 4. 머프.AI

머프.AI는 인공지능을 활용한 여러 음성, 텍스트 관련 기능을 제공하는 온라인 서비스입니다. TTS, AI (음성/텍스트) 번역, 더빙 같은 메뉴를 지원하며, 수업 자료/오디오북/유튜브/팟캐스트 등 다양한 환경의 템플릿을 제공합니다.

그리고 머프 서비스의 API를 제공하여 다른 사이트에서 쉽게 기능을 추가하여 활용할 수 있습니다.

머프.AI

장점
  • 캔바 및 구글 슬라이드 애드-온 기능 제공
단점
  • 초보자가 사용하기에는 인터페이스가 복잡함

추천 5. 리보이서

리보이서는 깔끔한 화면 구성이 눈에 띄는 텍스트 음성 변환 사이트입니다. 재미있는 기능은 AI 음성 생성 시 웃는 얼굴, 화난 얼굴 같은 이모티콘을 적용하여 음성 톤을 변환할 수 있는 것입니다. 이를 활용하면 보이스를 바꾸지 않고도, 일부만 수정할 수 있습니다.

다만 다른 사이트와 비교하면 가격이 비싼 편입니다. (최소 37$/월 결제 필요함)

리보이서

장점
  • 보이스의 특색을 자세히 제공(어른스러우면서 프로의 느낌, 옆집 아저씨 느낌 등등)
단점
  • 무료 체험 및 서비스 버전 지원하지 않음

추천 6. 아마존 폴리

아마존 폴리는 AWS(아마존 웹 서비스)에서 제공하는 텍스트 음성 변환 AI 서비스입니다. 글로벌 웹 서비스의 1/3을 차지하는 AWS의 서비스인만큼 높은 신뢰도와 정확성이 가장 큰 강점입니다. 다만 기존 AWS 유저만 사용할 수 있고, 사용법이 어려운 것은 아쉽습니다.

아마존 폴리

장점
  • 딥 러닝 기술로 최대한 자연스러운 사람 음성 생성
단점
  • 주요 기능 설명 및 FAQ는 영어로만 지원

Part 3 더 강력하고 편리한 TTS 프로그램은?

지금까지 2024년에 인기 있는 텍스트 음성 변환 사이트를 추천해 드렸습니다. 온라인 서비스는 쉽게 접속할 수 있지만, 환경에 따라 사용이 어려울 수도 있고, 무료 서비스의 경우 보안 우려도 있습니다.

무료 다운로드
무료 다운로드

이럴 때는 TTS 기능을 지원하는 설치형 프로그램을 활용하면 됩니다. 그중에서도 원더쉐어에서 만든 데모크리에이터는 최신 버전 7부터 AI 레코딩을 지원하여, 동영상 편집과 함께 자막 등 텍스트를 음성으로 변환해 삽입할 수 있습니다.

TTS 프로그램

데모크리에이터를 실행하고, 동영상 편집 메뉴로 들어갑니다. 그다음 아래쪽 타임라임 편집창에서 자막을 선택합니다. (자막이 없으면 리소스 창에서 추가할 수 있습니다.) 자막을 선택하면 메뉴 제일 오른쪽의 AI 더빙 아이콘이 활성화됩니다.

데모크리에이터

AI 더빙 메뉴에서 언어와 목소리 옵션을 선택한 후, OK를 누르면 텍스트가 음성으로 자동 변환되며, 해당 오디오가 영상에 삽입됩니다. 데모크리에이터는 이 밖에도 강력한 영상 편집과 AI 부가 기능을 지원하므로, 무료 체험판으로 확인해 보시길 추천해 드립니다.

데모크리에이터 주요 특징:

  • 예약 녹화 및 듀얼 모니터 녹화 지원
  • 이펙트(동영상 효과) 팩 제공
  • 사용 팁 및 주요 기능 동영상 가이드

마치며

오늘은 AI가 제공하는 다양한 변환 기능과 TTS 서비스를 제공하는 베스트 사이트 정보를 정리하였습니다. 그리고 원더쉐어 데모크리에이터의 AI 더빙으로 자막을 음성으로 변환하는 방법도 알아보았습니다.

이것만 알면 텍스트를 AI 음성으로 바꿀 수 있습니다.
1. 스피치파이, 머프.AI 같은 온라인 사이트에서 TTS 서비스를 이용할 수 있습니다.
2. 데모크리에이터 AI 더빙으로 텍스트 음성 변환을 하고, 영상에 추가할 수 있습니다.

텍스트 음성 변환 사이트에 관한 FAQ

  • AI 동영상 편집 기능은 어떤 것이 있나요?
    인공지능을 활용하여 동영상에서 인물과 배경을 분리하고, 배경을 변경하는 AI 초상화 기능, 오디오가 비는 부분을 자동 삭제하거나 건너뛰는 기능 등이 있습니다. 이러한 AI 편집 기능을 활용하면 동영상 작업 시간을 획기적으로 줄일 수 있습니다.
  • 아마존 웹 서비스는 일반 사용자도 쓸 수 있나요?
    AWS는 개인 사용자도 가입하여 사용할 수 있습니다. 다만 사용법이 복잡하여 초보자는 쓰기 쉽지 않으며, 조건을 제대로 확인하지 않으면 몇만 원씩 결제될 수 있으므로 유의해야 합니다.
  • AI 보이스에는 저작권이 있나요?
    예, 특정 업체에서 제공하는 AI 보이스의 저작권은 해당 업체에 있습니다. 예를 들어 스피치파이 같은 곳에서 지원하는 AI 음성으로 오디오를 녹음했다면, 상업적인 활용이 가능한지 이용자의 가입 조건을 확인해야 합니다.
이선호
이선호 Jan 18, 24
Share article: