가장 많이 추천되는 Fakevoice 기술로는 Coquit-AI 이다. 이를 다운로드 받아 실행 해 보았습니다.
일단 TTS 기능과 음성합성 기능을 확인해 보기 위해서 설치를 해 보았습니다. Colab 안쓰고 가상 환경 Coqui를 만들고 git으로 로컬 mac에서 구현을 해 봤습니다.
conda create –name Coqui python=3.8
conda activate Coqui
git clone http://github.com/coqui-ai/TTS
pip install -r requirements.txt
tts –list_models
모델중의 하나로 실행해 보았습니다. 결과는 ouput.mp3 파일로 저장
tts –text “What do you think you are doing. Are there any purpose on this? Sometimes I wish that I were dead” –model_name “tts_models/en/ljspeech/tacotron2-DDC”
소리는 적당한것 같습니다. 한글 모델도 있고 개인 모델을 만들어 자기의 목소리로 만드는 것도 가능할 것 같은데…. 훈련시키는게 만만치 않아 보이네요. 당분간은 Sppechelo 같은 TTS를 사용하는것이 답일 것 같습니다.