Google Speech-to-Speech Translation Model (구글 음성 번역기)
Introducing Translatotron: An End-to-End Speech-to-Speech Translation Model 구글이 음성 번역기와 관련된 내용을 발표하였네요. 아래 구조도 그림과 같이 Spanish 음성이 입력되면 Spanish 를 Decoder가 Text화하여 English 로 번역을 하고, Spanish 발음 자체를 Encoding 하여 번역된 Text를 Spectrogram Decoder 가 English로 번역된 Spectrogram을 Vocoder에 전달하여 최종적으로 사람이 들을수 있는 Waveform 으로 번역하여 출력해주는 순서입니다. 이러한 기술이 상용화되면 영상의 더빙과 같이 성우들이 별도로 음성 녹음을 하지 않더라도 기존 성우의 말투나 억양과 유사한 톤으로 ..
Life/IT
2019. 6. 12. 00:13