AI 새소식

실시간 AI 번역으로 세계와 소통하세요- Seamless

에반대 2023. 12. 3. 01:45

오늘은 메타에서 새롭게 발표한 AI 언어 번역 모델 Seamless에 대해 이야기해볼까 해요.

 

Seamless는 "매끄러운", "끊김 없는" 이라는 뜻입니다.

 

메타에서 발표한 Seamless 모델들은 언어 차이로 인한 커뮤니케이션 장벽을 극복하고, 보다 자연스럽고 생생한 대화를 가능하게 해주는데요. 그래서 이름을 Seamless라고 지었나 봅니다.

 

Seamless를 우리나라 말로 설명하자면 '매끄러운' 또는 '끊김 없는'이라고 할 수 있어요. 따라서 'Seamless'는 이름 그대로 언어 간의 소통을 매끄럽고 자연스럽게 연결해주는 기술이라고 볼 수 있어요.

 

메타의 Seamless 소개 영상, 출처: https://ai.meta.com/research/seamless-communication/

 

 

Seamless 모델

Seamless 모델은 세 가지 AI 모델을 결합해 놀라운 번역 경험을 제공하는데요, 각 모델은 SeamlessExpressive, SeamlessStreaming, 그리고 SeamlessM4T v2입니다.

 

이제 이 모델들이 갖고 있는 독특한 기능들을 자세히 살펴볼게요.

 

SeamlessExpressive:

이 모델은 언어의 경계를 넘나들며, 말하는 사람의 표현력과 미묘한 차이를 살리는 데 초점을 맞췄어요. 다른 번역 도구들이 대화의 내용은 잘 포착하나 대부분 단조롭고 로봇 같은 음성으로 출력하는 것과 달리, SeamlessExpressive는 말의 속도, 휴식, 감정적 어조 같은 세밀한 부분까지 잡아냅니다.

한 번 들어볼까요?


"볼륨을 줄여주세요. 우리는 방금 아기를 재웠어요."라고 속삭이는 영어 음성을 스페인어 음성으로 번역했어요.

 

출처: https://seamless.metademolab.com/expressive

 

속삭이는 표현을 그대로 유지하고 있는 것이 정말 신기합니다.

 

 

SeamlessStreaming:

이 모델은 약 2초의 지연 시간을 가지며, 거의 실시간에 가까운 번역을 제공해요. 100가지가 넘는 언어를 지원하는 자동 음성 인식 기능과, 음성-텍스트 번역, 그리고 거의 100가지 입력 언어와 36가지 출력 언어를 지원하는 음성-음성 번역 기능이 특징입니다.

 

 

SeamlessM4T v2:

이 모델은 다양한 언어와 작업을 처리할 수 있는 기본적인 모델로, 음성과 텍스트를 아우르는 번역과 필사에서 최첨단의 결과를 제공했어요. SeamlessExpressive와 SeamlessStreaming 모델의 기반을 형성합니다.

 

 

이처럼 각각의 모델은 자신만의 특별한 기능을 가지고 있어서, 함께 사용할 때 더욱 강력하고 효율적인 번역 경험을 선사해요.

 

 

 

Seamless 데모 체험 방법

메타에서 진행하는 이러한 혁신적인 발전은 마치 SF 영화 속 실시간 통역기가 현실로 다가온 것 같아요.

여러분도 이 멋진 기술을 직접 체험해보는 건 어떠세요?

 

Seamless 데모 페이지로 이동한 후에 Try the demo 버튼을 클릭합니다.
링크: https://seamless.metademolab.com/expressive

 

Try the demo 버튼을 클릭합니다.

 

이후에는 여러분이 말할 언어와 번역될 언어를 선택하고, 마이크를 통해 음성을 녹음하면 됩니다. 그러면 여러분의 감정과 목소리 톤이 유지된 채로 번역된 음성을 들을 수 있어요.

 

영화에서만 보던 실시간 음성 번역 기술이 이제는 현실에 있습니다. 여러분이 이 기술을 체험하고 느낀 점을 댓글로 공유해주세요.


그럼 저는 다음에도 여러분에게 재미있고 유용한 소식을 가지고 올게요. 기대해 주세요!