https://stibee.com/api/v1.0/emails/share/V6HHITBSUOv1RF1Rq4ETjw7QYie3PxU=
@[쫌아는기자들] 클레온, 사이버가수 아담은 돌아올 수 있을까
💬 진승혁이 디지털 휴먼에 뛰어든 이유
stibee.com
(주)클레온 | HOME
클레온은 AI 컬처 컨텐츠를 선도하는 스타트업 기업입니다. 서울 서울 중구 소월로2길 30. T타워 18층 클레온. Tel +82.2.515.6646. Email contact@klleon.io.
klleon.io
[클레온] 죽은 스티브 잡스와 다시 대화를 나눈다면
디지털 휴먼의 큰 갈래는 2개입니다. 실제 인간처럼 대화하도록 두뇌를 만드는 일. 그게 이루다고요. 또 다른 기술은 클레온처럼 디지털 휴먼을 인간처럼 보이도록 하는 기술을 만드는 일이죠. 사람은 시각에 영향을 많이 받아요. 눈에 보이지 않고, 약간의 이질감이 느껴져도 바로 믿는 것을 그만둡니다. 예를 들면 목소리가 사람 같아야 하고, 그다음에는 얼굴, 표정과 제스처까지. 인간처럼 느끼게 하려면 모두 중요하다고 생각해요. 이루다가 디지털 휴먼의 뇌에 집중했다면, 클레온은 UX에 집중하는 것이죠.
예전에도 사이버 가수 아담처럼 수많은 디지털 휴먼이 있었어요. 하지만 친숙하게 생각하지 못했던 이유는 그 이질감 때문이죠. 눈을 윙크하는 모습이 어색하거나, 어딘가 삐뚤어져 보이기만 해도 곧바로 무의식에서는 거리가 멀어집니다. 디지털 휴먼을 기계라고 인식하지만, 무의식 속에서는 인간처럼 느끼도록 만들어야 디지털 휴먼과 더 깊은 소통이 가능해요. 인간의 시각을 설득하는 작업이죠.
"한국인이 한국어로 한국인하고만 소통을 넘어설 수 있으니까요. 어쩌면 소통의 혁신, 그 끝은 모든 세계인이 언어의 장벽에 제한받지 않고 대화하는 것일 겁니다. 번역은 구글이나 다른 기업들이 만들고 있고, 음성을 텍스트로, 텍스트를 음성으로 바꾸는 기술을 연구하는 스타트업도 있고요. 저희 기술 ‘클링’은 영상 속에서 다른 여러 언어를 더빙하도록 입혀주는 솔루션이에요. 예컨대 송강호가 ‘오, 넌 다 계획이 있구나’를 영어,스페인어,일어로 바꾼다고 가정할게요. 기계음처럼 이걸 번역하고 입 모양이 어색하다면요? 사람들이 소통에 몰입할 수 없겠죠. 이걸 자연스럽게 음성의 톤과 영상을 조절해주는 기술입니다."
클링 외에도 2개의 제품이 있더군요.
"가상 인물을 만들어내는 서비스 ‘클론’, 그리고 기존 영상을 다양하게 합성해서 공유할 수 있는 소셜미디어 서비스 ‘카멜로’도 운영하고 있어요. 카멜로는 예컨대, 제 얼굴 사진을 찍고 다른 가수의 영상에 제 얼굴을 합성하는 방식으로 재밌는 영상 여럿을 만들어서 공유하는 플랫폼이죠. 클론과 클링은 주로 B2B 서비스를 타깃으로 만들었습니다."
가상 인물을 만들어낸다? 그것도 사진 한 장과 음성 30초 만으로?
"기자님 사진을 지금 한 장을 주고, 제작 코드에 원하는 단어를 입력합니다. (실제 시연해봤음) 예컨대 devil이라고 검색하면 얼굴이 악마처럼 변하고, 강도를 조절할 수 있어요. 게임 캐릭터로 해볼까요? 이즈리얼이라는 리그 오브 레전드의 캐릭터를 입혀볼게요. 2~3초면 이렇게 기자님 얼굴이 이즈리얼과 비슷해지죠. 같은 방식으로 윤석열 대통령 합성도 가능해죠. 이렇게요. 구글에서 키워드를 검색한다음, 이미지들의 특성을 AI가 파악해 공통된 요소를 얼굴에 입히는 방식이죠. 음성은 30초면 5개 국어를 할 수 있도록 입 모양을 바꿔가면서 합성이 가능하죠."