Chat GPT-4 보다 더 낫다고 하는 중국의 AI

중국의 기술기업 SenseTime에서 선보인 SenseNova 5.0 대규모 언어모델은 무려 6000억 개가 넘는 매개변수를 갖추고 있다고 하네요. 20만 단어 길이의 컨텍스트 창도 지원한다고 하니 상상하기 어렵네요. 게다가 이렇게 방대한 모델을 10TB가 넘는 합성데이터로 사전훈련을 시켰다고 합니다.
이렇게 거대한 규모답게 SenseNova 5.0의 성능도 정말 놀랍습니다. 지식, 수학, 추론, 코딩 등 다양한 분야에서 정말 탁월한 모습을 보여주고 있다고 해요. GPT-4 Turbo를 포함한 최신 대형 언어모델들을 모두 압도하며 주요 벤치마크 평가에서 최고 점수를 기록했다고 하니 실력이 무시무시하네요.
덧붙여 SenseTime 측에서는 스타일 일관성과 프리셋 기능을 갖춘 획기적인 텍스트-비디오 생성 모델도 곧 공개할 예정이라고 합니다.
이런 SenseNova 5.0의 성과를 볼 때, 중국의 AI 기술 수준이 우리가 예상했던 것보다 훨씬 더 빠르게 미국을 따라잡고 있다는 것을 실감할 수 있습니다. 물론 아직 일반인들이 직접 모델을 사용해볼 수 있는 기회가 없어서 실제 성능을 검증하긴 어렵습니다. 하지만 향후 모델이 공개되면 중국의 AI 기술력을 가늠해볼 수 있을 것 같네요.
세계 최강의 AI 기업들이 치열하게 경쟁하는 가운데, 중국도 이런 SenseNova 5.0을 통해 AI 강국으로서의 입지를 더욱 굳건히 하고 있습니다. 앞으로 더욱 혁신적인 AI 기술이 등장할 것으로 기대되는데요. 글로벌 AI 기술 발전 트렌드에 주목해야 할 것 같습니다.
AI 아바타 이젠 감정표현까지 가능하다

인공지능 스타트업 Synthesia가 감정 표현이 가능한 새로운 세대의 “표현력 있는 아바타”를 공개했습니다. 이 아바타는 맞춤형 EXPRESS-1 모델을 활용해 감정 상태를 인식하고, 이에 따라 톤, 얼굴표정, 제스처 등을 조절할 수 있습니다.
이번 업그레이드를 통해 프로모션 비디오, 고객지원, 의료 콘텐츠 등 감정 표현이 필수적인 분야에서 아바타를 활용할 수 있게 되었습니다. 나아가 Synthesia 측은 향후 이 디지털 배우들이 3차원 가상공간에서 활동하고 다른 아바타들과 상호작용할 수 있을 것이라고 전했습니다.
이는 실제와 가상의 경계를 완전히 허무는 혁신적 성과입니다. Synthesia의 아바타 기술은 기업 내 커뮤니케이션, 교육, 고객서비스 분야에서 새로운 패러다임을 열어갈 전망입니다. 나아가 3D 디지털 비서, AI 가상 가이드, 완전한 아바타 프레젠테이션 등 획기적 개념 또한 현실화될 수 있을 것으로 보입니다.
일론 머스크의 AI 스타트업 xAI가 60억 달러 규모의 투자 유치

엘론 머스크의 AI 스타트업 xAI가 엄청난 자금을 유치하며 화제입니다. 60억 달러 규모의 투자 라운드를 마무리하면서 회사 가치가 무려 180억 달러까지 올랐다고 하네요. 세쿼이어 캐피털을 비롯해 밸러 에퀴티 파트너스, 바이 캐피털 등 굵직한 투자사들이 이번에 참여했습니다. 2주 안에 라운드가 종료될 것이라고 하는데요. 이전에는 엘론 머스크 개인이 10억 달러를 직접 투자하는 등 주도했지만 이번에는 규모가 훨씬 커졌습니다.
그래서 이 막대한 자금이 어디에 쓰일까요? xAI의 챗봇 Grok을 키워서 ChatGPT를 제치는 강력한 라이벌로 만들 계획이라고 합니다. 아직 베타 버전인 Grok 1.5가 엄청 좋다는 소문도 있고, 인기 주제와의 통합도 잘 되고 있다고 하니 기대가 되네요. 전 테슬라 엔지니어들까지 합류하는 등 우수한 인재들도 대거 영입 중이라고 하더라고요.
이렇게 180억 달러나 되는 엄청난 투자가 이뤄졌으니, 엘론 머스크도 이번에는 꼭 성공할 것이라는 기대가 크다고 하겠습니다.
어도비의 차기 AI는 원본의 8배의 화질 업스케일링

어도비에서 개발 중인 획기적인 신기술 ‘VideoGigaGAN’에 대한 소식입니다. 기술은 정말 멋지다고 할 수 있는데요. 화질이 낮은 영상을 최대 8배나 업스케일링해서 고화질로 만들어주게 됩니다. 예를 들어 128×128 픽셀의 흐린 폭포 영상도 1,024×1,024 픽셀 고해상도 영상으로 탈바꿈시킬 수 있다고 합니다.
게다가 원본 영상의 디테일까지 살려내는 점이 정말 대단하지 않나요.. 인물 얼굴의 주름살, 머리카락 하나하나까지 또렷이 보인다고 하니 정말 실감나는 화질일 것 같아요. 연못에서 헤엄치는 백조나 나무의 꽃봉오리도 더욱 선명하게 담겨 정말 현장에 있는 것 같을 정도라고 합니다.
이 기술이 어떻게 작동하는지 설명해드리자면, ‘생성적 적대 신경망(GAN)’ 기술을 기반으로 한답니다. 이건 실제 같은 이미지를 만들어내는 AI 기술인데, 어도비에서는 이를 발전시켜 영상에도 적용할 수 있게 만들었다고 하네요. 프레임 간 일관성, 잡티 제거, 디테일 보완 등의 문제도 다양한 기술로 해결했다고 합니다.
아직 200프레임 이상 영상이나 작은 물체 처리에는 어려움이 있다고 하지만, 어도비는 제품에 도입할 계획이라고 합니다. 실제로 얼마 전 ‘프로젝트 Res Up’ 행사에서 이 기술을 사용한 비디오 업스케일러를 선보였다고 하네요. 가족 옛날 영상이나 화질이 낮은 영상들을 고화질로 만들어주겠죠?
이 기술이 제품에 탑재되면 우리가 가진 구닥다리 저화질 영상들을 고화질로 만날 수 있게 되니 너무 기대가 되지 않나요? 앞으로의 발전 상황이 정말 궁금해집니다!