컴퓨터 지식 네트워크 - 컴퓨터 교육 - 한국 최초의 AI 여성 앵커는 누구의 원형으로 만들어졌습니까? 원형의 배경은 무엇입니까?

한국 최초의 AI 여성 앵커는 누구의 원형으로 만들어졌습니까? 원형의 배경은 무엇입니까?

지난 2020 년 6 월 6 일 165438+ 한국 MBN TV 는 한국 최초의 인공지능 (AI) 아나운서를 출시하며 이날 주요 뉴스와 여러 개의 문자 메시지를 성공적으로 방송했다. 이 AI 여성 앵커는 TV 프로그램 진행자인 김씨를 원형으로 그녀의 이름을 따서 지은 것으로 알려졌다. 금은요? 。 방금 나타났어요? 금은요? 여론의 관심을 불러일으켜 많은 네티즌들이 뉴스를 보고 감개했다. 너는 진짜와 거짓을 구별할 수 있니? 。

AI 아나운서로 뉴스를 방송하면 재난 등 긴급한 상황에서 신속하게 시청자에게 뉴스를 방송할 수 있어 24 시간 연속 일할 수 있다. 많은 인력, 시간, 비용을 절약할 수 있고, 새로운 프로그램을 만들려고 노력하여 자원을 절약할 수 있다.

금은요? 어떻게 탄생했을까요? 보고서는 말했다, 그녀? 김씨가 주관하는 종합뉴스 동영상 녹화 10 시간 동안 김의 동작, 소리, 방송 과정을 오랫동안 깊이 연구한 뒤 탄생했다. 최대 1 분 안에 1000 단어의 방송 비디오를 빠르게 생성할 수 있습니다.

이날 발생한 뉴스를 방송원고로 만들고 프로그램 감독의 자막과 동영상을 편집한 뒤 뉴스 사진을 올린다. 금은요? 심도 있는 학습 자료에 따르면 김의 실제 방송 말투, 어조, 입형을 모방하여 뉴스를 방송할 수 있다.

아는 바에 의하면? 금은요? MBN 방송국과 인공지능개발회사의 AI 아나운서? 돈 머리? * * * 같은 연구 개발. 이 회사가 개발한 인공지능 비디오 합성 기술은 인공지능, 심도 있는 학습, 컨볼 루션 신경망 (CNN) 학습 기술을 통합하여 실물의 생김새를 사실적으로 복원할 수 있어 구별하기 어렵다.

정말? 에이씨? 앵커는 중국에서 오랫동안 사용되었습니다. 2065438+2009 년 2 월, 관객은 사베이닝 CCTV 춘완 무대에 가상의 쌍둥이 오빠가 있다는 것을 기쁘게 보았다. 샤오사? AI 가상 진행자가 원형과 같은 무대에 오른 것은 이번이 처음이다. 이는 쇼가 미래의 직업 위기에 직면하고 있다는 것을 매우 감개하게 한다.

이런 AI 이중 아나운서를 만드는 데 30 분 정도 걸린다고 합니다. 그럼 비밀이 뭔가요?

내가 작은 사가 나타나는 것을 보자마자, 작은 사는 참지 못하고 말했다. 세상에, 거울을 보는 것 같아. -응? 심지어 외관상으로도 직호하는 것이 그야말로? 헤어진 지 여러 해 된 쌍둥이 형제? 。 소살도 꽃병 장식이 아니어서 장면을 잘 통제할 수 있어 조롱할 여지가 거의 없다. 그래서 가장자리의 작은 산란점. 억울한가? 천천히 잘라:? 한 마디 줄 수 있어요? -응?

분명히, 인공 지능을 도입하여 실제 프로토타입을 기반으로 한 가상 호스트는 경직되고 기계적인 가상 인간 기술에 비해 기술적으로 크게 향상되었다.

실제 사회자와 달리 기술팀은 이미지 디자인에 약간의 변경을 했다. 예를 들어 이번에 귀엽다고? 샤오사? 키가 좀 크고 말이 좀 많다. -응? 미국 인공지능회사 ObEN 공동 설립자 정의가 말했다.

물론 소사도 독점적으로 만든 것은 아니다. 가상쌍둥이 사베이닝 외에 다른 진행자인 주신, 고보, 양룡의 쌍둥이 AI 진행자도 잇따라 등장했기 때문이다.

금세기 초 BBC 가 첫 번째 가상 진행자인 아나오바를 발표한 이후 가상 진행자는 기술계의 연구 핫스팟이 되었다. -응? 너는 그의 목소리를 듣고 그의 백성을 볼 수 있다. 20 19 춘완 인터넷은 이 기술이 중국에서 처음으로 대규모로 응용된 것이다.

이런 AI 가상 쌍둥이 아나운서를 만드는 기술을 PAI (개인 AI) 라고 합니다. 20 개 이상의 특허 출원 기술을 통해 사베냉 등 사회자의 얼굴 스캔과 30 분 녹음 데이터만으로 이미지와 사운드 모델을 만들 수 있습니다.

AI 음성 기술을 기반으로, 사회자가 대량의 문자를 입력하여 음성 데이터베이스를 만들 필요가 없다. 수십 개의 짧은 표준 어쿠스틱 사운드만 있으면 피쳐 매개변수를 추출하고 마이그레이션 학습 알고리즘을 사용하여 고유한 사운드 모델을 만들 수 있습니다. 따라서 어떤 입력 텍스트라도 사회자의 목소리로 낭독하거나 부를 수 있으며, 심지어 중 일 영 한 네 가지 언어로도 부를 수 있다. -응? 정 이순신은 말했다.

보도에 따르면, 점점 더 많은 데이터가 많아지면서? 먹여? 소사는 자라면서 더 많은 기술을 습득할 수 있다. 심지어 소사의 취향과 말하는 방식까지 포함해서, 다른 면에서는 그와 더 비슷하다. (조지 버나드 쇼, 자기관리명언) 동작 캡처 교육, 센서 및 동작 추적 장치와 함께 프로토타입 호스트의 개인화된 특징을 부각시켜 인지도를 크게 높였습니다.

上篇: 창홍 에어컨이 켜지지 않습니다. 무엇이 문제인가요? 下篇: 하야부사 2호는 어떻게 소행성 류구(Ryugu)에 착륙했나요?
관련 내용