TTS란 무엇인가요?
TTS는 Text To Speech의 약자로 '텍스트를 음성으로'라는 뜻이다. 내장 칩의 지원과 신경망 설계를 통해 언어학과 심리학을 모두 활용한 뛰어난 작품입니다. 텍스트를 자연스러운 음성 스트림으로 지능적으로 변환합니다. TTS 기술은 텍스트 파일을 실시간으로 변환하며 변환 시간은 초 단위로 계산할 수 있습니다. 고유한 지능형 음성 컨트롤러의 작동에 따라 텍스트 출력의 음성이 매끄러워지고, 기계 음성 출력의 차갑거나 갑작스러운 현상 없이 청취자가 정보를 들을 때 자연스러운 느낌을 갖게 됩니다. TTS 음성 합성 기술은 곧 국가 표준의 1급 및 2급 한자를 포괄할 예정이며, 영어 인터페이스를 갖추고 있으며 중국어와 영어를 자동으로 인식하고 중국어와 영어 혼합 읽기를 지원합니다. 모든 음성은 실제 중국어를 표준 발음으로 사용하여 초당 120-150자의 빠른 음성 합성과 초당 3-4자의 읽기 속도를 달성하여 사용자가 깨끗하고 쾌적한 음질과 일관되고 부드러운 억양. 요즘에는 소수의 MP3 플레이어에 TTS 기능이 있습니다.
TTS 텍스트-음성 변환은 이메일 읽기, IVR 시스템의 음성 프롬프트 등을 포함하여 널리 사용됩니다. 현재 IVR 시스템은 통신, 운송 등 다양한 산업에서 널리 사용되고 있습니다. .).
TTS에 사용되는 핵심 기술은 음성합성(SpeechSynesis)이다. 초기 TTS는 일반적으로 Texas Instruments의 TMS50C10/TMS50C57, Philips의 PH84H36 등 전용 칩을 사용하여 구현되었으나 주로 가전제품이나 어린이용 장난감에 사용되었습니다.
마이크로컴퓨터 애플리케이션 기반 TTS는 일반적으로 순수 소프트웨어로 구현되며 주로 다음 부분을 포함합니다.
●텍스트 분석 - 입력 텍스트에 대한 언어 분석을 수행하고 어휘 및 어휘를 수행합니다. 문장별 분석 텍스트 분할, 단어 분할, 다성 처리, 숫자 처리, 약어 처리 등을 포함하여 문장의 하위 수준 구조와 각 단어의 음소 구성을 결정하는 문법 및 의미 분석입니다.
●음성합성 - 음성합성 라이브러리에서 처리된 텍스트에 해당하는 단어나 문구를 추출하고, 언어적 설명을 음성파형으로 변환합니다.
● 운율 처리 - 합성 음성의 품질(Quality of Synthetic Speech)은 음성 합성 시스템에서 출력되는 음성의 품질을 말하며, 일반적으로 명확성(또는 명료도), 자연성 및 자연스러움 측면에서 주관적입니다. 일관성을 평가합니다. 명확성은 의미 있는 단어를 정확하게 듣고 구별하는 비율이며, 합성된 음성의 음질이 사람의 음성에 가까운지 여부를 평가하는 데 사용되며, 합성된 단어의 억양이 자연스러운지 여부를 평가하는 데 사용됩니다. 문장이 유창하다.
고품질 음성을 합성하기 위해 사용되는 알고리즘은 매우 복잡하기 때문에 기계에 대한 요구 사항도 매우 높습니다. 알고리즘의 복잡성에 따라 동시 다중 채널 TTS를 위한 현재 마이크로컴퓨터의 시스템 용량이 결정됩니다.
TTS입니다