오디오란 무엇인가요?
오디오 정의
1.오디오는 사람이 말하는 주파수를 말하며 일반적으로 300Hz-3400Hz의 주파수 대역을 말합니다.
2. 사운드 콘텐츠를 저장하는 파일을 말합니다.
3. 어떤 측면에서는 진동을 필터라고 할 수도 있습니다.
오디오는 전문적인 용어로 사람이 들을 수 있는 모든 소리를 오디오라고 합니다. 음성, 노래, 악기 등 소리가 녹음된 후에는 이를 통해 녹음될 수 있습니다. 디지털 음악 소프트웨어를 다루고 있습니다. CD로 만들어도 CD는 원래 오디오 파일의 일종이기 때문에 이때 모든 소리는 바뀌지 않습니다. 그리고 오디오는 컴퓨터에 저장된 소리일 뿐입니다. 연설과 음악의 경우, 해당 오디오 카드(종종 사운드 카드라고 함)가 있는 컴퓨터가 있으면 모든 소리를 녹음할 수 있으며, 소리의 음향 특성과 소리의 높이를 컴퓨터에 하드 저장할 수 있습니다. 디스크 파일. 반대로, 특정 오디오 프로그램을 통해 저장된 오디오 파일을 재생하여 이전에 녹음된 사운드를 복원할 수도 있습니다.
오디오 속성 해석
지금이 디지털 시대라는 것은 누구나 인정하며, 많은 사람들이 우수한 음질을 추구하기 위해 끊임없이 노력하고 있습니다. 디지털 시대가 도래하면서 디지털 오디오가 아날로그 신호보다 우수하다는 사실은 모두가 인정합니다. 아날로그 신호란 무엇입니까? 실제로 오디오 케이블이나 마이크를 통해 전송되는 모든 소리는 일련의 아날로그 신호입니다. 아날로그 신호는 우리가 들을 수 있는 신호입니다. 디지털 신호는 신호를 보존하기 위해 물리적 수단을 사용하는 대신 여러 개의 디지털 토큰을 사용하여 소리를 녹음합니다. (일반 테이프로 녹음하는 것은 물리적인 방법입니다.) 디지털 신호는 실제로 우리에게 들리지 않습니다.
이렇게 아날로그 시대와 디지털 시대의 녹음 제작의 차이점을 간략하게 비교해 볼 수 있습니다. 아날로그 시대에는 원본 신호를 물리적으로 테이프에 녹음했습니다(물론 녹음실에서 완성되었습니다). 그런 다음 처리, 접합, 수정을 거쳐 최종적으로 테이프, LP 및 기타 매체에 녹음되어 폭넓은 청중이 즐길 수 있습니다. 이 일련의 과정은 모두 시뮬레이션되었으며, 각 단계에서 일부 신호가 손실되는 것은 당연합니다. HI-FI는 물론이고 청취자의 손에 닿는 신호도 훨씬 뒤쳐집니다. 디지털 시대의 첫 번째 단계는 원본 신호를 디지털 오디오 데이터로 녹음한 다음 하드웨어나 소프트웨어를 사용하여 처리하는 것입니다. 이 프로세스는 손실이 거의 발생하지 않기 때문에 아날로그 방식과 비교할 수 없는 장점이 있습니다. 기계의 경우 숫자만 처리하므로 코드가 손실될 가능성이 있지만 작업이 합리적이라면 그런 일은 발생하지 않습니다. 마지막으로, 이 디지털 신호 더미가 CD와 같은 디지털 녹음 장비로 전송되면 손실은 당연히 훨씬 작아집니다!
우리 주변의 CD를 주목해보면 ADD, AAD, DDD 등의 표시가 있는 CD를 많이 볼 수 있다. 세 글자는 각각 영화의 녹음, 편집, 최종 제작이라는 세 가지 과정에서 사용된 방식이 아날로그(Analog)인지 디지털(Digital)인지를 나타냅니다. 물론 A는 아날로그, D는 디지털을 의미합니다. AAD는 녹음과 편집이 아날로그 형식으로 이루어지며, 최종 녹음은 디지털 형식으로 이루어진다고 설명합니다. 이들 음반의 대부분은 과거에 녹음된 음악을 아무런 수정 없이 CD로 변환합니다. ADD에는 수정 과정이 포함됩니다. 많은 클래식 음악 거장들의 연주나 지휘자들은 대부분 아날로그 시대에 녹음되었습니다. 현재 우리가 듣는 CD는 수정된 후 캔에 녹음되었습니다. DDD의 기록은 더욱 현대적인 기록이어야 합니다. 당연히 CD는 D로 끝나야 하고, 테이프는 AAA로 간주될 수 있지만 그런 설명은 없는 것 같습니다.
그래서 디지털 오디오는 우리가 소리 신호를 보존하고 전달하는 방식으로, 그 신호가 쉽게 손실되지 않는다는 것이 특징입니다. 그리고 아날로그 신호는 우리가 들을 수 있는 마지막 신호입니다. 그러나 아날로그 신호의 변형은 재앙이었고 손실이 너무 컸습니다. 만약 글렌 굴드가 오늘날 살아 있었다면, 그가 그렇게 괴상한 사람이었다면 어안이 벙벙했을 것입니다. 디지털 오디오는 손실 없이 100번 복사할 수 있습니다. 믿을 수 없다면 WAVE 파일을 복사해 보세요.
디지털 녹음에서 가장 중요한 단계는 아날로그 신호를 디지털 신호로 변환하는 것입니다.
컴퓨터의 경우 아날로그 사운드 신호가 Wave 파일로 녹음됩니다. Windows에 포함된 음성 녹음기도 이를 수행할 수 있지만 그 기능은 매우 제한적이고 우리의 요구를 충족할 수 없으므로 대신 다음과 같은 다른 전문 오디오 소프트웨어를 사용합니다. Sound Forge et al. 녹음된 파일은 Wave 파일을 설명하는 두 가지 주요 지표가 있는데, 하나는 샘플링 정확도이고 다른 하나는 비트 전송률입니다. 이는 디지털 오디오 제작에서 매우 중요한 두 가지 개념입니다. 아래에서 살펴보겠습니다.
샘플링 정확도란 무엇인가요? Wave는 디지털 신호이기 때문에 원래의 아날로그 신호를 설명하기 위해 여러 가지 숫자를 사용하므로 원래의 아날로그 신호를 분석해야 합니다. 모든 소리에는 고유한 파형이 있으며 디지털 신호는 원래의 아날로그를 기반으로 합니다. 신호 파형. "포인트 취하기"는 가끔씩 수행되며, 각 포인트에 값이 할당됩니다. 이것이 바로 "샘플링"입니다. 그런 다음 모든 "포인트"를 연결하여 아날로그 신호를 설명합니다. 포인트가 많을수록 설명된 파형이 더 정확해집니다. 이 척도를 "샘플링 정확도"라고 합니다. 가장 일반적으로 사용되는 샘플링 정확도는 44.1kHz/s입니다. 이는 초당 44100개의 샘플을 의미합니다. 이 값을 사용하는 이유는 사람들이 반복 실험을 통해 이 샘플링 정확도가 이 값보다 낮을 경우 더 명백한 손실이 발생한다는 것을 알았기 때문입니다. 이 값보다 높으면 인간의 귀는 이미 구별하기 어렵고 디지털 오디오가 차지하는 공간이 늘어납니다. 일반적으로 "매우 정확한"을 달성하기 위해 48k 또는 96k 샘플링 정확도도 사용합니다. 실제로 96k 샘플링 정확도와 44.1k 샘플링 정확도의 차이는 44.1k와 22k만큼 크지 않습니다. 사용 CD의 샘플링 표준은 44.1k입니다. 현재도 44.1k가 여전히 가장 인기 있는 표준입니다. 일부 사람들은 96k가 향후 음반 산업의 추세가 될 것이라고 믿습니다. 샘플링 정밀도를 높이는 것은 좋은 일이지만 때로는 96k 샘플링 정밀도로 제작된 음악과 44.1k 샘플링 정밀도로 제작된 음악의 차이를 실제로 들을 수 있는지 궁금합니다. 보통 사람들의 집에 있는 화자들이 그들의 차이점을 드러낼 수 있는가?
비트 전송률은 누구나 자주 듣는 용어입니다. 디지털 녹음에서는 일반적으로 음악을 생성하기 위해 16비트, 20비트, 24비트를 사용합니다. 소리는 부드러울 수도 있고 클 수도 있으며, 부드러운 소리에 영향을 미치는 물리적 요인은 진폭이라는 것을 알고 있습니다. 디지털 녹음은 음악의 부드러운 소리를 정확하게 표현할 수 있어야 하므로 진폭에 대한 정확한 설명이 필요합니다. 1개 단위인 16비트는 아날로그 신호의 부드러운 소리에 따라 파형의 진폭이 216레벨 또는 65536레벨로 나누어진다는 의미입니다. 숫자로 나타낼 수 있는 것입니다. 샘플링 정확도와 마찬가지로 비트 전송률이 높을수록 음악의 부드러운 사운드 변화를 더 세밀하게 반영할 수 있습니다. 20비트는 1048576레벨을 생성할 수 있으며 심포니와 같이 매우 역동적인 음악을 표현하는데 문제가 없습니다. 방금 "다이내믹"이라는 용어를 언급했습니다. 이는 실제로 음악의 가장 큰 소리와 가장 가벼운 부분 사이의 대비를 의미합니다. 우리는 종종 "다이내믹 레인지"에 대해 이야기합니다. 단위는 dB이며 다이나믹 레인지는 다음과 같습니다. 녹음할 때 사용하는 비트 전송률은 매우 낮은 비트 전송률을 사용하면 소리의 강도를 설명할 수 있는 수준이 많지 않습니다. 강함과 약함 사이. 동적 범위와 비트 전송률 간의 관계는 비트 전송률이 1비트 증가할 때마다 동적 범위가 6dB씩 증가합니다. 따라서 1비트 녹음을 사용하면 다이나믹 레인지는 6dB에 불과하며 그러한 음악을 듣는 것은 불가능합니다. 16비트에서 동적 범위는 96dB입니다. 이는 일반적인 요구를 충족할 수 있습니다. 20비트의 다이내믹 레인지는 120dB로 강한 대비로 어떤 교향곡이라도 소화할 수 있으며, 음악의 강렬함을 표현하기에 충분하다. 오디오파일 레코더도 24비트를 사용하지만 샘플링 정확도와 마찬가지로 이론상 24비트는 144dB의 동적 범위를 달성할 수 있지만 실제로는 달성하기 어렵습니다. 장치는 필연적으로 소음을 발생시키므로 적어도 현 단계에서는 24비트가 예상한 효과를 달성하기 어렵습니다.
오디오 형식
다음은 일반적인 오디오 파일 형식의 특징입니다.
컴퓨터에서 오디오 파일을 재생하거나 처리하려면, 즉 사운드 파일을 디지털에서 아날로그로 변환해야 합니다. 이 프로세스도 들을 수 있는 가장 낮은 소리의 샘플링과 양자화로 구성됩니다. 인간의 귀는 20Hz에서 최고 주파수 20KHZ까지입니다. 따라서 인간의 귀는 20KHZ 이상을 들을 수 없습니다. 따라서 오디오의 최대 대역폭은 40~50KHZ 사이여야 하며 더 많은 샘플이 필요합니다. 각 샘플에 필요한 양자화 비트 수입니다. 오디오 디지털화의 표준은 선형 펄스 코드 변조 PCM을 사용하는 샘플당 16비트 -96dB 신호 대 잡음비이며 각 양자화 단계의 길이는 동일합니다. 이 표준은 오디오 파일 제작에 사용됩니다.
CD 형식: Tiansu
오늘날 세계에서 가장 좋은 음질을 제공하는 오디오 형식은 무엇입니까? 물론 CD입니다. 따라서 오디오 형식에 있어서는 CD가 당연히 선구자입니다. 대부분의 재생 소프트웨어의 "Open File Type"에서는 CD 오디오 트랙인 *.cda 형식을 볼 수 있습니다. 표준 CD 형식은 샘플링 주파수 44.1K, 속도 88K/초, 양자화 비트 16개입니다. CD 트랙은 거의 무손실이라고 할 수 있으므로 해당 사운드는 기본적으로 원음에 충실합니다. a 오디오 애호가라면 CD가 첫 번째 선택입니다. 자연의 소리를 느끼게 해드립니다. CD는 CD 플레이어에서 재생하거나 컴퓨터의 다양한 재생 소프트웨어를 사용하여 재생할 수 있습니다. CD 오디오 파일은 *.cda 파일입니다. 이는 단지 색인 정보일 뿐 실제로 사운드 정보를 포함하지 않습니다. 따라서 CD 음악의 길이에 관계없이 컴퓨터에 표시되는 "*.cda 파일"의 길이는 44바이트입니다. . 참고: 재생을 위해 CD 형식의 *.cda 파일을 하드 디스크에 직접 복사할 수 없습니다. CD 형식 파일을 WAV로 변환하려면 EAC와 같은 오디오 트랙 캡처 소프트웨어를 사용해야 합니다. CD 드라이브가 허용되고 EAC 매개변수가 설정되면 기본적으로 무손실 오디오 캡처라고 할 수 있습니다. 모든 사람이 이 방법을 사용하는 것이 좋습니다.
WAV: 무손실
Microsoft에서 개발한 사운드 파일 형식으로 PIFFResource Interchange File Format 파일 사양을 따르며 WINDOWS 플랫폼의 오디오 정보 리소스를 저장하는 데 사용됩니다. 이는 WINDOWS 플랫폼에서 사용되며 해당 응용 프로그램에서 지원됩니다. "*.WAV" 형식은 MSADPCM 및 CCITT A LAW와 같은 다중 압축 알고리즘을 지원하며 다양한 오디오 비트, 샘플링 주파수 및 채널을 지원합니다. 표준 형식 WAV 파일은 샘플링 주파수가 CD 형식과 동일합니다. 44.1K 및 88K/초의 속도, 16 양자화 비트 보시다시피 WAV 형식의 사운드 파일 품질은 PC에서 널리 사용되는 사운드 파일 형식이기도 합니다. 편집 소프트웨어는 WAV 형식을 "알고 있습니다".
그런데 Apple에서 개발한 AIFF(Audio Interchange File Format) 형식과 UNIX 시스템용으로 개발한 AU 형식이 있습니다. 이 형식은 WAV와 매우 유사하며 대부분의 오디오 편집 소프트웨어에서도 사용됩니다. 모두 이러한 일반적인 음악 형식을 지원합니다.
MP3: 인기
MP3 형식은 1980년대 독일에서 탄생했습니다. 소위 MP3는 MPEG 오디오 계층인 MPEG 표준의 오디오 부분을 의미합니다. 압축 품질과 인코딩 처리의 차이에 따라 3개의 레이어로 나누어지며, 세 가지 유형의 사운드 파일인 "*.mp1"/"*.mp2"/"*.mp3"에 해당합니다.
주의할 점은 MPEG 오디오 파일의 압축은 일종의 손실 압축이라는 점입니다. MPEG3 오디오 코딩은 기본적으로 왜곡 없이 낮은 오디오 부분을 유지하면서 10:1~12:1의 높은 압축 비율을 갖습니다. 사운드 파일은 12KHz ~ 16KHz의 높은 오디오 부분의 품질을 파일 크기로 교환합니다. 동일한 길이의 음악 파일은 일반적으로 *.wav 파일의 1/10에 불과한 *.mp3 형식으로 저장되며 음질은 CD 형식이나 WAV 형식의 사운드 파일보다 열등합니다. 파일 크기가 작고 음질이 좋기 때문에 출시 당시 이와 경쟁할 수 있는 다른 오디오 형식이 없었으며 따라서 *.mp3 형식 개발에 좋은 조건을 제공했습니다. 지금까지 이 형식은 여전히 인기가 높으며 주류 오디오 형식으로서의 위상을 흔들기 어렵습니다. 하지만 MP3에는 저작권 보호 기술이 없기 때문에 MP3 음악 저작권 문제는 아직까지 해결되지 않았습니다.
MP3 형식으로 압축된 음악에는 다양한 샘플링 주파수가 있습니다. 64Kbps 이하의 샘플링 주파수를 사용하여 공간을 절약하거나 320Kbps의 표준을 사용하여 매우 높은 음질을 얻을 수 있습니다. 우리는 Fraunhofer IIS Mpeg Lyaer3(현재 최고의 인코더)와 함께 MP3 인코더 MusicMatch Jukebox 6.0을 사용하여 3분짜리 노래를 128Kbps로 인코딩하여 2.82MB MP3 파일을 생성했습니다. 기본 CBR(고정 샘플링 주파수) 기술은 고정된 주파수에서 노래를 샘플링할 수 있는 반면, VBR(가변 샘플링 주파수)은 음악이 "사용 중"일 때 샘플링 주파수를 높여 더 높은 음질을 얻을 수 있습니다. 그러나 결과적으로 MP3 파일이 생성될 수 있습니다. 일부 플레이어에서는 재생할 수 없습니다. 기본적으로 이전 CBR 파일과 동일한 음질을 갖도록 VBR 레벨을 설정했으며, 생성된 VBR MP3 파일은 2.9MB입니다.
MIDI: 작곡가들이 가장 좋아하는 것
음악을 자주 연주하는 사람들은 MIDI(Musical Instrument Digital Interface)라는 용어를 자주 들어보았을 것입니다. MIDI를 사용하면 디지털 신디사이저와 기타 장치가 데이터를 교환할 수 있습니다. MID 파일 형식은 MIDI에서 상속됩니다. MID 파일은 녹음된 사운드가 아니라 사운드 정보를 기록한 다음 사운드 카드에 음악 재생 방법을 알려주는 일련의 명령입니다. 이러한 MIDI 파일은 저장된 음악 1분당 약 5~10KB만 사용합니다. 오늘날 MID 파일은 주로 오리지널 악기 작품, 인기곡의 아마추어 연주, 게임 사운드트랙, 전자 축하 카드 등에 사용됩니다. *.mid 파일 재생 효과는 사운드 카드의 수준에 따라 완전히 달라집니다. *.mid 형식의 가장 큰 용도는 컴퓨터 구성 분야입니다. *.mid 파일은 음악 작곡 소프트웨어를 사용하여 작성하거나, 외부 시퀀서로 연주되는 음악을 사운드 카드의 MIDI 포트를 통해 컴퓨터에 입력하여 *.mid 파일을 만들 수 있습니다.
WMA: 가장 강력한
WMA(Windows Media Audio) 형식은 Microsoft의 헤비급 플레이어로 강력한 배경을 갖고 있으며 MP3 형식보다 음질이 훨씬 좋습니다. RA 형식보다 일본 YAMAHA 회사에서 개발한 VQF 형식과 동일합니다. 이는 데이터 트래픽을 줄이면서 음질을 유지하여 MP3보다 높은 압축률을 달성합니다. WMA의 압축률은 일반적으로 약 1:18에 달합니다. WMA 장점은 콘텐츠 공급자가 Windows Media Rights Manager 7과 같은 DRM(Digital Rights Management) 솔루션을 통해 복사 방지 보호 기능을 추가할 수 있다는 것입니다.
이 내장된 저작권 보호 기술은 재생 시간, 재생 횟수, 심지어 재생 장치 등을 제한할 수 있습니다. 이는 불법 복제로 인해 어려움을 겪고 있는 음악 회사들에게는 희소식입니다. 또한 WMA는 오디오 스트리밍(Stream) 기술도 지원합니다. , 인터넷상의 온라인 재생에 적합합니다. 온라인 음악을 장악한 Microsoft의 선구자로서 기술적으로 앞서 있으며 강력한 인기를 누리고 있다고 할 수 있습니다. 더 편리한 점은 MP3와 같은 추가 플레이어를 설치할 필요가 없다는 것입니다. Windows 운영 체제 및 Windows Media Player 원활한 번들링을 사용하면 Windows 운영 체제를 설치하는 한 WMA 음악을 직접 재생할 수 있습니다. Windows Media Player 7.0의 새 버전에는 CD 디스크를 WMA 사운드 형식으로 직접 변환하는 기능이 추가되었습니다. 새로 출시된 운영 체제 Windows XP, WMA는 기본 인코딩 형식입니다. Netscape에 무슨 일이 일어났는지 모두가 알고 있으며 이제 "늑대"가 다시 등장하고 있습니다. WMA는 녹음 중에 음질을 조정할 수 있는 형식입니다. 동일한 포맷으로 음질은 CD와 맞먹고, 압축률도 높아 인터넷 방송에 활용이 가능하다. 현재는 인터넷상에서는 별로 인기가 없지만, 마이크로소프트의 대규모 프로모션으로 인해 점점 더 많은 사이트에서 인지도가 높아지고 온라인 음악 분야에서는 *.mp3에 가깝습니다. 라디오에서도 인기가 높아지고 있습니다. Real이 만든 세상을 나누세요. 따라서 거의 모든 오디오 형식은 WMA 형식의 압박감을 느낍니다.
RealAudio: Flowing Melody
RealAudio는 주로 인터넷상의 온라인 음악 감상에 적합합니다. 대부분의 사용자는 여전히 56Kbps 이하의 모뎀을 사용하고 있으므로 일반적인 재생은 최고의 음질이 아닙니다. 일부 다운로드 사이트에서는 모뎀 속도에 따라 최상의 실제 파일을 선택하라는 메시지를 표시합니다. 현재 실제 파일 형식에는 RA(RealAudio), RM(RealMedia, RealAudio G2), RMX(RealAudio Secured) 등이 있습니다. 이러한 형식의 특징은 다양한 네트워크 대역폭에 따라 음질이 변할 수 있어 대부분의 사람들이 부드러운 사운드를 들을 수 있으므로 대역폭이 더 풍부한 청취자가 더 나은 음질을 얻을 수 있다는 것입니다.
최근 네트워크 대역폭이 전반적으로 향상되면서 리얼컴퍼니는 인터넷 방송용 CD급 포맷을 출시한다. RealPlayer 소프트웨어가 이 형식을 처리할 수 없는 경우 무료 업그레이드 패키지를 다운로드하라는 알림이 표시됩니다. Real 형식으로 노래 듣기 버전을 제공하는 등 많은 음악 웹사이트가 있습니다. 현재 최신 버전은 RealPlayer 9.0입니다.
VQF: 아무도 신경 쓰지 않습니다
Yamaha의 또 다른 형식은 *.vqf입니다. 그 핵심은 데이터 트래픽을 줄이면서 음질을 유지하여 더 높은 압축률을 달성하는 것이라고 할 수 있습니다. 기술적으로도 매우 발전했지만 홍보가 부족하여 이 형식을 사용하기가 어렵습니다. *.vqf는 Yamaha 플레이어로 재생할 수 있습니다. 동시에 Yamaha는 *.wav 파일을 *.vqf 파일로 변환하는 소프트웨어도 제공합니다. 이 문서의 성격 부족은 홍보 부족과 결합되어 이제 거의 사형 선고에 가깝습니다.
OGG: 차세대 오디오 형식
ogg 형식은 완전히 오픈 소스이고 완전히 무료이며 mp3와 비교할 수 있는 새로운 형식입니다.
미래는 유망합니다
현재 MP3가 지원하는 가장 일반적인 형식은 MP3와 WMA입니다. MP3는 손실 압축이므로 일반적으로 44.1KHZ인 샘플링 속도에 주의를 기울입니다. 또한 일반적으로 8---320KBPS인 비트 전송률, 즉 데이터 스트림도 있습니다. MP3를 인코딩할 때 VBR(가변 비트 전송률)을 지원하는지 확인하세요. 현재 대부분의 MP3 플레이어가 이를 지원하므로 유효 파일 크기가 줄어들 수 있습니다. WMA는 Microsoft에서 강력하게 홍보하는 오디오 형식으로 MP3보다 상대적으로 작습니다.
오디오 처리
1. 오디오 미디어의 디지털 처리
컴퓨터 기술의 발달, 특히 대용량 저장 장치와 대용량 메모리의 발전으로 PC가 실현되면 오디오 미디어의 디지털화가 가능해집니다. 디지털 처리의 핵심은 오디오 정보의 샘플링이다. 수집된 샘플을 처리함으로써 다양한 효과를 얻을 수 있다는 것이 오디오 미디어의 디지털 처리의 기본 의미이다.
2. 오디오 미디어의 기본 처리
기본 오디오 디지털 처리에는 다음과 같은 유형이 포함됩니다.
서로 다른 샘플링 속도, 주파수, 채널 번호 간 변환 및 변환 . 변환은 단순히 이를 다른 형식으로 처리하는 반면, 변환은 리샘플링을 통해 발생하며 왜곡을 보상하기 위해 필요에 따라 보간 알고리즘을 사용할 수도 있습니다.
페이드 인, 페이드 아웃, 볼륨 조절 등 오디오 데이터 자체의 다양한 변형.
고역통과 필터, 저역통과 필터 등 디지털 필터링 알고리즘을 통한 변환입니다.
3. 오디오 미디어의 3차원 처리
오랫동안 컴퓨터 연구자들은 인간의 정보 처리에서 소리의 역할을 과소평가해 왔습니다. 가상 기술이 계속 발전하면서 사람들은 더 이상 단조롭고 평면적인 사운드에 만족하지 않고, 공간감이 있는 입체적인 음향 효과를 점점 더 찾고 있습니다. 청각 채널은 시각 채널과 동시에 작동할 수 있으므로 소리의 3차원 처리를 통해 소리의 공간 정보를 표현할 수 있을 뿐만 아니라 다채널 시각 정보와 결합하여 극도로 사실적인 가상 공간을 만들 수 있습니다. , 이는 미래의 멀티미디어 시스템에서 중요한 요소가 될 것입니다. 이는 미디어 처리에 있어서도 중요한 척도입니다.
음원 위치에 대한 인간의 인식에 대한 가장 기본적인 이론은 이중 이론으로, 두 귀 사이의 소리 도달 시간 차이와 두 귀의 강도 차이라는 두 가지 요소에 기초합니다. 두 귀 사이에서 나는 소리. 시차는 거리에 따른 것으로, 소리가 앞에서 올 때는 거리가 같으므로 시차는 없지만, 오른쪽으로 3도 정도 가면 오른쪽 귀에 도달하는 데 걸리는 시간이 된다. 왼쪽 귀보다 약 30마이크로초가 적습니다. 그리고 이는 30마이크로초로 음원의 위치를 식별할 수 있습니다. 신호의 감쇠는 거리에 따라 자연스럽게 발생하거나, 사람의 머리에 의해 가려져 소리가 감쇠되어 귀로 들리는 강도의 차이로 인해 발생합니다. 음원에 가까우면 소리 강도가 다른 쪽 귀보다 큽니다.
마찬가지로 이중화 이론에 따르면 일반 2채널 오디오를 두 채널 사이에 믹싱하면 일반 2채널 사운드가 3차원 음장처럼 들리도록 만들 수 있습니다. 효과. 여기에는 음장에 대한 다음 두 가지 개념, 즉 음장의 폭과 깊이가 포함됩니다.
음장의 폭은 시차의 원리를 이용하여 구현됩니다. 이제 일반적인 스테레오 오디오는 확장되기 때문에 음원의 위치는 항상 음장의 중앙에 유지되므로 단순화됩니다. 일하다. 처리해야 할 모든 작업은 적절한 지연과 강도 감소 후에 두 채널의 사운드를 서로 혼합하는 것입니다. 이러한 확장에는 한계가 있으므로 지연이 너무 길어서는 안 됩니다. 그렇지 않으면 에코가 됩니다.
음장의 깊이는 세기차의 원리를 이용해 구현되며, 구체적인 표현 형태는 에코이다. 음장이 깊을수록 에코 지연 시간이 길어집니다. 따라서 에코 설정에는 에코 감쇠율, 에코 깊이, 에코 간 지연이라는 세 가지 매개변수가 제공되어야 합니다. 다른 채널이 믹스하는 사운드의 깊이를 설정하는 옵션도 있어야 합니다.