기본 오디오 개념

인간의 귀가 들을 수 있는 주파수 범위는 약 20Hz~20kHz입니다.

샘플링 및 양자화 기술을 통해 얻은 이산(디지털) 오디오 데이터입니다. 컴퓨터는 내부적으로 바이너리 데이터와 디지털 오디오를 처리하므로 아날로그 오디오는 샘플링과 양자화(즉, 오디오 디지털화)를 통해 제한된 수로 표현되는 이산 시퀀스로 변환되어야 합니다.

고품질 오디오 신호의 경우 주파수 범위(사람의 귀가 들을 수 있는 주파수 범위)는 20Hz~20kHz이므로 샘플링 주파수는 일반적으로 44.1kHz이므로 샘플링된 사운드가 도달할 수 있습니다. 20kHz를 디지털화하여 디지털 처리 후에도 사람의 귀로 들리는 소리의 품질이 저하되지 않습니다. 소위 44.1kHz는 초당 44,100번 샘플링된다는 의미입니다.

양자화는 16비트 이진 신호를 사용하여 사운드 샘플을 나타내는 것과 같이 진폭 축에서 신호를 디지털화하는 것을 의미합니다.

샘플의 이진 자릿수, 즉 샘플의 비트 수를 나타냅니다. 양자화는 샘플링을 통해 얻은 개별 데이터를 이진수로 변환하는 프로세스입니다. 양자화 깊이는 각 샘플링 지점을 표현하는 데 사용되는 비트 수를 나타냅니다. 컴퓨터에서 오디오의 양자화 깊이는 일반적으로 4, 8, 16, 32비트(비트)입니다. ), 등. 예를 들어, 양자화 깊이가 8비트인 경우 각 샘플링 포인트는 256개의 서로 다른 양자화 값을 나타낼 수 있고, 양자화 깊이가 16비트인 경우 각 샘플링 포인트는 65536개의 서로 다른 양자화 값을 나타낼 수 있습니다. 양자화 깊이의 크기는 사운드 품질에 영향을 미칩니다. 분명히 비트가 많을수록 양자화된 파형이 원래 파형에 가까워지고 사운드 품질이 높아지며 더 많은 저장 공간이 필요합니다.

즉, 특정 기록에 따라 디지털 데이터를 샘플링하고 양자화하여 순차 저장 또는 압축 저장 등의 형식으로 저장합니다.

==비트 전송률== (단위 시간당 오디오 데이터의 용량을 측정하는 데 사용됩니다)

음파의 상호 변환을 구현하는 일종의 하드웨어입니다. 디지털 신호. 사운드 카드의 기본 기능은 마이크, 테이프, 컴팩트 디스크 등의 원본 소리 신호를 변환하여 헤드폰, 스피커, 앰프, 테이프 레코더 등의 음향 기기로 출력하거나, 이를 통해 악기가 아름다운 소리를 낼 수 있도록 하는 것입니다. MIDI(음악 장비 디지털 인터페이스).

==무손실 압축==은 압축이 풀린 데이터를 완전히 복원할 수 있다는 의미입니다. 일반적으로 사용되는 압축 형식 중 가장 일반적으로 사용되는 것은 손실 압축입니다.

==손실 압축== 압축이 풀린 데이터는 완전히 복원할 수 없으며 압축 비율이 작을수록 일부 정보가 손실됩니다. , 더 많은 정보가 손실될수록 신호 복원 후 왜곡이 더 커집니다.

다양한 애플리케이션 시나리오(저장 장치, 전송 네트워크 환경, 재생 장치 등 포함)에 따라 PCM, WAV, AAC, MP3, Ogg 등과 같은 다양한 압축 인코딩 알고리즘을 선택할 수 있습니다.

압축 코딩의 원리는 실제로 중복 신호를 압축하는 것입니다. 중복 신호는 사람의 귀로 감지할 수 없는 신호를 말합니다

그리고 WAV 코딩 하나 구현(구현은 많지만 압축 작업을 수행하는 구현은 없음)은 PCM 샘플링 속도, 채널 수, 데이터 형식 및 기타 정보를 설명하는 데 사용되는 PCM 데이터 형식 앞에 44바이트를 추가하는 것입니다.

MP3는 LAME 인코딩(MP3 인코딩 형식 구현)을 사용하여 중간 및 높은 비트 전송률의 압축률이 좋으며 소스 WAV 파일과 매우 유사합니다. 최상의 결과를 얻으려면 적절한 매개변수를 조정해야 합니다.

특징: 음질은 128Kbit/s 이상으로 좋고, 압축률도 상대적으로 높으며, 다수의 소프트웨어와 하드웨어가 이를 지원하고, 호환성도 좋습니다.

적용 가능한 경우: 높은 비트 전송률에서 호환성이 필요한 음악 감상.

AAC는 차세대 오디오 손실 압축 기술(PS, SBR 등)을 통해 LC-AAC, HE-AAC, HE의 세 가지 유형을 파생했습니다. -AAC v2. 주요 인코딩 형식

특징: 128Kbit/s 미만의 비트 전송률에서 탁월한 성능을 발휘하며 주로 비디오의 오디오 인코딩에 사용됩니다.

적용 가능한 경우: 128Kbit/s 미만의 오디오 인코딩, 주로 비디오의 오디오 트랙 인코딩에 사용됩니다.

Ogg는 다양한 비트 전송률, 특히 중간 및 낮은 비트 전송률 시나리오에서 탁월한 성능을 보이는 매우 유망한 인코딩입니다. 좋은 음질 외에도 Ogg는 완전 무료이므로 Ogg가 더 많은 지원을 받을 수 있는 기반이 됩니다. Ogg는 더 작은 비트 전송률로 더 나은 음질을 얻을 수 있는 매우 우수한 알고리즘을 가지고 있습니다.

특징: MP3보다 더 작은 비트 전송률로 MP3보다 더 나은 음질을 얻을 수 있습니다.

u>, 고, 중, 저 비트 전송률에서 성능은 좋지만 호환성이 좋지 않고 스트리밍 미디어 기능이 지원되지 않습니다.

적용 가능한 경우: 음성 채팅을 위한 오디오 메시지 시나리오.

(Moving Picture Experts Group, Moving Picture Experts Group)은 ISO(국제표준화기구, 국제표준화기구)와 IEC(국제전기기술위원회, 국제전기기술위원회)가 1988년에 설립한 영화 전문 단체입니다. 음성 압축에 대한 국제 표준을 개발하는 조직입니다.

Acc 오디오 프레임에는 1024개의 샘플링 포인트가 포함되어 있고 MP3 오디오 프레임에는 1152개의 샘플링 포인트가 포함되어 있습니다.

오디오 프레임의 재생 시간

시퀀서 소프트웨어에 표시되는 병렬 "트랙"입니다. 각 오디오 트랙은 트랙의 음색, 음색 라이브러리, 채널 번호, 입력/출력 포트, 볼륨 등과 같은 오디오 트랙의 속성을 정의합니다.

시퀀서를 사용할 때 트랙은 특정 시간 위치의 MIDI 또는 오디오 데이터를 녹음하는 음악의 일부에 해당합니다. 각 트랙은 악기의 연주로 정의될 수 있습니다. 모든 시퀀서는 멀티 트랙 작동을 허용합니다. 즉, MIDI든 오디오든 노래의 모든 트랙을 동시에 재생할 수 있습니다.

녹음이나 재생 시 서로 다른 공간적 위치에서 수집되거나 재생되는 독립적인 오디오 신호를 의미합니다. 따라서 채널 수는 녹음 시 음원의 수 또는 해당 스피커의 수이기도 합니다. 재생 중.

듀얼 채널부터 시작하여 녹음 과정에서 사운드가 두 개의 독립 채널에 할당되어 좋은 사운드 정위 효과를 얻습니다. 이 기술은 특히 음악 감상에 유용합니다. 청취자는 다양한 악기가 나오는 방향을 명확하게 구분할 수 있어 음악을 더욱 상상력이 풍부하고 현장 경험에 더 가깝게 만들 수 있습니다.

소리를 녹음할 때 매번 하나의 음파 데이터가 생성되면 모노포닉, 매번 두 개의 음파 데이터가 생성되면 바이노럴이라고 합니다. 소리의 바이노럴 녹음을 사용하면 소리의 방향을 어느 정도 재현하고 인간 귀의 청각 특성을 반영할 수 있습니다.

오디오 샘플링 속도는 녹음 장치가 1초 동안 사운드 신호를 샘플링하는 횟수를 의미합니다. 샘플링 주파수가 높을수록 사운드가 더 현실적이고 자연스럽게 복원됩니다. 오늘날의 주류 캡처 카드에서 샘플링 주파수는 일반적으로 11025Hz, 22050Hz, 24000Hz, 44100Hz 및 48000Hz의 다섯 가지 레벨로 나뉩니다.

주파수는 시간 축에 해당하고 진폭은 레벨 축에 해당합니다. 파도는 한없이 매끄러우며, 끈은 무수히 많은 점들로 구성되어 있다고 볼 수 있다. 저장 공간이 상대적으로 제한되어 있기 때문에 디지털 인코딩 과정에서 끈의 점들을 샘플링해야 한다. 샘플링 과정은 특정 지점의 주파수 값을 추출하는 것입니다. 당연히 1초에 더 많은 지점을 추출할수록 더 풍부한 주파수 정보를 얻을 수 있습니다. 파형을 복원하려면 한 번의 진동으로 두 지점을 샘플링해야 합니다. 인간의 귀로 느낄 수 있는 가장 높은 주파수는 20kHz입니다. 따라서 인간의 귀에 들리는 요구 사항을 충족하려면 초당 최소 40k 샘플이 필요하며, 이 40kHz가 샘플링 속도입니다. 우리가 흔히 사용하는 CD의 샘플링 속도는 44.1kHz입니다.

上篇: 무인 구역의 문을 다시 장착하는 것은 어떻게 들어가나요? 下篇: 문과 창문 분리 경보기가 울리지 않는 이유는 무엇입니까?