'빅데이터'로 간주되는 데이터의 양은 얼마나 되나요?
빅데이터란 무엇인가?
빅 데이터에 대해 일반적으로 사용되는 세 가지 정의를 나열하십시오.
(1) 강력한 의사 결정, 통찰력 및 프로세스 최적화 기능을 갖춘 대규모, 고성장 및 다양한 정보 자산에는 새로운 것이 필요합니다. 처리 모드.
——Gartner
(2) 대규모 데이터 볼륨, 빠른 데이터 흐름 및 동적 데이터 속도, 다양한 데이터 유형 및 막대한 데이터 가치.
—— IDC
(3) 또는 대규모 데이터, 대량 데이터, 빅 데이터. 이는 관련 데이터가 너무 커서 합리적인 시간 내에 가로채서 관리할 수 없음을 의미합니다. 정보를 인간이 해석할 수 있는 정보로 처리하고 구성합니다.
——위키
빅 데이터에 대한 다른 정의도 유사합니다. 빅 데이터를 정의하는 데에는 여러 가지 키워드가 사용될 수 있습니다.
첫 번째는 두 가지 차원에서 측정할 수 있는 '대규모'입니다. 하나는 시계열에서 대량의 데이터를 축적하는 것이고, 다른 하나는 데이터를 심층적으로 정제하는 것입니다.
둘째, '다양성'은 텍스트, 사진, 동영상 등과 같은 다양한 데이터 형식일 수 있습니다. , 이는 인구 데이터, 경제 데이터 등과 같은 다양한 데이터 카테고리일 수 있습니다. , 인터넷, 센서 등 다양한 데이터 소스가 있을 수도 있습니다.
셋째, '동적'입니다. 데이터는 끊임없이 변화하고 있으며, 시간이 지남에 따라 대량으로 급격히 증가할 수도 있고, 공간 내에서 지속적으로 이동하고 변화하는 데이터일 수도 있습니다.
빅데이터의 이미지를 정의하는 세 가지 키워드입니다.
그러나 핵심 역량이 필요한데 바로 '빠른 처리 속도'다. 이처럼 규모가 크고 다양하며 역동적인 데이터가 있는데 처리하고 분석하는 데 시간이 오래 걸린다면 빅데이터라고 할 수 없습니다. 다른 관점에서 보면, 이러한 데이터를 신속하게 처리하려면 수동으로 처리할 수 있는 방법이 없으므로 기계의 도움을 받아 처리해야 합니다.