데이터 웨어하우스란 무엇인가요?
데이터베이스는 데이터(정보의 원재료)가 저장되는 곳이다. 데이터 웨어하우스는 데이터베이스를 사용하여 사물을 저장하는 시스템입니다. (이것은 다소 불분명합니다. 데이터베이스와 데이터웨어 하우스는 물론 데이터가 저장되는 장소라는 것을 개인적으로 이해합니다. 주요 차이점은 어떤 종류의 데이터가 설치되는지입니다. 데이터베이스에 설치된 원시 데이터는 어떤 방식으로도 처리되지 않았습니다. ; 데이터 웨어하우스는 필요한 경우 소스 데이터를 변환한 것입니다. Bill Inmon의 웨어하우스 정의의 4가지 특성을 통해 특정 프로세스를 이해할 수 있습니다. 시스템(예: 금융 시스템, 판매 시스템, 인사 시스템 등도 데이터베이스를 사용하여 물건을 설치합니다.) 차이점은 다음과 같습니다. 기본 비즈니스 시스템은 자체 관리가 특징입니다. 예를 들어 금융 시스템이 양배추를 생산하는 경우 데이터베이스를 사용하여 설치하고 인사 시스템에서 돼지 고기를 생산한 다음 데이터베이스를 사용하여 설치합니다. 요리를 만들고 싶으면 각 데이터베이스에 가서 가져와야 하는데 꽤 번거롭다(현실은 야채를 키우는 농부 아저씨에게 배달해달라고 하는 경우가 대부분인데, 배달되는 것은 내가 원하는 것이 아니고, 때로 원하는 것이 다르기 때문에 농부 삼촌에게 자주 꾸중을 들어 양측 모두를 불행하게 만듭니다.) 반면, 각 데이터베이스에는 비교적 원시적인 것들이 포함되어 있는데, 이를 요리에 사용하려면 매우 귀찮은 청소 과정을 거쳐야 하며, 그 안에는 큰 애벌레가 숨겨져 있을 수도 있습니다. 그러면 데이터 웨어하우스 시스템은 대형 슈퍼마켓을 구축해 전국 각지의 농민들이 생산한 물건을 모아서 청소하고 카테고리별로 분류하는 것이다. 이런 식으로 어떤 종류의 음식을 원할 때 슈퍼마켓에서 직접 구입할 수 있습니다. \x0d\\x0d\데이터 웨어하우스의 특성은 다음과 같습니다.\x0d\\x0d\(1) 데이터 웨어하우스는 주제 중심입니다.\x0d\(2) 데이터 웨어하우스는 통합되어 있습니다.\x0d\(3) 데이터 웨어하우스는 시간과 관련된 성별입니다.\x0d\(4) 데이터 웨어하우스의 데이터는 비교적 안정적입니다.\x0d\\x0d\데이터 웨어하우스는 의사결정 지원 시스템이라고 할 수 있습니다(저는 개인적으로 이 견해에 동의하지 않습니다. 의사결정지원시스템(DDS)은 경영정보시스템 중 DSS를 기반으로 개발되었으며, 데이터 웨어하우스, OLAP 기술, 데이터 마이닝 도구가 등장하기 이전에도 이미 DSS가 있었지만 실제 애플리케이션 개발 과정에서는 많은 문제점을 노출시켰습니다. 기존 DDS에 존재하는 문제점을 극복할 수 있는 기술을 제공합니다. DW를 기반으로 한 DSS의 지원은 자연스럽게 그 효과를 크게 향상시킬 것입니다. 이는 상사가 데이터에서 제공하는 종합적이고 요약된 데이터를 보고 기업의 전체 그림을 이해하는 데 도움이 될 수 있습니다. 창고에서 상사는 자신의 경영 경험을 바탕으로 기업의 문제점이나 문제를 발견할 수 있으며, 어떤 측면에서 어려움이나 성공 요인이 있는지, 가장 구체적인 세부 사항이 결정될 때까지 데이터를 지속적으로 추적할 수 있습니다. 상사 또는 경영진의 관리 수준을 높이고 기업의 경영을 지속적으로 개선합니다. 우리가 알고 있는 가장 좋은 예는 미국 대형 슈퍼마켓의 맥주와 기저귀 이야기입니다. 미국 월마트의 한 매장 매니저는 매주 맥주와 기저귀 판매량이 전년 대비 증가한다는 사실을 발견했지만 그 이유를 알 수 없었습니다. 이후 월마트는 BI(비즈니스 인텔리전스) 기술을 활용해 이 두 제품을 구매한 고객이 거의 모두 집에 아기를 둔 25~35세 남성이었고, 구매는 모두 주말에 이루어졌다는 사실을 알아냈다. 관련 데이터를 분석한 후 Walmart는 이 사람들이 축구 경기를 보고, 맥주를 마시고, 밤에 자녀를 돌보는 데 익숙하다는 것을 알게 되었습니다. 그들은 문제를 피하기 위해 일회용 기저귀를 사용합니다. 이 결과를 얻은 후 월마트는 이 두 제품을 함께 배치하기로 결정했고 그 결과 두 제품의 매출이 크게 증가했습니다. 데이터베이스는 데이터 웨어하우스의 기초입니다. 데이터 웨어하우스는 실제로 데이터베이스의 수많은 테이블로 구성되어 있습니다. (이 문장은 분명히 사실이 아닙니다. 데이터 웨어하우스의 테이블은 팩트 테이블과 차원 테이블로 구분됩니다. 이는 데이터베이스의 테이블과 본질적으로 다릅니다. 구성 방법은 다음과 같습니다. 완전히 다릅니다. 하나는 주제 중심이고 다른 하나는 비즈니스 중심입니다. 대량의 운영 비즈니스 데이터를 저장하는 데이터베이스를 선별, 추출, 요약, 계산하고 새로운 데이터베이스로 변환해야 합니다. 그런 다음 데이터를 표시합니다. 상사는 데이터가 보여주는 결과에 대해 우려하고 있습니다.