컴퓨터 지식 네트워크 - 컴퓨터 프로그래밍 - 인터넷 시대의 네트워크 자동화 운영 및 유지 보수

인터넷 시대의 네트워크 자동화 운영 및 유지 보수

인터넷 시대의 네트워크 자동화 운영 및 유지 보수

인터넷에는 콘텐츠와 안구의 두 가지 주요 요소가 있습니다. "콘텐츠" 는 인터넷 회사 (또는 ICP) 에서 제공하는 웹 서비스 (예: 웹 페이지, 게임, 인스턴트 메시징 등) 를 의미합니다. "안구" 는 많은 인터넷 사용자를 의미합니다. 인터넷 회사의 콘텐츠는 종종 여러 개 또는 크거나 작은 IDC 에 분산되어 있으며, ICP 가 제공하는 콘텐츠를 바라보는' 눈' 이 늘어나고 있으며, 인터넷 회사 콘텐츠 스토리지 인프라도 폭발적으로 증가하고 있다. 콘텐츠에 대한 액세스 경험을 보장하기 위해 인터넷 회사는 서로 다른 사업자, 주/시에 비즈니스 서버를 대량으로 배포하고 IDC 인트라넷, 메트로폴리탄 네트워크, WAN 을 구축하여 비즈니스 모듈 간 커뮤니케이션을 수행하는 동시에 자체 구축 CDN 또는 CDN 전문 서비스 회사를 통해 서비스 사각 지대를 포괄해야 합니다. 따라서 비즈니스가 성장함에 따라 운영 및 유지 관리 부서가 점점 더 중요 해지고 있습니다. 다년간의 축적을 거쳐 그들은 점차 효율적인 운수 체계를 형성하였다. 이 글은 국내 인터넷 회사의 경험을 바탕으로 차세대 IT 인프라 자동화 운영 및 유지 관리 시스템을 중점적으로 연구하고 있습니다.

첫째, 운영 및 유지 보수의 세 단계

● 1 단계: 운영 및 유지 보수.

초기에는 한 회사의 IT 인프라가 일정 규모 (보통 몇 대에서 수십 대의 기계 규모) 에 이르지 못했고, 반드시 전문 운송인이나 부서가 있을 필요는 없었고, 운영 및 유지 보수 작업은 각 직무에서 분담되었다. R&D 직원은 온라인 코드와 서비스를 유지 관리하고 관리할 수 있는 서버 권한을 가지고 있습니다.

● 2 단계: 수직 자동화

업무량이 늘어남에 따라 IT 인프라는 또 다른 규모 (보통 수백 ~ 수천 대의 기계 규모) 로 발전했고, 전문화된 운영 및 유지 관리 인력은 일상적인 설치 및 유지 보수 작업을 시작하고,' 소방관' 역할을 하며, 경보를 받고, 운영 규범을 갖추고 있지만, 운영 및 유지 보수는 주로 R&D 후기 서비스를 제공합니다.

이 단계에서, 프로세스 처리로의 전환은 이미 점차 시작되었다. 운영 및 유지 관리 부서는 자신의 업무 범위에 적합한 자동화 스크립트와 함께 공개 소스 소프트웨어 조립을 시작하여 대부분의 작업을 수행하기 시작했습니다.

특히 각 제품 라인마다 SVN+ 인형 또는 요리사를 사용하여 서버 온라인 및 구성 관리를 수행하는 자체 스크립트가 있습니다.

● 3 단계: 모든 것이 자동입니다.

인터넷화의 물결 속에서 점점 더 많은 다크호스 팀이 생겨났고, 그들은 모두 짧은 시간 내에 사용자 방문량이 N 배로 증가한 경험을 가지고 있다. 트래픽이 폭발하는 과정에서 ICP 의 인터넷 인프라가 잘 뒤따를 수 있는지 여부는 비즈니스 콘텐츠가 많은 사용자의 동시 액세스를 충족시킬 수 있는지 여부를 직접 결정합니다.

동시에, 운영 및 유지 보수 시스템은 충분히 완벽하고 효율적이며 간소화되어야 합니다. 구글, 텐센트, 바이두, 알리의 회사는 일반적으로 통일된 운영 팀을 보유하고 있으며, 하나 이상의 자동화 운영 및 유지 관리 시스템을 통해 배울 수 있습니다. 운영 및 유지 보수 부서와 개발 부서는 평행 한 관점을 가질 것입니다. 또한 아키텍처 차원의 IT 인프라 최적화 및 초대형 클러스터에서의 자동 관리 및 전환에 더 많은 관심을 기울이기 시작했습니다 (예: 1).

그림 1. 대형 인터넷 회사의 IT 인프라 개요

둘째, BAT (Baidu, 알리, Tencent) 운영 및 유지 보수 시스템 분석

국내 인터넷 회사인 바이두, 알리, 텐센트 (이하 BAT) 가 제공하는 비즈니스 콘텐츠와 IT 아키텍처가 다르기 때문에 개발 과정에서 운영 유지 관리 시스템의 관심도 다르다.

1. 텐센트 운영 및 유지 보수: ITIL 기반 운영 및 유지 보수 서비스 관리

2065,438+05 년까지 텐센트 전국에 60 만 대의 서버가 있을 것으로 예상된다. 20 12 자동화 배포 관행이 성공함에 따라 현재 자동화 검수가 진행 중이다. 네트워크 장비의 경우 수요 측면에서 완전 자동화 작업: 장비 목록 자동 생성->; 구매 목록 자동 배포-> 포트 연결 및 토폴로지 관계 자동 생성-> 자동 배포 구성-> 자동 수락. 전체 운영 및 유지 보수 프로세스도 초기 기존 IT 관리에서 ITIL 기반 서비스 관리 프로세스로 발전했습니다 (그림 2 참조).

그림 2. 텐센트의 ITIL 운영 서비스 관리.

2. 아리운위체계: CMDB+ 논리적 계층 모델링을 기반으로 한 인프라 관리.

CMDB (configuration management database) CMDB (configuration management database) 는 IT 인프라의 모든 구성 요소를 구성 항목으로 저장하고, 각 구성 항목에 대한 세부 데이터를 유지 관리하고, 구성 항목 간의 관계형 데이터를 유지 관리하고, 이벤트, 변경 내역 등의 관리 데이터를 유지 관리합니다. CMDB 는 이러한 데이터를 중앙 저장소에 통합함으로써 기업이 데이터 유형 간의 인과 관계를 이해하고 관리할 수 있도록 합니다. 이와 동시에 CMDB 는 모든 서비스 지원 및 서비스 제공 프로세스와 밀접하게 관련되어 있으며, 이러한 프로세스의 운영을 지원하고, 구성 정보의 가치를 최대한 활용하며, 관련 프로세스에 의존하여 데이터의 정확성을 보장합니다. IT 서비스 지원, IT 운영 유지 보수, IT 자산 관리 내부 및 간의 프로세스 통합 및 자동화를 가능하게 합니다. 실제 프로젝트에서 CMDB 는 종종 다른 ITIL 프로세스 구축의 기초로 여겨지며 우선 순위가 부여됩니다. ITIL 프로그램의 성공은 CMDB 의 성공과 큰 관계가 있다.

바이두 자동화 운영 및 유지 보수: 배포+모니터링+비즈니스 시스템+관계.

Baidu 가 직면 한 주요 운영 및 유지 보수 과제는 갑작스런 트래픽 변화, 복잡한 환경의 영향, 신속한 반복 개발 모델 및 운영 및 유지 보수 효율성, 운영 및 유지 보수 품질 및 비용 간의 균형입니다. Baidu 의 운영 및 유지 보수 팀은 서버 규모가 수만 명에 도달하면 운영 및 유지 보수 관점을 서비스 세분성으로 전환해야한다고 믿습니다. 1 만대는' 100 대 *100' 을 의미하지 않습니다. 기계의 작동 상태는 더 이상 비즈니스의 작동 상태를 나타내지 않습니다. 운영 및 유지 관리 부서는 R&D 에 사전 서비스를 제공하며, 클러스터 확장에 따라 서비스 간의 관계는 점점 더 복잡해지고 있습니다.

그림 3. Baidu 자동화 운영 및 유지 보수 기술 프레임 워크

바이두 자동화 운영 및 유지 보수 기술 프레임워크는 배포, 모니터링, 비즈니스 시스템, 관계의 네 부분으로 나뉩니다. 전체 프레임워크는 비즈니스 및 IT 인프라의 통합을 강조하고 "관계" 연계에 중점을 둡니다. 연관이란 주로 작업 간의 타이밍 의존성, 작업 간의 데이터 의존성 및 작업과 리소스 간의 참조 의존성을 말하며, 각각 작업 스케줄링, 데이터 전송, 리소스 위치 지정 등의 서비스 프로세스에 대응하여 여러 서비스 체인을 형성합니다.

관계의 운영 및 유지 보수는 비즈니스와 매우 관련이 있으며 복잡한 서비스 체인에서 비즈니스 위치를 찾고, 장애 발생 시 영향 범위를 예측하며, 해당 부서에 적시에 포지셔닝하고 알릴 수 있도록 관계의 전모를 정리하는 시스템이 필요합니다. 이러한 시스템에서는 자동 모니터링 시스템이 매우 중요합니다. Baidu 의 기술 모니터링 프레임워크는 주로 데이터 수집, 서비스 테스트, 타사 정보 수집, 모니터링 평가를 통해 데이터 처리 및 경보 연계 모듈에 전달되어 처리되며 API 인터페이스를 통해 기능을 확장합니다 (그림 4).

그림 4. 바이두 자동화 기술 모니터링 프레임워크

실제로 BAT 와 같은 인터넷 회사와 기타 업계 기업들은 IT 인프라 라이브러리 (ITil) 또는 ISO20000 서비스 관리 모범 사례를 따라 자동화된 IT 관리 솔루션을 사용하여 서비스 중단 감소, 운영 비용 절감, it 효율성 향상과 같은 중요한 비즈니스 목표를 달성합니다. ITIL 및 ISO 20000 버전 3.0 이 출시되고 보급됨에 따라 사실상 표준이 되었습니다. 오늘날의 엔터프라이즈 IT 관리 분야에서는 두 가지 기준이 절실히 필요합니다. 특히 ISO20000 인증 요구 사항은 기업에서 점점 더 보편화되고 있습니다. ITIL v3.0 은 전략, 설계, 변환, 운영, 개선에 이르는 IT 운영 및 유지 관리의 전체 수명 주기 관리를 다룹니다. 관련 방안은 종종 여러 분야와 제품을 포괄하며 계획, 구현, 도구 선택이 서로 얽혀 있다. 오픈 소스 도구를 선택하면 CMDB 에서 많은 개발 작업이 발생할 수 있으며, 비용 대비 효과를 중시하는 많은 기업에 참고할 수 있지만 성능과 효과를 보장할 수 없기 때문에 반드시 적용되는 것은 아닙니다. 따라서 성숙한 사업 계획서가 더 좋은 선택이 될 것이다.

최신 iMC V7 버전은 리소스, 사용자, 서비스의 3 차원 혁신을 중심으로 SOM 서비스 운영 유지 관리 관리 (ITIL 및 ISO20000 표준 기반) 등의 구성 요소를 발표하고 서버 관리를 추가하여 더 많은 인터넷 기반 시나리오 요구 사항을 충족합니다.

일반적으로 효율적이고 사용하기 쉬운 구성 관리 데이터베이스는 일반적으로 유연한 정보 모델 정의 통합, 표준 준수, 내장 정책 지원, 자동 검색, 엄격한 액세스 제어 등 6 가지 중요한 기준을 충족해야 한다고 생각합니다. 일반적으로 엔터프라이즈 IT 인프라에는 네트워크 장치, 서버, 가상 시스템 등과 같은 다양한 유형의 요소와 관리 데이터가 있습니다. 따라서 다양한 정보를 저장할 수 있는 적절한 통합 방법이 필요합니다. IMC 지능형 관리 플랫폼은 이미 네트워크 장치와 서버 장치의 요구를 충족시킬 수 있지만, 서버 가상화 기술이 발전함에 따라 가상 머신은 IT 인프라의 주요 요소가 되고 있습니다. 따라서 CAS CVM 가상화 관리 시스템을 기반으로 중국 3 통신은 서버 CPU, 메모리, 디스크 I/O, 네트워크 I/O 및 가상 시스템 리소스와 같은 중요한 리소스를 완벽하게 관리합니다. BAT 와 달리 H3C 의 네트워크 관리 소프트웨어는 업계 지향적입니다. 현재 도메인 이름 관리 등 특수 자원에 대한' 관리' 는 없지만 API 인터페이스를 통해 특수 시스템과 연계해 맞춤형 운영 차원의 요구를 충족시킬 수 있다. 특히 인터넷 시나리오에서는 비즈니스 요구 사항에 따라 맞춤형 도킹 요구 사항을 많이 달성할 수 있습니다. 예를 들어, iMC+WSM 구성 요소는 국내 한 대형 인터넷 회사의 포털 시스템과 도킹되고, iMC 도구는 사용자 자체 운영 및 유지 관리와 도킹됩니다. 또한 알리의 논리적 계층 모델링과 마찬가지로 H3C "IMC+CAS" 소프트웨어 시스템도 상위 계층에 많은 논리적 추상화와 계층화를 만들어 많은 모듈을 형성하고 있습니다. 즉, 여러분이 볼 수 있는 다양한 구성 요소를 형성합니다.

셋째, 네트워크 자동화 운영 및 유지 보수 시스템

"기본적인 기술 능력만 가진 낯선 사람이라도 전문적인 IT 운영 및 유지 보수를 할 수 있습니다. 중학교 학력을 가진 운영 및 유지 보수 직원조차도 팀을 이끌고 중소형 기계실 노드 건설을 완료하고 수백 ~ 수천 대의 서버 유지 관리를 담당할 수 있습니다. "이는 일부 회사의 IT 운영 및 유지 보수 수준에 대한 전반적인 평가입니다. 과장된 것처럼 보이지만 실제로는 강력한 IT 운영 및 유지 관리 시스템에 의존하여 국내 많은 인터넷 회사들이 이미 이 기준에 도달하거나 접근할 수 있게 되었습니다.

이들 기업은 운수 발전의 각 단계를 거쳤다. 운영 및 유지 보수 부서는 수동적이고 고립되어 분산 된 "소방대" 팀이었습니다. 이후 개발 과정에서 IT 시스템 아키텍처는 점차 표준화되고 모델링되었습니다. 운영 및 유지 보수 부서는 모든 하드웨어 구성, 모든 소프트웨어 매개 변수 구성, 구입 날짜, 유지 보수 기록, 운영 및 유지 보수 위험 간판 등을 포함한 완벽한 장비 및 시스템 자원 관리 데이터베이스 및 지식 기반을 구축했습니다. 네트워크 관리 소프트웨어를 통해 운영 및 유지 보수 과정에서 모든 문제, 이벤트, 변경, 서비스 수준 등의 정보가 수집되어 관리 시스템에 입력되어 지속적으로 개선되고 자동화된 운영 지원 메커니즘이 형성됩니다. 클라우드 컴퓨팅 아키텍처에 따르면 이러한 시스템의 주요 IT 리소스에는 컴퓨팅, 스토리지 및 네트워크 리소스가 포함됩니다. 최근 몇 년 동안, 네트워크 장비 제조업체의 추진으로 네트워크 장비 관리의 자동화 기술도 충분히 발전하였다.

요약하자면, 한 기업이 인터넷 건설 초기에 사용자 방문이 증가함에 따라 자신의 자원을 확대하는 방법을 고려해야 한다. 구체적으로 계획, 건설, 관리, 모니터링 및 운영 유지 보수의 다섯 가지 측면으로 세분화될 수 있습니다.

1. 계획 모델링

후속 업무의 원활한 확장과 네트워크 관리 시스템의 원활한 후속 조치를 보장하기 위해 인터넷 회사는 일반적으로 초기 전체 시스템 아키텍처 설계에서 표준화와 모델링을 충분히 고려하며, 비즈니스 자원을 늘리는 것은 패스트푸드처럼 필요에 따라 이용한다.

표준화: 첫째, 표준 프로토콜 및 기술을 사용하여 구축, 확장성 향상, 제품 통합, 관리가 용이합니다. 두 번째는 데이터 센터급 장비를 채택하여 안정성과 유연성을 보장하고 업무 시스템의 짧은 지연 요구 사항을 충분히 고려하는 것입니다.

모델링: 비즈니스 요구 사항에 따라 네트워크 아키텍처 모델을 설계하고, 검증 후 기준선을 형성하며, 대량 복제, 통합 관리 또는 자동화를 통해 배포 효율성과 네트워크 관리 효율성을 향상시키는 데 적합합니다.

그림 5. 범용 인터넷 IDC 아키텍처

2. 건물 자동화

인터넷 IT 인프라가 대량 복제 기능을 갖추면 자동화 기술을 통해 온라인 효율성을 높일 수 있습니다. 새 노드 건설 과정에서 3 ~ 5 명의 소팀이 기계실의 온라인 작업을 완성할 수 있다. 예를 들어, 한 인터넷 회사는 해외 긴급 업무 요구로 인해 장비 설치, 배포 및 기본 구성을 위해 엔지니어 2 명을 현장에 파견했습니다. 그런 다음 인터넷 링크를 통해 장치가 본사 관리 시스템에서 구성 및 장치 버전을 자동으로 가져오고, 비즈니스 시스템을 다운로드하고, 1 주 내에 기계실 장비 설치를 완료합니다.

자동화된 운영 유지 관리 목표를 달성하기 위해서는 그림 6 과 같이 구축 과정에서 두 가지 측면을 고려해야 합니다.

대량 복제: 비즈니스 요구 사항에 따라 기술 관심 분야를 정리하고, 네트워크 모델을 설계하고, 충분한 테스트와 파일럿을 수행하고, 하드웨어 및 소프트웨어 구성 템플릿을 출력한 다음 대량 배포를 수행합니다.

자동 온라인: TR069, Autoconfig 등의 기술을 최대한 활용하고, 제로 구성 기능을 사용하며, 대량 자동 온라인 장치를 사용하여 효율성을 두 배로 높입니다.

그림 6. 온라인 배치 구성 및 자동화

○ 자동 구성과 TR069 사이에는 세 가지 주요 차이점이 있습니다.

○ Autoconfig 는 제로 구성 배포에 적합하며, 이후 일반적으로 전용 네트워크 관리 시스템이 필요합니다. TR069 는 초기 제로 구성에서 유용할 뿐만 아니라 언제든지 장치를 모니터링 및 구성하고 소프트웨어를 업그레이드할 수 있는 완벽한 관리 솔루션입니다.

○ 자동 구성 DHCP 및 TFTP-simple 사용, TR069 제로 구성 DHCP 및 HTTP-complex 사용, 전용 ACS 서버 필요.

보안: TR069 는 HTTPS/SSL 을 기반으로 더 안전합니다.

H3C iMC BIMS 는 TR-069 프로토콜의 ACS (자동 구성 서버) 기능을 구현하고 TR-069 프로토콜을 통해 CPE 장치를 원격으로 관리합니다. BIMS 는 제로 구성 기능 및 이점, 유연한 네트워킹 기능, DHCP 장치 및 NAT 이후 사설망 장치를 관리할 수 있습니다. BIMS 의 작업 흐름은 그림 7 에 나와 있습니다.

그림 7. 7 의 작업 흐름. H3C iMC BIMS

3. 지능형 관리

네트워크 관리 팀의 경우 다른 팀에 정보 조회, 경보 관리 등의 작업을 위한 편리한 도구가 필요합니다. 초기 네트워크 관리 도구는 종종 명령줄 작업과 불가분의 관계에 있으며 배치에 대한 지원도 좋지 않았습니다. 예를 들어, 네트워크 장치의 MIB 라이브러리는 C, C++ 및 기타 지능형 신기술 Netconf 보다 훨씬 어색합니다. 따라서 사용 측면에서 그래픽, 지능형 관리 도구는 종종 인기가 있습니다.

지능화: 새로운 기술을 활용하여 기존 MIB 관리 모델의 처리 효율성을 높이고 임베디드 자동화 아키텍처를 도입하여 지능형 터미널의 APP 관리를 가능하게 합니다 (그림 8 참조).

그림 8. 지능형 메시지 및 이벤트 처리

● 넷콤 기술

현재 주요 네트워크 관리 프로토콜은 SNMP 와 Netconf 입니다. SNMP 는 UDP 를 사용하여 간단하고 기술적으로 성숙하지만 보안 안정성, 관리 운영 효율성, 상호 작용, 복잡한 운영 구현 등의 측면에서 관리 요구 사항을 충족하지 못합니다. Netconf 는 XML 을 구성 데이터 및 프로토콜 메시지 내용의 데이터 인코딩 방법으로 사용하고, TCP 기반 SSHv2 를 사용하여 전송하고, RPC 를 사용하여 운영 및 제어를 수행합니다. XML 은 포트, 프로토콜, 서비스 및 해당 관계와 같은 복잡한 내부 논리 및 모델 관리 객체를 표현할 수 있으므로 운영 효율성과 객체 표준화가 향상됩니다. SSHv2 전송 모드를 사용하여 안정성, 보안 및 상호 작용이 우수합니다. 이들 사이의 주요 대비 차이는 표 1 에 나와 있습니다.

표 1 네트워크 관리 기술 비교

● EAA 임베디드 자동화 아키텍처

EAA 자동화 아키텍처 구현에는 다음 세 단계가 포함됩니다.

○ 관심 있는 이벤트 소스, 즉 시스템의 소프트웨어 또는 하드웨어 모듈 (예: 특정 명령, 로그, 트랩 경고 등) 을 정의합니다.

○ 장치 구성 저장, 활성 및 대기 간 전환, 재시작 프로세스 등과 같은 EAA 모니터링 정책을 정의합니다.

○ 정의된 이벤트 소스가 모니터링될 때 EAA 모니터링 정책을 트리거합니다.

4. 모니터링 플랫폼

쇼, 디스플레이, Show, Syslog 등과 같은 기본적인 모니터링 도구를 활용합니다. , 통합 환경을 모니터링하기 위한 플랫폼 모니터링 기능을 제공합니다 (그림 참조).

을 눌러 섹션을 인쇄할 수도 있습니다

上篇: 사명소환 휴대폰 게임 컴퓨터는 놀 수 있나요? 下篇: 구천선몽 무한원보판이 있나요?
관련 내용