클라우드 호스트 파일 시스템 읽기 전용 처리 사례
배경
클라우드 호스트에 대한 유지 관리 검사를 수행하는 동안 redis 를 실행하는 클라우드 호스트가 유지 관리 중인 것으로 나타났습니다. 이 인스턴스 검사에 로그인하면 시스템 디스크가 읽기 전용이 됩니다. 이 문서에서는 이 문제의 원인을 간략하게 분석하고 운영 및 유지 관리 인력에게 일반적인 처리 방법 및 권장 사항을 제공합니다.
고장 분석
클라우드 호스트에 대한 dmesg 정보를 보고 시스템 실행 중 python 프로세스에 segfault 가 있고 vda (클라우드 호스트는 virtio-blk 로 구성되므로 문자가 vda 로 표시됨) 시스템 디스크 I/O 오류가 있음을 알 수 있습니다.
-응? 기본적으로 업무가 시스템 디스크를 잘못 썼다는 것을 확인할 수 있다. 이 문제는 일반적으로 다음 두 가지 경우에 발생합니다.
-응? 1. 클라우드 호스트와 호스트의 입출력이 사용 중이어서 클라우드 호스트의 입출력 요청이 적시에 응답하지 않아 디스크 입출력 오류가 발생합니다. 디스크 데이터를 보호하기 위해 파티션 재설치는 읽기 전용이 됩니다.
-응? 둘째, 클라우드 호스트가 강제로 종료되어 디스크에 파일 시스템 오류가 발생합니다.
문제 해결
일반적인 해결 방법은 시스템을 재부팅하고 루트 사용자로 단일 사용자 모드로 들어가 fsck.ext3–y /dev/vda (ext4 가 fsck.ext4 로 복구된 경우) 를 실행하고/dev/vda 는 시스템/루트 파티션입니다 재부팅을 복구한 후 시스템에 들어갑니다. 데비안 시스템을 예로 들어보죠.
-응? 1. 시스템을 재부팅하면 grub 메뉴에 두 개의 메뉴 항목, 일반 시작 및 복구 모드 시작이 나타납니다. 시작할 복구 모드를 선택합니다.
2. 복구 모드로 들어가 fsck 도구를 실행하여 복구합니다.
-응? 3. 다시 시작하고 정상 모드로 시작합니다.
-응? 참고:
-응? 1. 클라우드 호스트를 재부팅하기 전에 운영자는 /var/log, dmesg 아래의 일부 로그 등과 같은 주요 로그를 가능한 한 많이 수집해야 합니다. , 가능한 경우 호스트 로그를 수집합니다.
-응? 2.fsck 는 리눅스 커널에 포함된 도구입니다. 파일 시스템을 스캔할 수 있을 뿐만 아니라 파일 시스템의 일부 문제도 수정할 수 있습니다. Fsck 는 단일 사용자 모드, 복구 모드 또는 디바이스 마운트 해제 후 파일 시스템을 스캔해야 합니다. 단일 사용자 모드에서 실행하는 것이 좋습니다. 정상적으로 작동하는 시스템을 검사하면 시스템 파일이 손상될 수 있으며 실행하려면 루트 권한이 필요합니다.
건의와 사고
-응? 1, 현재 개발에는 포지셔닝 문제, 호스트 권한 신청 등의 프로세스가 필요하며 적시에 포지셔닝할 수 없습니다.
-응? 2. 현재 클라우드 호스트의 로그 수집 기능이 아직 완벽하지 않아, 제시된 로그가 잡동사니, 난잡함, 실용적이지 않아, 적절한 수정과 조정이 필요하다. 또한 운영 및 유지 보수 담당자는 개발 포지셔닝을 지원하기 위해 수집할 로그를 모릅니다.
-응? 개발은 버전에 통합, 정기적으로 시스템 데이터 수집 및 아카이빙, 또는 장애 발생 시 운영 및 유지 관리 부서에서 먼저 분석을 수집한 후 개발을 위해 포지셔닝하는 것을 고려하고 있어 효율성이 향상됩니다.
더 많은 인터넷 기술, 제품, 운영 경험 공유는 왕이윈 커뮤니티를 방문하십시오.
관련 문장:
추천? 왕이윈 방패는 다국적 다국어 콘텐츠 보안 서비스를 발표하여 중국 인터넷의 출항을 돕는다.
추천? 스프링 부츠 사용자 정의 스타터 연습
추천? 이 기사에서는 Raft 프로토콜의 요점을 소개합니다.