본문 바로가기
컴퓨터&네트워크

파일 시스템 관리 관련해서

by 파란하랑 2024. 9. 12.

파일-백업

파일 시스템 백업

 

파일 시스템의 파손은 컴퓨터의 파손보다 더 큰 문제가 생긴다. 컴퓨터가 화재, 번개 등으로 인한 전기 충격, 혹은 키보드에 커피를 쏟는 것들로 인해서 문제가 생긴다면, 금전적인 손해와 난처한 상황들이 발생하지만, 일반적으로는 부품을 대체해서 혼선을 줄일 수가 있다. 값이 싼 개인용 컴퓨터의 경우 컴퓨터 판매점에 가서 한 시간 안에 대체물을 구입할 수도 있겠다.

 

하드웨어나 소프트웨어 문제로 컴퓨터 파일 시스템이 완전히 회복할 수 없을 만큼 파손이 된다면, 모든 정보를 복구하는 것은 사실상 불가능하고 더불어 시간을 필요로 하며 대다수의 경우 아예 복구가 불가능해진다. 이 경우에는 프로그램, 문서, 세금 기록, 고객 파일, 데이터베이스, 판매 계획서, 기타 다른 모든 정보가 영원히 사라지게 된다.

 

파일 시스템은 장비나 매체의 물리적인 파손을 막는 방법을 제공하지는 못하지만 정보를 보호할 수 있도록 도와줄 수는 있다. 이는 상당히 간단한 방법으로, 단순하게 백업을 만드는 것이다. 다만, 백업은 말처럼 그렇게 간단한 것이 아니다.

 

갑자기 디스크가 정지해서 최후의 순간을 맞이하기 전까지 대다수의 사람들은 백업을 만드는 것이 이를 위해 소비되는 시간, 노력만큼의 가치가 있다고 생각하지는 않는다. 다만, 기업들은 데이터의 가치를 잘 인식하고 있고, 보통 하루에 적어도 한 번 이상은 백업을 실행한다. 현대의 테이프는 수백 기가 바이트를 저장할 수가 있고 비용은 상당히 저렴하다. 그렇지만, 백업을 만드는 것은 여전히 단순하지 않다.

 

재난이 발생했을 때 복구하는 상황을 보면 디스크 파손, 화재 등과 같은 자연 재해가 발생한 이후에도 컴퓨터 시스템이 계속적으로 동작할 수 있도록 하는 것을 말한다. 현실적으로 이런 사고는 드물게 발생하며, 이는 사람들이 백업에 대해 크게 신경 쓰지 않는 이유 중 하나이다.

 

혹은 사람들이 실수로 파일을 삭제하고 나서  이후에 다시 필요하게 되어 복구해야 하는 상황이 있을 수가 있다. 이런 경우는 너무 자주 발생하기 때문에, windows 운영체제는 파일을 삭제하면 이를 실제로 바로 삭제하지는 않고 휴지통이라고 불리는 특별한 디렉터리로 옮겨 놓는다. 그 이후, 나중에 필요하게 되면 이 곳에서 파일을 쉽게 복구할 수 있도록 하는 것이다. 백업은 이 개념을 더욱 발전시킨 것으로 몇 일 전 혹은 몇 주 전에 삭제된 파일을 백업 테이프로부터 복구할 수 있도록 한다.

 

백업을 만드는 것은 시간이 상당히 오래 걸리고 많은 공간을 차지하기에, 이를 간편하게 실행할 수 있도록 하는 것은 상당히 중요하다. 이런 부분들을 고려하면서 한 번 생각해 보자. 파일 시스템의 모든 영역이 백업되어야 할까 아니면 일부만 백업되어도 충분할까? 설치되어 있는 대다수의 컴퓨터들을 살펴보면, 실행 프로그램들은 파일 시스템 트리의 일정 부분에 존재하고 있다. 만약, 이런 프로그램들이 제작사의 CD-ROM으로부터 다시 설치하는 것이 가능하다면, 이 파일들은 백업할 필요가 없다. 그리고 대부분의 시스템은 임시 파일을 위한 디렉터리를 가지고 있고, 이곳의 파일은 백업이 불필요하다.

 

지난번 백업 이후 변경되지 않는 파일을 백업하는 것은 낭비이며, 이는 다시 점진적 덤프라는 개념을 생각하게 만든다. 점진적 덤프의 가장 간단한 구조는, 주마다 혹은 달마다 주기적으로 완전 덤프를 실행하며, 매일 실행하는 경우에는 지난번 완전 덤프 시점 이후 변경된 파일만 복사하는 것이다. 이러한 기법은 덤프에 필요한 시간을 최소화할 수가 있지만, 복구는 상당히 복잡하며 가장 최근의 완전 덤프로부터 복구한 후에 차례대로 점진적 덤프를 역으로 실행해야만 한다. 복구를 빠르게 하기 위해서는 더 정교한 덤프 기법이 사용되기도 한다.

 

또한 일반적으로 대단히 많은 양의 데이터가 덤프되기에, 데이터를 테이프에 기록하기 전에 압축하는 것이 바람직할 수도 있겠다. 다만, 많은 압축 알고리즘의 경우에는, 백업 테이프의 일부분이 손상되면 압축 알고리즘의 동작이 교란되어 전체 파일 혹은 전체 테이프를 읽지 못하게 된다. 즉, 백업 데이터 흐름을 압축하는 알고리즘은 매우 신중하게 선택되어야만 한다.