회원가입

로그인

아이디
비밀번호
ID/PW 찾기
아직 회원이 아니신가요? 회원가입 하기

파일 압축이 머야?

Profile
CSI:맥노턴.
"파일 압축이 뭐야?"
"그거 압축한거니까 풀어서 써야돼~"
"압축 파일로 보내주세요"

압축이 뭘까요?

쉽게 말해서...
< 우리가 사용하는 바이너리, 문서, 이미지, 사운드 파일 등을 일정한 알고리즘을 통해 원본보다 적은 용량을 가진 파일로 만드는 것을 말합니다. >

왜?
< 용량이 작으면 보관하기가 쉽고, 용량이 작은 저장매체로 복사하는 것이 가능해 집니다~ 네트워크를 통해 데이터를 전송하는 시간도 단축됩니다.>

그밖에?
<압축 유틸리티들은 여러개의 파일을 하나의 파일로 묶는 기능이 들어 있어... 100개의 파일을 100번에 걸쳐 전송하지 않아도, 100개의 파일을 하나로 묶어서 전송하면 한번에 전송한 뒤에, 상대방에서 묶음을 풀기만하면 되니까 손발이 덜 고생하게되어 인생이 편안해 집니다.>

압축을 어떻게 하느냐~ 원리를 이해하기 쉽고 간단하고 허접하게 설명드리겠습니다.

sample.txt 파일이 있다고 가정하고...
이 파일에 들어있는 내용이
"aaaaa11111bbbbb22222"
20byte 용량이 라고 할때...

이 파일은 아주 일정한 규칙을 가지고 있습니다... 뭐냐면...
"a" 가 5개 연속으로 있고,
"1" 이 마찬가지... "b"도... "2" 도 그렇습니다...

이걸 만약에 "허접압축의극치" 라는 압축방식으로 압축한다면...
"a515b525"
8byte 용량으로  압축될 수 있을 겁니다...
a5 = a가 5개 연속,
15 = 1이 5개 연속,
b5 = b가 5개 연속... 뭐 이런 식의 규칙이라 할 때 말이죠...

용량이 8/20 으로 팍~ 줄어 들었죠? 절반도 넘게 줄어들어버렸습니다.
이걸 압축 해제할 때는?
두자리씩 끊어서 a5 => aaaaa, 15 => 11111.... 이런식으로 변환해서 다시 저장하면 압축 해제가 되겠죠?

아주 쉽게 설명드리려고 했지만, 실제 압축 프로그램들은 여러방법의 압축 알고리즘을 이용해서 최대한 작은 파일로 압축하려고 땀 삐질삐질 흘리면서 노력하게 됩니다.

그리고, 이런것도 있겠죠... 이름하야 "어정쩡압축" 방식...
파일 내용이 "0123456789" 처럼 되어 있는 파일을...
"0to9" 라고 압축해버린다면...
아하~ 0에서 9까지 나열된다는 뜻이구나~ 0 to 9 니까~

뭐 이런식으로 굉장히 많은 압축 방법을 생각해 볼 수 있을 겁니다.

그렇다면~...
위에서 "허접압축의극치"라는 압축방식으로 압축한 파일을... "어정쩡압축"( 방식으로 압축 해제한다면?
뭐 풀리지도 않을 뿐더러... 어거지로 풀려고 한다면 ㅡ.ㅡ;

그래서, .zip의 압축 포멧으로 압축된 파일을 .rar의 압축 방식으로는 풀 수 없는 겁니다. 알집같은 프로그램은 다양한 압축 해제방식에 대한 정보가 프로그래밍 되어 있어서, 혼자서 arj, rar, tar, zip, gz, ace 등의 압축 파일들을 압축해제할 수 있는 것이죠...

도스 시절만해도, 컴퓨터 새로 설치할라치면... pkzip(pkunzip), arj, rar, lha 등의 압축 유틸리티 파일들을 좌악~~~ 복사했어야 하는데... 요즘 세상이 좋아져서... 알집, 지펜놀, 밤톨이 같은 것들만 있어도~ 아주아주 쉽게 풀 수 있게 되었죠...

- - - - - - - - - - - - - - - - - - - - - - - - -
요기서 조금 더 말씀드리자면~~~

이렇게 처음의 파일 내용과 나중의 파일 내용의 변화가 없는 압축을 비손실압축이라고 합니다. 프로그램이나 문서들은 압축하기 전과, 압축 후의 내용이 일치하지 않으면 버리죠~ 못쓰게 되어 버립니다.
계약서를 압축했다가 다시 해제했는데~ 글자 중간중간이 없어져(손실) 버린다면...?

JPEG 형태의 파일은 손실압축 방식이라고 합니다. 그림 파일중에 .jpg 파일이 있죠. (웹의 표준 이미지 파일 포멧이 .gif / .jpg 입니다)

사진 같은것은 군데군데 좀 지워지거나 색깔이 이상한게 채워져도 별로 티가 안나죠~ 그래서 색이 복잡하게 들어간 부분의 이미지는 과감히 색에 대한 정보를 없앰으로서 파일의 용량이 작아지게 할 수 있습니다...

물론, 정보가 없어진 부분을 복구할 도리는 없습니다... 압축률을 높이면 이미지가 더 많이 손실되겠죠?

저는 용량이 좀 커져도 .jpg 형식으로 저장하지 않습니다. 웹에 사진이나 워낙 복잡한 그림이라 별로 티가 나지 않을 것 같은 것들에만 jpg를 사용합니다.

압축을 왜 하는가? 비손실압축/손실압축에 대해 말씀드렸사와요~

바이바이~

:맥노턴.

작성일: 2001-01-09 23:25:51

Profile
CSI:맥노턴.
레벨 30
572020/686490
81%
McNorton & Education Lab.
Director
댓글
0
댓글 쓰기
권한이 없습니다.

로그인

아이디
비밀번호
ID/PW 찾기
아직 회원이 아니신가요? 회원가입 하기