Major Study./Computer Science

데이터 압축 (Data compression)

sosal 2014. 7. 17. 16:17
반응형

/*

 * http://sosal.kr/

 * made by so_Sal

 */

 

 

데이터의 저장, 전송을 위해서 원래의 정보를 유지하면서도
데이터 크기를 줄이는 것은 경우에 따라서 효율적이고, 필수적이다.
이러한 기법을 데이터 압축이라 부름.

데이터 압축 : 1. 무손실 압축 방법,
                   2. 손실 압축 방법.

무손실 압축방법이란 압축 과정에서 완벽히 정보를 다시 복원할 수 있는 방법이며,
손실 압축방법은 압축 과정에서 본래의 정보를 잃을 수도 있는 방법이다.

RLE (Run-Length Encoding) : 동일한 값이 연속하여 나타나는 긴 열이 있을 경우,
                                           반복되는 원소와 반복 횟수를 나타내는 코드로 대체한다.
빈도 종속 인코딩
(Frequency-dependent encoding): 데이터 항목을 표현하기 위해 사용되는 비트 패턴의 길이를
                                                  해당 항목이 사용되는 빈도의 역과 관련시켜 결정하는 방법.
위 코드들은 가변 길이 코드로, 2바이트 유니코드와는 달리 항목에 따라 서로 다른 길이의 패터능로
표현하는 것을 의미한다. 빈도 종속 인코딩에 사용되는 알고리즘을 개발한 허프만의 이름을 따서
허프만 코드 (Huffman code)라고 부른다.

동영상의 경우, 압축될 데이터 스트림의 단위가, 바로 앞 단위와 약간씩만 다른 여러개의 단위로
이루어지는 경우가 상당히 많은데, 이 경우에는 차등 인코딩(Differential encoding)으로도
알려져 있는 상대적 인코딩(Relative encoding)을 사용하는 기법이 도움이 된다.

널리 쓰이는 또 다른 압축 방식에 사전 인코딩(Dictionary encoding) 기법에 기초한 것들이 있다.
사전이라는 용어는 압축될 메시지를 구성하는 항목들의 집합이며,
압축된 데이타 스트림은 항목에 대한 일련의 참조 표시로 인코딩 된다.