Saltar para o conteúdo

Codificação por transformação

Origem: Wikipédia, a enciclopédia livre.

A codificação por transformação é um tipo de compressão de dados para dados "naturais", como sinais de áudio ou imagens fotográficas. A transformação é normalmente sem perdas (perfeitamente reversível) por conta própria, mas é usada para permitir uma melhor quantização (mais direcionada), que então resulta em uma cópia de qualidade inferior da entrada original (compressão com perdas).

Na codificação por transformação, o conhecimento do aplicativo é usado para escolher as informações a serem descartadas, reduzindo assim sua largura de banda. As informações restantes podem ser compactadas por meio de uma variedade de métodos. Quando a saída é decodificada, o resultado pode não ser idêntico à entrada original, mas espera-se que seja próximo o suficiente para o propósito do aplicativo.

O termo é muito mais comumente usado em mídia digital e processamento de sinal digital. A técnica de codificação de transformada mais amplamente usada a esse respeito é a transformada discreta de cosseno (DCT),[1][2] proposta por Nasir Ahmed em 1972,[3][4] e apresentada por Ahmed com T. Natarajan e K. R. Rao em 1974.[5] Este DCT, no contexto da família de transformadas discretas de cosseno, é o DCT-II. É a base para o padrão comum de compressão de imagens JPEG,[6] que examina pequenos blocos da imagem e os transforma no domínio da frequência para uma quantização mais eficiente (com perdas) e compactação de dados. Na codificação de vídeo, os padrões H.26x e MPEG modificam esta técnica de compressão de imagem DCT em quadros em uma imagem em movimento usando compensação de movimento, reduzindo ainda mais o tamanho em comparação com uma série de JPEGs.

Na codificação de áudio, a compressão de áudio MPEG analisa os dados transformados de acordo com um modelo psicoacústico que descreve a sensibilidade do ouvido humano a partes do sinal, semelhante ao modelo de TV. MP3 usa um algoritmo de codificação híbrido, combinando a transformada discreta de cosseno modificada (MDCT) e a transformada rápida de Fourier (FFT).[7] Ele foi sucedido pelo Advanced Audio Coding (AAC), que usa um algoritmo MDCT puro para melhorar significativamente a eficiência da compressão.[8]

O processo básico de digitalização de um sinal analógico é um tipo de codificação de transformação que usa a amostragem em um ou mais domínios como sua transformação.

Referências

  1. Muchahary, D.; Mondal, A. J.; Parmar, R. S.; Borah, A. D.; Majumder, A. (2015). «A Simplified Design Approach for Efficient Computation of DCT». 2015 Fifth International Conference on Communication Systems and Network Technologies: 483–487. doi:10.1109/CSNT.2015.134 
  2. Chen, Wai Kai (2004). The Electrical Engineering Handbook. [S.l.]: Elsevier. p. 906. ISBN 9780080477480 
  3. Ahmed, Nasir (janeiro de 1991). «How I Came Up With the Discrete Cosine Transform». Digital Signal Processing. 1 (1): 4–5. doi:10.1016/1051-2004(91)90086-Z 
  4. Stanković, Radomir S.; Astola, Jaakko T. (2012). «Reminiscences of the Early Work in DCT: Interview with K.R. Rao» (PDF). Reprints from the Early Days of Information Sciences. 60. Consultado em 13 de outubro de 2019 
  5. Ahmed, Nasir; Natarajan, T.; Rao, K. R. (janeiro de 1974), «Discrete Cosine Transform», IEEE Transactions on Computers, C–23 (1): 90–93, doi:10.1109/T-C.1974.223784 
  6. «T.81 – Digital compression and coding of continuous-tone still images – Requirements and guidelines» (PDF). CCITT. Setembro de 1992. Consultado em 12 de julho de 2019 
  7. Guckert, John (primavera de 2012). «The Use of FFT and MDCT in MP3 Audio Compression» (PDF). University of Utah. Consultado em 14 de julho de 2019 
  8. Brandenburg, Karlheinz (1999). «MP3 and AAC Explained» (PDF). Cópia arquivada (PDF) em 13 de fevereiro de 2017