..


Enlaces patrocinados

Comprimir archivos. Algoritmos y software para la comparación.

Artículo escrito por Damián Verda
Página 1 de 2

Entre las operaciones más comunes que pueden ser útiles incluso para usuarios no especializados identificar definitivamente la compresión. A través de esta transacción, de hecho, cualquier archivo en su computadora puede ser restaurado, con el fin de ocupar una porción de la memoria de disco duro. Observamos sin embargo que en la actualidad, hay unidades duro de gran capacidad a precios bastante bajos, por lo que la utilidad de los programas de compresión parece encogerse. Pero esta es una conclusión precipitada.

De hecho, por ejemplo, puede ser interesante para comprimir uno o más archivos antes de enviarlos por correo electrónico, para reducir el tiempo de recepción y transmisión. Además de interesantes y prácticas también la capacidad de almacenar varios documentos en un solo archivo comprimido, más práctico para transmitir y manipular.

¿Pero cuáles son las principales opciones disponibles para los usuarios para comprimir un archivo o archivos? Lo que distingue al software disponibles? Examinemos primero el fundamento teórico de la compresión de software, lo que ilustra las características principales de los algoritmos de compresión.

Algoritmos de compresión

Una primera distinción entre los algoritmos de compresión pueden ser identificados entre los algoritmos sin pérdidas, es decir, sin ninguna pérdida de calidad y los algoritmos con pérdida, en la que se acompaña de la reducción de espacio en disco por una pérdida de calidad. A menudo es difícil de percibir un deterioro de la calidad: por ejemplo, en el caso de la codificación de mp3 para los archivos de audio.

Entre los algoritmos más utilizados identificar sin lugar a dudas el "algoritmo de Huffman, el" algoritmo de Shannon-Fano y el algoritmo Lempel, Ziv y Welch. Aunque no entrar en explicaciones teóricas, se examinan las principales características de "algoritmo de Huffman, que ha marcado la historia de las técnicas de compresión.

Nos remitimos a los lectores interesados ​​en más detalles sobre las técnicas de Shannon-Fano y Lempel-Ziv-Welch enlaces a más específica sobre este tema:

El algoritmo de Huffman

Algoritmo 'S pertenece a la categoría de pérdidas Huffman, es decir, no introduce ninguna pérdida de calidad. Nos scomporne operación en cinco pasos elementales:

  • Se analiza y se contó el número de ocurrencias de los elementos básicos del archivo a comprimir: los caracteres individuales en un archivo de texto, los píxeles de una imagen de archivo.
  • Los dos elementos se unen en una categoría menos frecuente que representa a los dos. Así, por ejemplo, si X e Y se produce 8 veces 7 veces, se crea la categoría de XY, con 15 repeticiones. Mientras tanto, los componentes X e Y cada uno recibe un marcador diferente que los identifica como elementos de entrada en una asociación ".
  • Los siguientes dos artículos son identificados con menor frecuencia en el archivo y se sienta como una nueva categoría, utilizando el mismo procedimiento descrito en el paso 2. El grupo de XY a su vez pueden entrar y formar nuevas asociaciones, por ejemplo, la categoría de XYZ. Cuando esto sucede, la X e Y se les da un nuevo identificador que termina con la Asociación de extender el código que identifica cada una de las dos cartas en el archivo comprimido será generado.
  • A continuación se crea para los próximos pasos, un árbol se compone de una serie de ramas binario, en el que aparecen con mayor frecuencia y en los siguientes elementos raros combinaciones en el archivo, mientras que los elementos rara vez son más frecuentes. De acuerdo con el mecanismo descrito, esto significa que los elementos raros en los archivos sin comprimir se asocian con una longitud de código de identificación, que está creciendo todos los elementos de una nueva asociación. Los elementos se repiten más a menudo en lugar del archivo original no están presentes en el árbol "de las asociaciones, por lo que su código de identificación será lo más corto posible.
  • Archivo comprimido se genera, en sustitución de cada elemento del archivo original, el código se ha producido al final de la cadena de asociaciones basadas en la frecuencia de ese elemento en el documento de origen.
La ganancia de espacio al final de la compresión se debe al hecho de que los elementos que se repiten a menudo se identifican por un código, que ocupa menos espacio que ocupan su codificación normal. Por el contrario los elementos raros en el archivo original en el archivo comprimido recibirá un código de tiempo, lo cual requiere, para cada uno de ellos, un área mucho mayor que el que ocupa en el archivo sin comprimir.

De la suma algebraica de la ganancia de espacio mediante la codificación por debajo de los más frecuentes y la pérdida de espacio con la codificación de la larga más raros se obtiene la relación de compresión producida por el algoritmo de Huffman. De lo anterior se deduce que este tipo de compresión es más eficaz cuanto mayor sea la diferencia de frecuencia de los componentes del archivo original, mientras que los malos resultados se obtienen cuando la distribución de los elementos es uniforme.

En la misma categoría ...
E-Learning
HTML (del curso) HTML (del curso)
El lenguaje de marcado para la web desde 29 €.
Webmaster Avanzado (Curso) Webmaster Avanzado (Curso)
Hazte webmaster profesional. A partir de 39 €.
Webmaster Base (Primera) Webmaster Base (Primera)
Crear un sitio Web desde cero. A partir de 29 €.
Enlaces patrocinados