Investigación de la Universidad de Oulu
13/11/2025 | 17:40
Redacción Cadena 3
El profesor Marko Huhtanen de la Universidad de Oulu, especializado en matemáticas aplicadas y computacionales, introdujo un nuevo método para comprimir imágenes. Esta técnica combina varios métodos de compresión conocidos, aprovechando sus mejores características. El estudio fue publicado en IEEE Signal Processing Letters.
El formato JPEG es el más utilizado en la fotografía digital y el almacenamiento de imágenes. Muchos fotógrafos también guardan imágenes en formato RAW, lo que permite un procesamiento posterior más versátil. Dependiendo de la aplicación, JPEG puede retener solo entre el 10% y el 25% de la información disponible en el momento de la captura. La importancia de la información perdida depende del espectador.
Este es un problema universal en el mundo digital, que afecta a todos los que toman y envían archivos de imagen. Convertir una imagen en un formato transmisible es relativamente simple.
"No vemos una imagen perfecta porque la cantidad de información es infinita. Por lo tanto, debemos comprimir y retener solo los datos esenciales y suficientes. Esto se hace matemáticamente de una manera que también debe ser algorítmicamente rápida", explicó el profesor Huhtanen.
En el método de Huhtanen, la imagen se opera horizontal y verticalmente, utilizando matemáticamente matrices diagonales, de modo que la aproximación de la imagen se construye capa por capa. El proceso se asemeja a una versión simplificada del juego de cambio de Berlekamp, pero en una forma continua.
"La compresión de imágenes es un problema fundamental en la imagen: cómo empaquetar una imagen en el menor espacio posible para una transmisión y compartición rápidas. La imagen original ocupa demasiado espacio en la memoria de la computadora, por lo que nuestro objetivo es preservar solo entre el 10% y el 25% de la información de la imagen".
La tecnología JPEG actual se basa en un algoritmo desarrollado hace aproximadamente 50 años por Nazir Ahmed, profesor estadounidense de ingeniería eléctrica y computación.
"Quería basar la compresión en análisis de componentes principales (PCA), pero no pudo implementarlo algorítmicamente. Hizo un compromiso y creó un método más simple utilizando la transformada discreta del coseno (DCT). Solicitó financiamiento para la investigación, pero esta propuesta fue rechazada porque la idea se consideró demasiado simple para ser interesante", dijo Huhtanen.
A pesar de esto, los resultados fueron publicados y, con el tiempo, la transformada discreta del coseno se convirtió en un estándar en la compresión de imágenes.
"La publicación científica implica mucha aleatoriedad, y es difícil predecir qué se considerará finalmente significativo. Y, como en este caso, la significancia también es relativa".
El objetivo de la compresión es descartar la mayor cantidad de datos de imagen posible sin que el ojo humano note ninguna diferencia entre la imagen original y la comprimida. "JPEG es una técnica simple: la imagen se divide en 64 partes, y cada parte se comprime utilizando la transformada discreta del coseno. Matemáticamente, no es muy interesante, pero en la práctica, funciona excelentemente.
"La idea original de Ahmed, PCA, fue relegada en la compresión de imágenes. Se consideró demasiado laboriosa y rígida para desarrollarse más. Estos dos enfoques han llevado vidas separadas. En mi investigación, logré eliminar esta rigidez, permitiendo que las ideas se mezclen y se utilicen los mejores aspectos de ambas. En otras palabras, DCT y PCA no están algorítmicamente aislados entre sí", dijo Huhtanen.
Huhtanen no especula sobre la aplicabilidad o difusión de sus ideas, pero señala que ha resuelto un problema que no ha visto mucho progreso en mucho tiempo. Se ha desarrollado una amplia familia de algoritmos, siendo PCA solo un caso especial. Las mejores áreas de aplicación aún están por verse.
¿Qué significa PCA en la compresión de imágenes? "El sitio web de Tim Bauman demuestra cómo una imagen se vuelve más clara a medida que se incluye más información. En algún momento, el ojo ya no percibe una diferencia, aunque la cantidad de información aumenta. Esta es la técnica de compresión originalmente concebida por Ahmed. Puede implementarse en base a los algoritmos desarrollados a fines de la década de 1960".
Quienes usaron fotografía en película recuerdan los negativos. Usando esta analogía, la compresión de imágenes digitales puede verse como convertir una imagen en un "negativo", del cual se extraen las partes necesarias y se transforman en una imagen visible. El destinatario recibe una "forma negativa", que luego se renderiza en un formato visible.
Todos hemos experimentado conexiones a internet lentas y hemos visto imágenes o sitios web cargarse gradualmente en la pantalla.
"Los componentes individuales llegan a través del canal, y la imagen se agudiza a medida que se descomprime la compresión. Si esto se puede hacer mejor de lo que se hace actualmente, la transferencia de imágenes se acelera y se puede transmitir más información. Una imagen digital consiste en filas de píxeles, que son números. Reducir ingeniosamente la cantidad de datos es un tema clave", dijo Huhtanen.
El método de Huhtanen permite comprimir imágenes en una menor cantidad de datos, ahorrando espacio de almacenamiento y acelerando la transmisión. El cálculo se vuelve más rápido y ligero, y el método es adecuado para el procesamiento paralelo de datos. Las imágenes pueden construirse por etapas, lo que permite un control y ajuste más precisos durante la compresión. También ahorra energía.
¿Qué presentó el profesor Marko Huhtanen?
Un nuevo método para comprimir imágenes que combina varias técnicas conocidas.
¿Dónde se publicó el estudio?
En IEEE Signal Processing Letters.
¿Cuál es el problema que aborda este método?
La compresión de imágenes para reducir el espacio de almacenamiento y mejorar la velocidad de transmisión.
¿Qué técnicas combina el nuevo método?
Transformada discreta del coseno (DCT) y análisis de componentes principales (PCA).
¿Qué beneficios aporta el método de Huhtanen?
Ahorra espacio de almacenamiento, acelera la transmisión y reduce el consumo de energía.
Te puede Interesar
Novedades en tecnología financiera
Moneybot, el nuevo chatbot de Cash App, promete analizar tus gastos y ofrecerte recomendaciones personalizadas. Con capacidades avanzadas, busca transformar la forma en que interactuamos con nuestras finanzas.
Investigación de la Universidad de Cambridge
Investigadores de la Universidad de Cambridge lograron un control sin precedentes sobre la estructura atómica de los perovskitas haluros, creando un 'sándwich de energía' que podría cambiar la fabricación de celdas solares y LEDs.
Investigación en materiales inteligentes
Investigadores desarrollaron un método para crear fibras flexibles que responden a campos magnéticos, permitiendo a los robots manejar objetos delicados como frutas y chips de papa.
Innovación en electrónica
Investigadores de la Universidad de Illinois crearon un nuevo tipo de electrónica flexible, denominada "CMOS gomoso", que ofrece la misma funcionalidad que los circuitos CMOS convencionales, pero con materiales completamente diferentes.