¿Por qué los archivos PDF generados por Microsoft Word son tan grandes?

Contenidos

Cuando sus documentos son principalmente de naturaleza solo de texto, entonces parecería que los tamaños de archivo para las versiones .docx y .pdf deberían ser bastante similares cuando se guardan, pero ese no es siempre el caso. La publicación de preguntas y respuestas del superusuario de hoy tiene la solución a las preguntas de un lector curioso sobre la gran diferencia en el tamaño de los archivos.

La sesión de preguntas y respuestas de hoy nos llega por cortesía de SuperUser, una subdivisión de Stack Exchange, una agrupación de sitios web de preguntas y respuestas impulsada por la comunidad.

Guantes de boxeo clip-art cortesía de Clker.com.

La pregunta

El lector de superusuario Borek quiere saber por qué los archivos PDF generados por Microsoft Word son tan grandes:

Creé un documento simple de Microsoft Word que contiene solo esta oración, nada más:

  • Este es un documento pequeño.

Después guardé el documento como archivos .docx y .pdf. Estos son los tamaños de archivo:

La diferencia entre los dos archivos es enorme (técnicamente) y verdaderamente me molesta cuando los documentos que son en su mayoría de naturaleza textual disponen solo decenas de kB en formato .docx, pero disponen un tamaño de cientos de kB cuando se convierten a archivos PDF. ¿Qué tiene de ineficiente el formato PDF? ¿Es solo Microsoft Word usando algún algoritmo de salida terrible?

Por cierto, la configuración de salida de PDF en mi instalación de Microsoft Office está configurada para crear los archivos más pequeños posibles:

¿Por qué los archivos PDF generados por Microsoft Word son tan grandes?

La solución

El colaborador superusuario rene tiene la solución para nosotros:

Si abre el archivo PDF en Notepad ++, encontrará:

Y ese objeto se hace referencia aquí al final de la instrucción / FontFile2:

Las fuentes utilizadas por un documento de Microsoft Word están incrustadas en archivos PDF para que sean independientes. solía esta presentación de diapositivas de Adobe para descifrar las instrucciones en PDF.

Si desea evitar que las fuentes se incrusten en un archivo PDF, asegúrese de que sus documentos de Microsoft Word utilicen uno de los 14 tipos de letra estándar disponibles en los visores de PDF (Fuente: Wikipedia).

  • Times New Roman> Times (v3) (en cursiva regular, cursiva, negrita y cursiva negrita)
  • Courier New> Courier (en regular, oblicuo, negrita y negrita oblicua)
  • Arial> Helvetica (v3) (en regular, oblicuo, negrita y negrita oblicua)
  • Símbolo> Símbolo
  • Wingdings> Zapf Dingbats

¿Tiene algo que agregar a la explicación? Habla en los comentarios. ¿Quiere leer más respuestas de otros usuarios de Stack Exchange expertos en tecnología? Consulte el hilo de discusión completo aquí..

Suscribite a nuestro Newsletter

No te enviaremos correo SPAM. Lo odiamos tanto como tú.