PDF 文件是怎么流行起来的?
计算机语言中,有一类专门的语言叫做页面描述语言(简写为PDL,即Page Description Language)。一般而言,所谓的page,即为面向印刷方向的page,一个封装内容的二维的矩形框。总体来说,PDL这种东西的具体表现为控制页面各种元素:文本,图像,颜色,曲线,坐标系。
PDL并不一定具有编程的属性。具有编程属性的一个例子是Adobe家的PostScript。而非编程类的PDL种类相当之多,比如简单的如TeX所输出的DVI,有惠普主导开发的PCL,也有本题中提到的PDF。此外还有一些私有格式的PDL,多见各种打印设备,比如针式打印机及各种印刷用设备。
页面描述语言中的图像和颜色处理都是很简单的。最为繁难的地方在于字体和依赖于文本的呈现是如何的。70年的大部分打印机很多技术细节是公开的,那个时候,各个实验室中的打印机基本上是用打印机内部的字体来印东西。也有少部分情况是可以让操作打印机的人自己弄字体。但是就80年代和90年代的计算机来说,大众所使用的计算机中的字体技术就是被Adobe,Microsoft以及Apple主导的。就字体技术,在工业界有深远影响的,就是上面的三家,长盛不衰的,也就是Adobe了。所以Adobe在设计PDF的时候,就是水到渠成的事,所有的字体技术都能搞。
实际上,惠普主导的PCL用到的地方真是不少,甚至说,在某些情况下,就是像空气一样的存在。这种东西,只是你们这些用户不知道了,因为PCL基本上是机器才需要知道的事。Adobe的PDF在呈现页面上的速度显然都是要比PostScript快的,所以在90年代,PDF在工业界的使用上,取代PostScript只是时间问题。如果谁入过PostScript的坑的话,就会知道,PostScript这个语言是什么都能干的(包括文件读写等)。但就PDL的设计来讲,PostScript的不少功能其实没有必要存在。我最近的一个类比,就是PDF之于PostScript就类似于JSON之于JavaScript。
PDF的一个重要设计点就是格式固定(fixed layout)。直接一点的影响,也就是不用专用工具,不可再编辑。这是印刷方向的需求。所以那些说PDF不可编辑是缺点的人,就不要再说了,这就好像直接说公鸡的缺点是不能下蛋一样。80年代的盛况,你们可能没见到过,那个时候PostScript本身就是很火热的技术,最后也确实成了非常经典的东西。而PostScript类似的PDF,最后抢占市场是水到渠成的(不过据坊间传闻,Adobe推广PDF以及相应的阅读器,还是花了大量真金白银的)。
在盗版电子书界,广泛使用的格式是DjVu和PDF。实际上很难说是哪个更流行,因为就图像处理来讲,DjVu在技术理念上实际上还是超过PDF一多点的。但是,在市场里,技术高超不等于市场占有率高。但就印刷业来讲,PDF肯定是数量最大的。甚至悲观点说,是印刷业没选择而已。但还好,PDF的格式规范,现在是由ISO控制的,即使Adobe在自家的东西里面放了一些私货,但是PDF这东西,已经是代表现在,而且还会在很长事件内代表未来。
转载自李阿玲@知乎,已获授权,原文链接:https://www.zhihu.com/question/29299579/answer/44035205