当前所在位置:主页 > L生活港 >BiB V记事二:以标準化开创新世界/董福兴

BiB V记事二:以标準化开创新世界/董福兴

BiB V记事二:以标準化开创新世界/董福兴

今年的Books in Browsers有一个重要的标準化组织赞助,就是进行HTML、CSS等网页技术标準制定的W3C(WorldWide Web Consortium)。「标準化」这个议题在BiB中一向佔相当重要的地位,前几年正值EPUB 3制定,IDPF每年都有参与这场会议;但在EPUB 3制定完成后,IDPF与W3C两个组织开始密切交流合作,今年BiB V上,等于正式宣布电子书标準化组织的未来走向。

大多数的人一听到「标準化」,直接的感觉就是:这件事和我没有关係。但事实上,各式各样的标準构成了我们的生活。

在整场会议的一开头,先安排了哈佛大学的Matthrw Battles,他早些年任职于图书馆,作品《图书馆的故事》有中译本,现在担任跨学科单位metaLAB的Director。他举了三个历史上的标準化案例。第一个是画布(Canvas),画布随着文艺复兴时代而诞生,当年威尼斯因为航海业而有着最佳的画布製造技术,加上是义大利创作者的中心,画布的尺寸、製法就由当时行会(Guild)组织制定。第二个是度量衡的公制,在启蒙时代由法国在大革命前后先整合,并且融入政府的科层组织,接着逐渐普及至全欧洲。第三个是电报编码(Baudor Code),文字编码系统经过一连串的传承,最后形成电脑编码系统,进而延伸出各式各样的新技术。

而这些标準化的过程并非一人所为,而是在制定的过程中集体合作而产生出创新。Matthew认为,标準化就是:

儘管如此,但标準化也是相当政治的。例如国际标準化组织ISO、国际电信联盟ITU等台湾因为不是会员「国」,所以无法参与(ISO/IEC JTC1 SC2 WG2 IRG这个常态性的汉字工作组除外,但以台北电脑公会身份参加)。不过像W3C与IDPF等组织就没有限制,这部分后述。

在提EPUBWEB之前,我先说明近几年IDPF与W3C之间的合作关係。各位所知道的EPUB 3格式,其实是个容器(Container)格式,将数位化的书籍内容,以格式规定的方法打包,透过提供的资料进行阅读、导览。而这容器内装的内容,则是採用Web技术的HTML5与CSS3来呈现。但Web技术是由W3C所制定,为了让这格式更为完整,两个组织在2012年起进行合作。于2013年中在纽约、巴黎、东京开了三场工作坊蒐集出版商需求后,于W3C成立数位出版兴趣小组,去年十月首次面对面会议后开始运作。

但EPUB是个「可携式文件」,主要供离线阅读,多半需要透过EPUB阅读程式开启。和Web线上以浏览器阅读有着区隔。经过一年的工作后,W3C数位出版兴趣小组决定以「EPUBWEB」专案来消除两者间的区隔。

W3C数位出版兴趣小组的主席,是由IDPF技术长Markus Gylling所担任,他同时也是DAISY Consortium的技术长。Ivan Herman则是该小组的联络人。

EPUBWEB这个计画,希望让供离线阅读的EPUB能够直接线上透过浏览器开启;同时让线上发表的内容(如网页文章)能够简单地转成可携式文件,两者之间可以无缝转换,也就是说:不需转档。同时确保两方的同一性,像是书籤、注记、授权等也能整合。这个计画可以处理一些领域长期以来的问题:

学术出版:
例如一篇Paper在线上发表,但不少读者会希望能离线阅读,而最好格式可以适应载具(就是不要PDF!)企业文件:
例如企业内部的文件会经常需要修改,同时线上与离线版内容需要一致,像是飞机维修手册,要确保维修人员手上是最新版,而他们应该早不用纸本了。典藏与教育:
例如Internet Archive典藏全世界的网页,有时候网页上的素材会有缺漏,就会需要离线格式来协助储存;而教科书在现在的情境下,连线比离线的需求更大。

EPUBWEB就是为了满足这些需求而制定。虽然有一些电子书店已经能做到这样的事情,但却是基于各自的服务,EPUBWEB则是希望能够透过标準化来实现,作为技术的基础。

但在技术上,还有许多需要解决的事情。例如:

EPUB採用ZIP作为包装格式,但在Web的世界里压缩打包不是好办法;EPUB有着所有资源的列表,但网站内容没有;同时网站经常使用複杂的技术呈现,需要简化;EPUB有着唯一识别码(ISBN),但到Web时,没有相同的对应资讯。同时书中的位置如何对应到网页内容也需要定义。

不过EPUBWEB这个计画才刚启动,还在意见蒐集阶段。依照W3C的规格制定程序,可能会花上好几年来达成。但至少过去几年来在Books in Browsers中的各项讨论,总算透过这项计画有了明确的发展,也能确实改变现阶段「电子书」不属于「Web」;「Web内容」不能称为「书」的问题。

「分页(Pagination)」对于许多Web技术的制定者来说,一直是心中待完成的梦想。这裏所说的分页,不是像现在内容网站一般手动把长文章分成碎片化来赚取Pageview的做法,而是透过一套机制,自动将长文章在浏览器上分成页面,提供如书般翻页的阅读体验。

这项技术如果成熟,不仅能消除Web与电子书的界线,甚至可以应用在印刷领域上,让原稿透过CSS排版,直接送印。CSS之父Håkon Wium Lie从二十年前发明CSS时就在想这件事,现在依然在推动。

但要做到,Web技术就需要支援更广泛书籍排版的各种规则。

Dave Cramer是Hachette Livre(就是与Amazon打价格仗的出版社)的技术人员,去年开始参与W3C活动,他就正在推动这方面的标準化。例如找出现阶段拉丁语系文字在排版上的不足,提出需求,并且逐步加入新的CSS规範中。

他在演讲上举了个案例,例如书籍排版常用的首字放大(Dropcap,对岸称首字下沉),虽然可以透过CSS Pseudo element p:first-letter来达成,但却需要複杂的CSS来辅助,于是他在CSS Inline Layout中提出更好的处理方式。同时也需要更多语言的範例,例如我所提供的中文範例:

当然,你会觉得像这种排版处理,现在Word、InDesign都能轻易做得到,何必大费周章写成标準化文件、还要处理语言差异这种麻烦事呢?最重要的是能透过标準化实践在浏览器与规範上,让作者能简单地指定内容呈现,并且在任何平台上都能如实呈现。这就是标準化的最重要目的。

W3C国际化小组连络人Richard Ishida在每次简报时都有句相同的结语:「Web不是专为拉丁语系所设计,而属于全世界。」国际化小组(Internationalization, i18n)会检查各项规範是否符合各语言文字的需求。同时还有另外一个近用性小组(Accessibility, A11y)专为这些规範加入辅助性,让各种障碍者也能取用这些内容。

Tzviya Siegman任职于美国大型教科书出版社Wiley,不仅活跃于IDPF,现在也是W3C数位出版兴趣小组的共同主席。她就提及了近用性标準化的重要与规範作法。

对于大多数正常人来说,对于(电子书)内容的要求不外于「看起来好看」就好。光是处理这些需求就耗费了大半的时间,再加上近用性需求就更长了。所以近用性的处理,尽量採用既有的规範来进行。并且从一开始就牢记在心,将这些规範製作成文件来实践。他也提到一些案例,例如在电子书中製作表格时,许多人会将其压成图片来呈现得「好看」,不过,以HTML写成的表格无论如何都能提供近用性,但图片不行。

近用性在台湾是经常被忽略的一点。在BiB后的W3C年会,同时举办了W3C成立二十週年的纪念酒会,美国联邦通讯委员会的Jessica Rosenworcel就提及:如果Web有自己的大宪章,那幺Accessibility与障碍者权利必须列于其中。

在过往,视觉障碍者若想读一本书,通常是透过第三方团体以数位工具以提供福利的方式给予,但在数位的世界,若近用性作为标準并且被执行,就能如一般人一样阅读(透过辅具与各种功能)。这就让「施—受」关係翻转,得以站在相同的平面上取得相同的内容。

标準化既是统治,也同时与利益息息相关。让我举W3C Web&TV兴趣小组的案例,每年年会时,这个兴趣小组便会聚集来自SAMSUNG、SONY、Panasonic等电视製造商的技术人员,探讨各种各种视讯串流的规格。当他们在制定规範时,就能够同时实作,就算因为彼此角力而有变化,也能取得第一手资料。在创新的战场上就能取得先机。

除此之外,标準化也是文化。例如与电子书相关的直排实作,主要参考的是日文的排版方法,若透过标準化普及,中文的独有特色就不能呈现,于是在文化上就慢慢地往积极的那一端靠拢。这已经发生过了一次,例如Word、InDesign等工具的避头点,随着工具普及,现在也成为一项中文排版的準则。

标準化的进行旷日费时,包括需求徵集、寻求共识、撰写规範以及测试检验等等。像日文排版需求书这份参考文件前后就花了五年写成,不妨认为标準化是持续进行的活动。一般标準化在开发中国家由政府担当,之后由利益相关的企业接手。在台湾两方都不慎积极,就算参与也是专案,执行完毕后即切断关係。这是相当可惜的事。

我目前是W3C i18n工作小组的邀请专家( Invited Expert),负责中文排版需求的文件撰写。你可以透过订阅EPUB製作课程每月定额赞助。若你是排版专家或者出版社专业编辑,欢迎提供任何排版上的需求与规则。若你愿意长期参与,也能成为这份文件的共同编辑。

YouTube「Matthew Battles, Bearing the Standards: Histories of Cooperative Innovation」YouTube「Tzviya Siegman, The Inadvertent Accessible Content Architect」Slide「Markus Gylling & Ivan Herman, Bridging the Web and Digital Publishing」BiB V记事一:踏出一步的图书馆BiB V记事三:我们还没有看到真正的电子书BiB V记事四:别让工具牵着你走/董福兴BiB V记事五:阅读资料是你的隐私,不是它们的数据/董福兴

相关推荐