《CY∕T 101.10-2014 新闻出版内容资源加工规范 第10部分:期刊加工(新闻出版).pdf》由会员分享,可在线阅读,更多相关《CY∕T 101.10-2014 新闻出版内容资源加工规范 第10部分:期刊加工(新闻出版).pdf(20页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、新闻出版内容资源加工规范 第 10 部分:期刊加工2014-01-29 发布2014-01-29 实施中华人民共和国新闻出版行业标准 Specification of content resource processing in press and publication Part 10:Periodical processingCY/T 101.102014ICS 35.240.30L70发 布中华人民共和国国家新闻出版广电总局I前言 I1范围 12规范性引用文件 13术语和定义 14成品数据 34.1元数据集 34.2图像数据 74.3内容结构化数据 74.4对象数据 84.5版式文件数据
2、 94.6流式文件数据 94.7命名及存储 104.8数据清单 115数据验收 136数据维护 13参考文献 14目 次CY/T 101.102014ICY/T 101新闻出版内容资源加工规范分为以下 10 个部分:第 1 部分:加工专业术语;第 4 部分:数据加工质量;第 5 部分:资料管理;第 6 部分:数据管理;第 7 部分:数据交付;第 8 部分:图书加工;第 9 部分:报纸加工;第 10 部分:期刊加工。本部分为 CY/T 101 的第 10 部分。本部分由中华人民共和国国家新闻出版广电总局科技司提出。本部分由全国新闻出版信息标准化技术委员会归口。本部分起草单位:方正国际软件有限公司
3、、北京拓标卓越信息技术研究院、新闻出版总署信息中心。本部分主要起草人:赵海涛、周长岭、安秀敏、刘成勇、蔡京生、周卫国、吴治强、张沫。前 言第 2 部分:数据加工与应用模式;第 3 部分:数据加工规格;11范围CY/T 101 的本部分规定了新闻出版内容资源期刊加工的成品数据、数据验收和维护等方面的要求。本部分适用于期刊内容资源的数字化加工和电子资源的加工制作。2规范性引用文件下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。CY/T 101.4 新闻出版内容资源加工规范 第 4 部分:数据
4、加工质量3术语和定义CY/T 502008 和 CY/T 101.1-2014 中所界定的以及下列术语和定义适用于本文件。3.1新闻出版内容资源 press and publication content resource新闻出版领域内任意形式、任何粒度的内容及其他有价值的资源。CY/T 101.1-2014,4.1.13.2数字化加工 digital processing针对纸质出版物、表单、公文、档案文献等,通过专业化的解决方案,加工成 PDF、Html、Txt、Doc、Xls 等多种可编辑的电子文件格式的活动。CY/T 101.1-2014,5.1.13.3电子期刊 e-journal数
5、字期刊 可通过相关设备直接呈现文字、图像、音频、视频等内容,一年出版一期以上(含一期)的连续性数字出版产品。CY/T 101.1-2014,7.1.103.4都柏林核心元数据 dublin core metadata;DC一种根据各类信息资源的共同特点确定的,适用于不同领域间信息资源、特别是网络信息资源的元数据。CY/T 101.1-2014,6.1.33.5脚注 footnote边注;页末注置于同页末了的注释。CY/T 502008,3.89新闻出版内容资源加工规范 第 10 部分:期刊加工CY/T 101.10201423.6引文 citation引用他人著述或文献资料的文字。CY/T 5
6、02008,3.873.7成品数据 finished data已经完成全部数据处理过程且符合预先设定的规格和质量要求,可实现交付的最终数据形态。CY/T 101.1-2014,7.1.13.8版式文件 fixed-layout document版式文档排版后生成的,包含版面固化呈现需要的全部数据的一种文件。CY/T 101.1-2014,6.3.103.9流式文件 reflowing document流式文档按照内容逻辑顺序,内容呈现可适应终端设备屏幕或窗口变化的一种文件。CY/T 101.1-2014,6.3.113.10单层图像版式文件 imaged fixed-layout docume
7、nt图像版式文件通过扫描方式,生成与原加工对象版式完全一致的图像文件集合,并打包成独立完整的可浏览的数字版式文件(含书签信息及书签信息和版式文件页面之间的链接关系)。CY/T 101.1-2014,6.3.123.11双层矢量化版式文件 vectorized dual-layer fixed-layout document双层版式文件在单层图像版式文件基础上,同时生成与图像层对应的透明字体模式的文字层,可支持选取、拷贝和查找的版式文件。CY/T 101.1-2014,6.3.133.12单层矢量化版式文件 vectorized fixed-layout document矢量版式文件按照原加工对
8、象的文字位置,文字采用矢量字,修饰性图片、艺术字、底纹、线条、图表和公式等以图像形式显示的版式文件。CY/T 101.1-2014,6.3.143.13单层矢量 PATH 版式文件 curved-text fixed-layout document转曲版式文件在原加工对象的文字位置上采用曲线绘制文字的版式文件。CY/T 101.1-2014,6.3.1534成品数据4.1元数据集4.1.1概述期刊资源的元数据包含期刊基本元数据、单期元数据、文章元数据、作者元数据、引文元数据、管理元数据、段落元数据和脚注元数据等。元数据集通常包含在内容结构化数据中,以 XML1.0 及以上版本格式存储。4.1.
9、2期刊基本元数据期刊基本元数据集是描述期刊多种属性的信息集合,见表 1。序号中文名称英文标签必备性可重复性备注(对应 DC)1期刊唯一标识符Identifier必备不可重复标识符(Identifier)2正刊名Title必备不可重复题名(Title)3并列刊名AlternateTitle有则必备可重复4汉语拼音刊名PinYinTitle可选不可重复5ISSNISSN有则必备不可重复国际连续出版物号6CNCN必备不可重复国内统一书刊号7期刊条码BarCode可选不可重复8刊期PublishCycle必备不可重复9语种Language必备不可重复语种(Language)10价格Price可选可重复
10、价格(Price)11期刊社地址Address可选不可重复12出版者Publisher必备可重复出版者(Publisher)13主办单位Hoster可选可重复14主管单位InChare可选可重复15设计/排版单位Typesetting可选可重复16发行单位Delivery可选可重复17编辑单位Editor可选可重复18创刊时间StartPublish可选可重复19停刊时间StopPublish可选可重复20曾用名UsedTitle可选可重复21曾用名 ISSN/CNUsedISSNCN可选可重复22简介Brief可选不可重复23分类号ClassCode可选可重复24分类法及版本Classifi
11、cation可选可重复25自定义分类号SelfUserClassCode可选可重复表 1期刊基本元数据CY/T 101.10201444.1.3单期元数据单期元数据包括了单期的相关信息,见表 2。序号中文名称英文标签必备性可重复性备注(对应 DC)1卷期唯一标识符VolumeIdentifier必备不可重复标识符(Identifier)2期刊唯一标识符Identifier必备不可重复3出版日期VolumeDate必备不可重复日期(Date)4期刊信息PeriodicalInfo可选不可重复5单期信息VolumeInfo可选不可重复6单期目次VolumeCatalog必备不可重复7单期文章数Vo
12、lumeArticleNumber可选不可重复8单期图片数VolumePictureNumber可选不可重复4.1.4文章元数据文章元数据包含文章相关信息,见表 3。序号中文名称英文标签必备性可重复性备注(对应 DC)1文章唯一标识符ArticleIdentifier必备不可重复标识符(Identifier)2文章题名ArticleTitle必备不可重复题名(Title)3文章分类ArticleClassify有则必备不可重复4其他语种题名ArticleOtherTitle可选可重复5内容摘要ArticleBrief有则必备不可重复描述(Description)6其他语种摘要ArticleOt
13、herBrief可选可重复7关键词ArticleKeyWords有则必备可重复主题(Subject)8其他语种关键词ArticleOtherKeyWords可选可重复9分类法及版本ArticleClassification可选可重复10分类号ArticleClassCode有则必备可重复11基金项目ArticleFoundation有则必备可重复12正文语种ArticleLanguage必备不可重复语种(Language)13文摘语种ArticleOtherLanguage可选可重复14起始页ArticleStartPage必备不可重复15终止页ArticleEndPage必备不可重复16总页
14、数ArticleTotalPage可选不可重复17总字数ArticleWords可选不可重复18引文数ArticleReferenceNumber可选不可重复19注释数ArticleFootNoteNumber可选不可重复20作者数ArticleAuthorNumber可选不可重复21文献号ArticleLiterature可选可重复22正文ArticleContent可选不可重复表 3文章元数据表 2单期元数据5表 4作者元数据表 5引文元数据4.1.5作者元数据作者元数据包括了文章作者的相关信息,见表 4。序号中文名称英文标签必备性可重复性备注(对应 DC)1文章唯一标识符ArticleI
15、dentifier必备不可重复2作者顺序CreatorSN必备不可重复3作者姓名CreatorName必备不可重复创建者(Creator)4其他形式姓名CreatorOtherName可选可重复5所属机构CreatorOrganiztion有则必备可重复6作者地址CreatorAddress可选可重复7联系方式CreatorContact可选可重复8作者简介CreatorBrief可选不可重复9作者照片CreatorPhoto可选不可重复4.1.6引文元数据引文元数据包括了引文的相关信息,见表 5。序号中文名称英文标签必备性可重复性备注1文章唯一标识符ArticleIdentifier必备不可
16、重复2引文顺序ReferenceSN必备不可重复3引文类型ReferenceType必备不可重复1)专著 M2)论文集 C3)报纸文章 N4)期刊文章 J5)学位论文 D6)报告 R7)标准 S8)专利 P4引文原始内容ReferenceItem必备不可重复5引文位置ReferencePosition可选不可重复文内/文后6主要责任者ReferenceCreator可选可重复M C N J D R 类用7文献名称ReferenceTitle可选可重复M C N J D R 类用8出版地ReferencePublishLocation可选可重复M C D R 类用9出版者ReferencePub
17、lisher可选可重复M C D R 类用10出版年ReferencePublishYear可选可重复M C D R 类用11起止页码ReferenceBeginEndPageNumber可选可重复M C J D R 类用12刊名ReferencePeriodical可选可重复J 类用13年ReferencePeriodicalYear可选可重复J 类用14卷ReferencePeriodicalVolume可选可重复J 类用15报纸名称ReferenceNewsPaper可选可重复N 类用CY/T 101.1020146(续表)序号中文名称英文标签必备性可重复性备注16版次Reference
18、NewsPaperPage可选可重复N 类用17标准编号ReferenceStandardNumber可选可重复S 类用18标准名称ReferenceStandard可选可重复S 类用19专利所有者ReferencePatentOwner可选可重复P 类用20专利名称ReferencePatentTitle可选可重复P 类用21专利国别ReferencePatentCountry可选可重复P 类用22专利号ReferencePatentNumber可选可重复P 类用23出版日期ReferencePublishDate可选可重复N P 类用24链接地址ReferenceLink可选可重复4.1.
19、7脚注元数据脚注元数据包括了脚注的相关信息,见表 6:表 6脚注元数据表 7段落元数据表 8管理元数据序号中文名称英文标签必备性可重复性备注1文章唯一标识符ArticleIdentifier必备不可重复2脚注顺序FootNoteSN必备不可重复3注释内容FootNoteContent必备不可重复4.1.8段落元数据段落元数据包括了文章段落的相关信息,见表 7。序号中文名称英文标签必备性可重复性备注1文章唯一标识符ArticleIdentifier必备不可重复2段落顺序ParagraphSN必备不可重复3字数ParagraphWords可选不可重复4知识点关键词ParagraphKeyWords
20、可选可重复4.1.9管理元数据管理元数据记录加工生产相关信息,见表 8。序号中文名称英文标签必备性可重复性备注1期次唯一标识符VolumeIdentifier必备不可重复资源的唯一标识2级别Level可选不可重复资源重要级别3加工者Processor必备可重复资源加工信息4加工日期ProcessDate必备不可重复资源加工时间5组成Files可选可重复构成资源的文件情况6存储FilesLoaction可选可重复资源保存的位置描述7表 9图像数据规格表 10文章结构数据的组成4.2图像数据4.2.1图像数据规格图像数据的加工范围包含从封面至封底所有页面,每页为一个图像文件,见表 9。参数类型格式
21、应用方向压缩方式分辨率(DPI)色彩模式TIFF面向长期保存应用LZW600 或 300彩色图像采用 24 位真彩色模式、灰度图像采用 8 位灰度模式、黑白图像采用二值模式JPEG面向其他应用JPEG100 以上4.2.2图像数据质量要求遵循 CY/101.4-2014 中 5.5.2 的相关规定,图像数据质量的差错率要求为千分之一。4.3内容结构化数据4.3.1内容结构化数据层次结构内容结构化数据包含元数据集和内容数据以及关联的对象数据,层次结构如图 1 所示。图 1内容结构化数据层次结构4.3.2文章结构化数据文章结构化数据的加工范围至少应包含文章元数据和正文内容,其他为可选,见表 10。
22、组成内容选择性内容说明文章元数据必备体现篇章的主题、来源等信息,包含篇章标题、副题、作者、摘要、关键词、页码等作者元数据必备包含作者相关信息引文元数据可选包含篇章中的引用文献信息,由引文书名、作者、版本、文章标题、网站等组成。引文可采用逐条列写,或细粒度拆分两种加工方式。逐条列写:每条引文作为整体存放;细粒度拆分:每条引文根据组成部分拆分成为独立信息脚注元数据可选当前页面中引用到词句的解释说明及出处,包含脚注序号及内容脚注可采用随文夹注或引用关联两种方式列写。随文夹注:清除脚注序号,内容紧随正文引用位置;引用关联:放于文章末尾,并重排序号,与正文引用点关联正文内容必备当前篇章的文字、图片、排版
23、信息及关联信息段落元数据可选包含段落及知识点等信息内容结构化数据正文内容作者元数据引文元数据脚注元数据段落元数据内容关联信息文章元数据期刊元数据单期结构化数据管理元数据CY/T 101.10201484.3.3内容关联信息内容关联信息包含:a)脚注引用点与脚注的引用关系;b)插图引用点与插图的引用关系;c)表格引用点与表格的引用关系;d)引文引用点与引文的引用关系;e)图像引用点与图像文件的链接关系。4.3.4内容结构化数据规格和质量要求内容结构化数据采用 XML1.0 及以上版本格式,质量要求包括:a)文字质量要求应符合 CY/101.4-2014 中 5.5.1 和相关出版质量管理的规定;
24、b)遵循 CY/101.4-2014 中 5.5.3 的相关规定,内容结构质量的差错率要求为万分之三;c)遵循 CY/101.4-2014 中 5.5.4 的相关规定,关联关系质量的差错率要求为千分之三。4.4对象数据4.4.1对象数据层次结构对象数据包括图像类对象数据和结构化或矢量化对象数据,层次结构如图 2 所示。4.4.2图像类对象数据规格和质量要求4.4.2.1图像类对象数据规格以图像方式加工的对象数据包含插图图片、公式图片、表格图片、广告图片、生僻字及特殊符号图片。其中,生僻字图片采用 GIF 格式存储,技术规格见表 11。其他图像类对象数据采用 JPG 格式存储,技术规格见表 12
25、。图 2对象数据层次结构表 11生僻字图片技术规格技术指标技术参数选择性内容说明色彩模式二值图像必备用于存储黑白的图像压缩方式LZW 无损压缩必备底色透明必备用于网站发布时,与矢量文字底色一致各类对象数据以图像文件形式加工以结构化或矢量化文件形式加工插图图片公式图片表格图片广告图片生僻字图片结构化表格结构化公式矢量化字库9表 12其他图像类对象数据技术规格技术指标技术参数选择性内容说明分辨率300DPI可选用于存储并发布的高精度图像,一般用于网站发布的大图150DPI介于 300DPI 至 96DPI 之间,一般用于网站发布的大图96DPI用于发布缩略图,一般用于网站缩略图展示色彩模式彩色图像
26、必备用于存储彩色的图像灰度图像必备用于存储灰度或黑白的图像二值图像可选用于存储黑白的图像压缩方式JPEG必备4.4.2.2图像类对象数据质量要求按 CY/101.4-2014 中 5.5.2 的规定,图像类对象数据质量的差错率要求是千分之一。4.4.3结构化或矢量化对象数据的规格和质量要求4.4.3.1结构化对象数据当公式、表格、生僻字采用矢量方式加工时,均需按照相应的规格及文件格式进行加工,包含:a)结构化表格对象,采用 HTML5.0 及以上版本格式存储;b)结构化化学公式对象,采用 CDX 或 CDXML 格式存储;c)结构化数据公式对象,采用 MathML3.0 及以上版本格式存储。4
27、.4.3.2结构化对象数据质量要求按 CY/101.4-2014 中 5.5.1 的规定结构化对象数据质量的差错率要求是万分之一。4.4.3.3矢量化对象数据特殊字符集采用 TTF(TrueTypeFont)格式存储。4.4.3.4矢量化对象数据质量要求按 CY/101.4-2014 中 5.5.1 的规定,矢量化对象数据质量的差错率要求是万分之一。4.5版式文件数据4.5.1版式文件数据规格版式数据的加工范围包含从封面到封底的全部内容,采用 PDF 1.6 及以上版本格式,技术规格见CY/101.3-2014 的表 2。4.5.2版式文件数据质量要求质量要求如下:a)文字质量要求应执行 CY
28、/101.4-2014 中 5.5.1 和相关出版质量管理的规定;b)遵循 CY/101.4-2014 中 5.5.5 的相关规定,版式文件质量的差错率要求为万分之三;c)遵循 CY/101.4-2014 中 5.5.2 的相关规定,图像质量的差错率要求为千分之一;d)遵循 CY/101.4-2014 中 5.5.3 的项规定,关联关系质量的差错率要求为千分之三。4.6流式文件数据4.6.1流式文件数据规格流式文件的加工范围包含从封面到封底的全部内容,采用 EPub 3.0 及以上版本格式,见表 13。CY/T 101.10201410组成内容选择性内容说明期刊信息必备用于存储期刊信息,包含刊
29、名、期次、出版日期等信息文件组成信息必备用于管理流式文件的结构排版信息可选排版信息包含流式文件显示内容时的特殊效果,如段首缩进、段落间距、浮动窗口、列表形式等文字样式可选用于展示文字时体现的样式,主要包含:文字字体、字号、颜色、粗体、斜体、下划线、删除线、着重符号等信息生僻字采用贴图或造字的形式展示图片样式可选图片样式用于展示图片的位置及与文字的关系,如:位置可以为居左、居中、或居右;与文字的关系可以为环绕,悬浮等表格样式可选表格包含表格标题、表格内容和表格注释。可采用 HTML 方式展示或采用图片方式展示公式样式必备公式采用图片方式进行展示表 13流式文件数据内容表 14基本编号规则4.6.
30、2流式文件数据质量要求质量要求如下:a)文字质量要求应符合 CY/101.4-2014 中 5.5.1 和相关出版质量管理的规定;b)遵循 CY/101.4-2014 中 5.5.6 的相关规定,流式文件质量的差错率要求为万分之三;c)遵循 CY/101.4-2014 中 5.5.5 的项规定,图像质量的差错率要求为千分之一;d)遵循 CY/101.4-2014 中 5.5.5 的项规定,关联关系质量的差错率要求为千分之三。4.7命名及存储4.7.1命名期刊加工成品的命名遵循种、册、页独立编号的原则,不允许在命名中增加各种分类信息或其他辅助标记信息,优先使用 DOI 命名体系,见表 14。类别
31、编号规则期刊种类五位数字组成,从 00001 记起,每种期刊记 1期号四位数字组成,每种期刊从 0001 记起,每卷期记 1文章编号四位数字组成,每卷期从 0001 记起,每篇论文记 1页号四位数字组成,每卷期从 0001 记起,每页记 1命名规则如下:a)文件夹命名方法:期刊种类编号+期号;示例:X:00001-0001b)图像文件命名方法:期刊种类编号+期号+页号;示例:X:00001-0001-0001.TIFc)矢量版式文件命名方法:期刊种类编号+期号+S;示例:X:00001-0001-S.PDFd)双层版式文件命名方法:期刊种类编号+期号+D;11图 3存储体系示例:X:00001
32、-0001-D.PDFe)图像版式文件命名方法:期刊种类编号+期号+T;示例:X:00001-0001-T.PDFf)转曲版式文件命名方法:期刊种类编号+期号+P;示例:X:00001-0001-P.PDFg)结构化数据命名方法:期刊种类编号+期号;示例:X:00001-0001.XMLh)流式数据 EPub 命名方法:期刊种类编号+期号。示例:X:00001-0001.Epub4.7.2存储以单期期刊为独立存储结构,所有文档存储于其中,存储体系见图 3。4.8数据清单成品数据交付清单包含数据说明(见表 15)、数据清单(见表 16)、统计清单(见表 17)。加工方在提交成品数据后,应按约定归
33、还物理件。期刊种类编号+期次编号(文件夹)图像数据(文件夹)图像文件(*.TIF)矢量版式文件双层版式文件图像版式文件转曲版式文件单期期刊 XML单期期刊 Epub对象数据文件版式文件(文件夹)结构化文件(文件夹)Epub 文件(文件夹)附件文件(文件夹)原始排版文件(文件夹)CY/T 101.10201412数据总体说明序号名称说明1项目名称项目名称2加工单位项目加工单位全名3项目时间项目完成年份4数据加工编号以起始终止表示,如 01090001_01 01090213_205完成期刊总册数项目实际完成期刊册数6完成期刊总页数项目实际完成图像页数7序号以 1 开始,顺次编号8存储内容存储的数
34、据内容,如 XML 文件、版式文件和说明文件等9数据格式以大写英文字母表示,如 PDF、EXCEL、XML、EPUB、MOBI、TXT10存储介质数据存储的介质说明12介质数量存储介质的数量13存储量以 GB 为单位表示14备注需要说明的特殊情况表 15数据说明表 16数据清单表 17统计清单成品数据硬盘/光盘存储清单序号名称说明1数据内容存储的数据内容,如期刊版式文件、入库文件2数据格式以大写英文字母表示,如 XML、PDF、TXT、EPUB、TIFF3序号以 1 开始,顺次编号4硬盘/光盘编号本硬盘/光盘的编号5期刊加工编号本块硬盘/光盘存储的期刊加工编号起止号6期刊期数本块硬盘/光盘存储
35、的期刊总期数7期刊页数本块硬盘/光盘存储的期刊总页数8存储量以 GB 为单位表示9备注需要说明的特殊情况10合计期刊加工编号以起止号表示,合计期刊册数、页数、存储总量期刊单册数据量统计表单序号名称说明1序号以 1 开始,顺次编号2加工编号期刊加工编号3期刊页数本册期刊纸书页数4电子文档页数本册期刊中电子数据页数135数据验收委托方在确认收到成品数据后应在 30 个工作日内完成验收工作。验收工作应首先对成品数据的完整性、规范性、和有效性进行检验,在这 3 个方面都符合质量要求后,再根据质量要求检验成品数据的准确性。在检验过程中要逐一记录发现的错误情况。验收工作完成后委托方出具验收报告。6数据维护加工方在数据验收合格后应按双方约定提供数据维护服务,维护服务的周期由双方协商而定,一般是 1 年。数据维护服务的主要内容包括及时修改后续发现的数据错误,提供数据规格、存放规则、存储清单等文档,为委托方提供数据应用支持和咨询服务等。CY/T 101.102014141 GB/T 18793 信息技术 可扩展置标语言(XML)1.02 GB/T 25100 信息与文献 都柏林核心元数据元素集3 CY/T 502008 出版术语4 CY/T 101.1-2014 新闻出版内容资源加工规范 第 1 部分:加工专业术语参考文献