您现在的位置: IT专家网 > Exchange子站 > Office
Walkthrough: Word 2007 XML 格式
Microsoft Office Word 2007提供了一种新的默认文件格式,叫做Microsoft Office Word XML格式(Word XML格式)。
Word 2007 内容类型
上面提到过,每个文档部件都有一个特定的内容类型。一个部件的内容类型描述了这种文件类型的内容。例如,XML部件包含了Word XML格式定义的标记,而内容类型可以帮助您分析它的组成。
典型的内容类型是以word application开头,然后是厂商的名称。在内容类型中,word vender 被简写为vnd。所有内容类型都被指定为以application/vnd.ms-word开头。如果内容类型是一个XML文件,那么它的URI将以+xml结尾。其它的非XML内容的类型,例如图片,则没有这种结尾。下面是一些典型的内容类型:
1.application/vnd.openxmlformats-officedocument.wordprocessingml.endnotes+xml
它是一个描述Word文档中的尾注文档部件的内容类型。其中,+xml表示它是一个XML文件。
2.application/vnd.openxmlformats-package.core-properties+xml
它是一个描述核心文档属性部件的内容类型。其中,+xml表示它是一个XML文件。
3.image/png
图片的内容类型。其中没有+xml部分 - 表示内容类型不是XML文件。
您可以使用所有的这些内容类型,来处理一个Word 2007文件的内容。Microsoft Windows Software Development Kit (SDK) for Beta 2 of Windows Vista and WinFX Runtime Components包含了System.IO.Packaging命名空间,它允许您添加文档部件、获取和更新内容,或者创建关系。例如,使用Microsoft WinFX System.IO.Packaging类,您可以使用PackagePart.CreatePart方法创建一个文档部件。CreatePart方法需要两个字符串参数;一个是新部件的URI,另一个是部件的内容类型,如下所示:
| PackagePart packageNewPart = package.CreatePart(uriResourceTarget, "application/vnd.openxmlformats-officedocument.wordprocessingml.styles+xml"); |
定位内容类型
下面的章节包含了一个内容类型中出现最为频繁的列表。Word 2007在包中通过一个文件或部件描述每个内容类型。在包根目录下的[Content_Types].xml文件,列出了文档中的每个部件,以及它的ContentType对象。例如,您可能会看到如下的内容:
您可以在目录结构中重命名或重新排布所有这些部件。列出的这些部件都在它们默认的位置,并且拥有默认的名称,从而可以轻松的判断出它们是什么文件。
在包根目录下的Word目录中,包含了描述文档的最为主要的信息。在这个目录中,您可能会发现一些表示可用内容类型的部件。
将文档部件匹配到内容类型
文件格式中每个XML文件都是一个文档部件。如果您详细的查看这种新格式的文件,您会发现一些目录结构,或文档部件,例如/word/fontTable.xml和word/styles.xml。这些文件的名称清楚的表示了它们的目的(例如,字体表和格式部件)。但是,您也可以更改它们的名称。因为在[ContentTypes].xml文件中的元素匹配了每种内容部件,它们表示不同的内容类型。[ContentTypes].xml可能由下列代码组成:
其中,/word/styles.xml文档部件拥有/vnd.openxmlformats-package.core-properties+xml内容类型。/docProps/core.xml部件拥有application/vnd.openxmlformats-package.core-properties+xml内容类型。
- 本文关键词:

