在 OpenXML 格式里面,其实不存在文本这个元素,所有都是形状。但是在 PPT 界面看到的文本框是什么呢?其实他是特别的形状。而几乎所有的形状都可以输入文本,因此区分形状和文本的意义不会特别大,只是在做解析的时候才会碰到

在 OpenXML 的 PML 也就是 PPT 使用的格式里面,在 dotnet OpenXML 解析 PPT 页面元素文档格式 告诉大家都是形状

那么文本框是什么形状?其实文本框是特别的形状

在 PPT 里面拖入文本框,然后使用 OpenXML 解压缩文档为文件夹工具 解压缩,此时可以看到在页面里的元素大概内容如下

<p:sp>
    <p:nvSpPr>
        <p:cNvSpPr txBox="1"/>
    </p:nvSpPr>
    <!-- 忽略 -->
</p:sp>

也就是说文本框也是 p:sp 也就是 Shape 元素,但是在 p:nvSpPr->p:cNvSpPr->txBox 有属性表示是文本框

在 dotnet 里面通过 OpenXML SDK 可以这样获取

            // nvSpPr
            NonVisualShapeProperties nonVisualShapeProperties = shape.NonVisualShapeProperties;
            // cNvSpPr
            var nonVisualShapeDrawingProperties = nonVisualShapeProperties?.NonVisualShapeDrawingProperties;

            var isTextBox = nonVisualShapeDrawingProperties?.TextBox?.Value is true;

在 OpenXML SDK 的帮助下,可以解析很多 PPT 文档的缩写,可以提升可读性。如 nvSpPr 其实就是 Non(n) Visual(v) Shape(Sp) Properties(pr) 的意思

更多请看 Office 使用 OpenXML SDK 解析文档博客目录


本文会经常更新,请阅读原文: https://dotnet-campus.github.io//post/dotnet-OpenXML-%E5%A6%82%E4%BD%95%E5%88%A4%E6%96%AD%E6%98%AF%E5%BD%A2%E7%8A%B6%E8%BF%98%E6%98%AF%E6%96%87%E6%9C%AC.html ,以避免陈旧错误知识的误导,同时有更好的阅读体验。

知识共享许可协议 本作品采用 知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议 进行许可。欢迎转载、使用、重新发布,但务必保留文章署名 lindexi (包含链接: https://dotnet-campus.github.io/ ),不得用于商业目的,基于本文修改后的作品务必以相同的许可发布。如有任何疑问,请 与我联系