在基本 PDF 之外,还有两个目标:PDF/A(长期保存标准,完全自包含,许多仓储和期刊会要求)以及可访问的带标签 PDF(可由屏幕阅读器读取;标准是 PDF/UA)。LaTeX 通过 pdfx 包以及 tagpdf / \DocumentMetadata 机制实现这两者。
PDF/A — 长期保存标准
PDF/A 是用于长期保存的 ISO 标准,要求文件完全自包含:字体完全嵌入、无加密、XMP 元数据,以及颜色的输出意图(ICC 配置文件)。仓储、图书馆和学位论文提交经常要求它。pdfx 包可以生成 PDF/A:\usepackage[a-2b]{pdfx}(也有 a-1b、a-3b)。它从 \jobname.xmpdata 文件读取元数据,并嵌入 ICC 配置文件(默认 sRGB)。
% document.tex
\documentclass{article}
\usepackage[a-2b]{pdfx} % document.xmpdata を読む / reads document.xmpdata
% document.xmpdata(別ファイル)
\Title{論文のタイトル}
\Author{山田 太郎}
\Keywords{LaTeX\sep PDF/A}符合级别包括:PDF/A-1b(基础,基于 PDF 1.4)、PDF/A-2b(透明等 PDF 1.7 功能)以及 -3b(允许附件)。末尾的 “b” 表示基本(视觉)符合;“a” 级别还要求标签结构(无障碍)。面向印刷的兄弟标准是 PDF/X。
可访问 PDF — 标签与 PDF/UA
带标签 PDF 会嵌入逻辑结构:标题、段落、列表、阅读顺序、替代文本等,使屏幕阅读器能够导航。无障碍标准是 PDF/UA(UA-2 于 2024 年发布)。LaTeX 团队的 tagpdf 包(Ulrike Fischer)为 pdfLaTeX/LuaTeX 提供标签工具,包括 \tagstructbegin 等低层命令。
现代入口 — \DocumentMetadata
较新的 LaTeX(2025-06 以后)把这些功能集中到一个入口。在 \documentclass 之前放置 \DocumentMetadata{...},就会加载 PDF 管理层,并可从同一处要求自动标签(tagging=on)和 PDF/A 输出。LaTeX Project 的标签化工作正朝着自动生成符合 PDF/UA-2 / WTPDF 的可访问 PDF前进,也包括为数学内容自动嵌入 MathML。今后这个入口会成为中心(接口仍在发展中,请查看最新文档)。
% \documentclass より前に / before \documentclass
\DocumentMetadata{
lang=ja,
pdfstandard=A-2b,
tagging=on
}
\documentclass{article}实务注意
- 提交方要求 PDF/A → 使用
pdfx(a-1b/a-2b),并在\jobname.xmpdata中写入标题和作者。 - 字体必须完全嵌入(pdflatex/lualatex 默认会嵌入,但仍需确认)。
- 无障碍(PDF/UA)→
\DocumentMetadata+tagpdf(自动标签仍在成熟中)。 - 用 veraPDF 等验证工具检查符合性(PDF/A 与 PDF/UA)。