PDF/A 与无障碍

在基本 PDF 之外,还有两个目标:PDF/A(长期保存标准,完全自包含,许多仓储和期刊会要求)以及可访问的带标签 PDF(可由屏幕阅读器读取;标准是 PDF/UA)。LaTeX 通过 pdfx 包以及 tagpdf / \DocumentMetadata 机制实现这两者。

PDF/A — 长期保存标准

PDF/A 是用于长期保存的 ISO 标准,要求文件完全自包含字体完全嵌入、无加密、XMP 元数据,以及颜色的输出意图(ICC 配置文件)。仓储、图书馆和学位论文提交经常要求它。pdfx 包可以生成 PDF/A:\usepackage[a-2b]{pdfx}(也有 a-1ba-3b)。它从 \jobname.xmpdata 文件读取元数据,并嵌入 ICC 配置文件(默认 sRGB)。

latex
% document.tex
\documentclass{article}
\usepackage[a-2b]{pdfx}   % document.xmpdata を読む / reads document.xmpdata

% document.xmpdata(別ファイル)
\Title{論文のタイトル}
\Author{山田 太郎}
\Keywords{LaTeX\sep PDF/A}

符合级别包括:PDF/A-1b(基础,基于 PDF 1.4)、PDF/A-2b(透明等 PDF 1.7 功能)以及 -3b(允许附件)。末尾的 “b” 表示基本(视觉)符合;“a” 级别还要求标签结构(无障碍)。面向印刷的兄弟标准是 PDF/X。

可访问 PDF — 标签与 PDF/UA

带标签 PDF 会嵌入逻辑结构:标题、段落、列表、阅读顺序、替代文本等,使屏幕阅读器能够导航。无障碍标准是 PDF/UA(UA-2 于 2024 年发布)。LaTeX 团队的 tagpdf 包(Ulrike Fischer)为 pdfLaTeX/LuaTeX 提供标签工具,包括 \tagstructbegin 等低层命令。

现代入口 — \DocumentMetadata

较新的 LaTeX(2025-06 以后)把这些功能集中到一个入口。在 \documentclass 之前放置 \DocumentMetadata{...},就会加载 PDF 管理层,并可从同一处要求自动标签tagging=on)和 PDF/A 输出。LaTeX Project 的标签化工作正朝着自动生成符合 PDF/UA-2 / WTPDF 的可访问 PDF前进,也包括为数学内容自动嵌入 MathML。今后这个入口会成为中心(接口仍在发展中,请查看最新文档)。

latex
% \documentclass より前に / before \documentclass
\DocumentMetadata{
  lang=ja,
  pdfstandard=A-2b,
  tagging=on
}
\documentclass{article}

实务注意

  • 提交方要求 PDF/A → 使用 pdfxa-1b / a-2b),并在 \jobname.xmpdata 中写入标题和作者。
  • 字体必须完全嵌入(pdflatex/lualatex 默认会嵌入,但仍需确认)。
  • 无障碍(PDF/UA)→ \DocumentMetadata + tagpdf(自动标签仍在成熟中)。
  • veraPDF 等验证工具检查符合性(PDF/A 与 PDF/UA)。