Sample processor output

This page contains detailed information on output produced by processors offered by Document AI.

The files on this page are sample documents in a variety of structures and the raw outputs from the Document AI API in the Document format.

The fields returned in the response can be limited by using a FieldMask when making a processing request.

Digitize text

Processors Output samples

Enterprise Document OCR (Optical Character Recognition)

Category Digitize
Solution type General
Functions OCR, Quality Analysis
Release stage General availability
Access status Public
Full processor details Detailed entry
Sample input file
pretrained-ocr-v1.2-2022年11月10日
pretrained-ocr-v2.0-2023年06月02日
pretrained-ocr-v2.1-2024年08月07日
pretrained-ocr-v2.1.1-2025年01月31日

Extract documents

Processors Output samples

Custom Extractor

Category Extract
Solution type Custom
Functions OCR, Entity Extraction
Release stage General availability
Access status Public
Full processor details Detailed entry
Sample input file
pretrained-foundation-model-v1.4-2025年02月05日
pretrained-foundation-model-v1.5-2025年05月05日
pretrained-foundation-model-v1.5-pro-2025年06月20日
pretrained-foundation-model-v1.5.1-2025年08月07日

Form Parser

Category Extract
Solution type General
Functions OCR, Form Parsing, Entity Extraction
Release stage General availability
Access status Public
Full processor details Detailed entry
Sample input file
pretrained-form-parser-v1.0-2020年09月23日 pretrained-form-parser-v2.0-2022年11月10日 pretrained-form-parser-v2.1-2023年06月26日

Layout Parser

Category Extract
Solution type General
Functions Layout Parsing, Document Chunking
Release stage General availability
Access status Public
Full processor details Detailed entry
Sample input file
pretrained-layout-parser-v1.0-2024年06月03日

Classify documents

Processors Output samples

Custom Classifier

Category Classify
Solution type Custom
Functions OCR, Classification
Release stage General availability
Access status Public
Full processor details Detailed entry
Sample input file
pretrained-foundation-model-v1.4-2025年05月16日
pretrained-classifier-v1.5-2025年08月05日

Custom Splitter

Category Classify
Solution type Custom
Functions OCR, Classification, Splitting
Release stage General availability
Access status Public
Full processor details Detailed entry
Sample input file
pretrained-splitter-v1.5-2025年07月14日

Explore pretrained processors

Processors Output samples

Bank Statement Parser

Category Pretrained
Solution type Lending
Functions OCR, Entity Extraction
Release stage General availability
Access status Public
Full processor details Detailed entry
Sample input file
pretrained-bankstatement-v1.0-2021年08月08日
pretrained-bankstatement-v1.1-2021年08月13日
pretrained-bankstatement-v2.0-2021年12月10日
pretrained-bankstatement-v3.0-2022年05月16日
pretrained-bankstatement-v4.0-2023年07月31日
pretrained-bankstatement-v5.0-2023年12月06日

W2 Parser

Category Pretrained
Solution type Lending
Functions OCR, Entity Extraction
Release stage General availability
Access status Public
Full processor details Detailed entry
Sample input file
pretrained-w2-v1.0-2020年10月01日 pretrained-w2-v1.1-2022年01月27日 pretrained-w2-v1.2-2022年01月28日 pretrained-w2-v2.0-2022年03月30日 pretrained-w2-v2.1-2022年06月08日

US Passport Parser

Category Pretrained
Solution type Identity
Functions OCR, Entity Extraction
Release stage General availability
Access status Public
Full processor details Detailed entry
Sample input file
pretrained-us-passport-v1.0-2021年06月14日

Utility Parser

Category Pretrained
Solution type Procurement
Functions OCR, Entity Extraction
Release stage General availability
Access status Limited
Full processor details Detailed entry
Sample input file
pretrained-utility-v1.1-2021年04月09日 pretrained-utility-v1.2-2022年12月15日

Identity Document Proofing Parser

Category Pretrained
Solution type Identity
Functions OCR, Quality Analysis
Release stage General availability
Access status Public
Full processor details Detailed entry
Sample input file
pretrained-id-proofing-v1.0-2022年10月03日 pretrained-id-proofing-v1.1-2023年05月18日 pretrained-id-proofing-v1.2-2023年10月04日

US Driver License Parser

Category Pretrained
Solution type Identity
Functions OCR, Entity Extraction
Release stage General availability
Access status Public
Full processor details Detailed entry
Sample input file
pretrained-us-driver-license-v1.0-2021年06月14日

Expense Parser

Category Pretrained
Solution type Procurement
Functions OCR, Entity Extraction
Release stage General availability
Access status Public
Full processor details Detailed entry
Sample input file
pretrained-expense-v1.1-2021年04月09日 pretrained-expense-v1.3.2-2024年09月11日 pretrained-expense-v1.4-2022年11月18日 pretrained-expense-v1.4.2-2024年09月12日

Invoice Parser

Category Pretrained
Solution type Procurement
Functions OCR, Entity Extraction
Release stage General availability
Access status Public
Full processor details Detailed entry
Sample input file
pretrained-invoice-v1.1-2021年04月09日 pretrained-invoice-v1.2-2022年02月18日 pretrained-invoice-v1.3-2022年07月15日 pretrained-invoice-v1.4-2022年10月21日 pretrained-invoice-v1.5-2023年09月15日 pretrained-invoice-v2.0-2023年12月06日

Except as otherwise noted, the content of this page is licensed under the Creative Commons Attribution 4.0 License, and code samples are licensed under the Apache 2.0 License. For details, see the Google Developers Site Policies. Java is a registered trademark of Oracle and/or its affiliates.

Last updated 2025年11月07日 UTC.