クラウドおよびオンプレミス展開における AI スキルのマルチモーダル入力を含む、サポートされている基盤モデル、ファイルタイプ、および機能互換性を確認してください。

次の表は、AI Skillsでサポートされている基盤モデルと、対応するファイルタイプおよび機能の利用可否を示しています。 AI Skillのモデル接続を選択する際は、このリファレンスを使用してください。

注: マルチモーダル入力のサポート(テキストとともに画像やドキュメントを処理する機能)は、一部の生成 AI モデルでのみ利用可能です。 サポートされているモデルには、Amazon Bedrock(Nova および Claude Sonnet バリアント)、Azure OpenAI(GPT-4.1、GPT-4o、GPT-4o-mini)、OpenAI(GPT-4.1 および GPT-4o)、およびGoogle Vertex AI(Gemini 2.5 および Claude Sonnet モデル)が含まれます。 選択したモデル接続によって、アップロード可能なファイルの最大数および許容されるファイルサイズが異なります。Automation 360 はベンダーの制限を自動的に適用します。 マルチモーダル入力は、ベンダーやデプロイメントタイプに関係なく、カスタムモデル接続 ではサポートされていません。
ベンダー タイプ モデル サポートされているファイル タイプ
Amazon Bedrock

標準

Amazon Nova Lite、Amazon Nova Pro png、jpeg、gif、webp

Anthropic Claude 3.5 Sonnet、Anthropic Claude 3.5 Sonnet v2、Anthropic Claude 3.7 Sonnet、Anthropic Claude 4 Sonnet、Anthropic Claude Sonnet 4.5、Anthropic Claude Sonnet 4.5、Anthropic Claude Haiku 4.5、Anthropic Claude Opus 4.5

png, jpg, jpeg, gif, webp, csv, xls, xlsx, html, txt, md, doc, pdf, docx
Amazon Nova Micro -
微調整 Amazon Nova Lite、Amazon Nova Pro png、jpeg、gif、webp
Grounded by knowledge base Amazon Nova Lite、Amazon Nova Pro、Amazon Nova Micro -
Automation Anywhere

標準

Claude Sonnet 4.5、GPT-4o

-
Enterprise ナレッジによるグラウンディング - -
Azure OpenAI

標準

GPT 3.5 Turbo、GPT-4、GPT-5、GPT-5 Mini -
GPT-4.1、GPT-4o、GPT-4o mini png、jpg、jpeg、gif、webp

微調整

GPT 3.5 Turbo, GPT-4, GPT-4 Turbo Preview -
GPT-4.1、GPT-4o、GPT-4o mini png、jpg、jpeg、gif、webp

Grounded by AI Search

GPT 3.5 Turbo、GPT-4、GPT-4.1、GPT-4o -
Google Vertex AI 標準

Anthropic Claude 3.5 Sonnet、Anthropic Claude 3.7 Sonnet、Anthropic Claude Sonnet 4、Anthropic Claude Sonnet 4.5、Anthropic Claude Haiku 4.5、Anthropic Claude Opus 4.5

png、jpg、jpeg、gif、webp
Gemini 2.5 Flash、Gemini 2.5 Pro pdf、png、jpg、jpeg
微調整 Gemini 2.5 Flash、Gemini 2.5 Pro pdf、png、jpg、jpeg
Grounded by data source Gemini 2.5 Flash、Gemini 2.5 Pro -
OpenAI 標準 GPT 3.5 Turbo、GPT-4、GPT-4 Turbo Preview、GPT-5、GPT-5 mini -
GPT-4.1、GPT-4o、GPT-4o mini png、jpg、jpeg、gif、webp
微調整 GPT 3.5 Turbo, GPT-4, GPT-4 Turbo Preview -
GPT-4.1、GPT-4o、GPT-4o mini png、jpg、jpeg、gif、webp
注: いくつかのモデルはマルチモーダル入力をサポートしており、AI Skillがテキストに加えて画像や文書を処理できるようにしています。 これらの機能は、サポートされている生成 AI モデルでのみ利用可能であり、モデルのベンダーによって異なります。