Aktion „Vertex AI“: Multimodal Prompt AI“
- Zuletzt aktualisiert2024/06/13
Aktion „Vertex AI“: Multimodal Prompt AI“
Die Aktion „Vertex AI: Multimodal Prompt AI“ nutzt das multimodale Modell von Google, das in der Lage ist, Informationen aus mehreren Medien zu verarbeiten, darunter Bilder, Videos und Text. Diese Fähigkeit ermöglicht es, komplexe Aufgaben zu bewältigen, wie z. B. die Beschreibung des Inhalts eines eingegebenen Bildes oder Videos.
Vorbereitungen
- Sie benötigen die Bot Creator-Rolle zur Verwendung der Aktion „Vertex AI: Multimodal Prompt AI“ in einer Automatisierung.
- Vergewissern Sie sich, dass Sie über die erforderlichen Anmeldeinformationen zum Senden einer Anfrage verfügen und Vertex AI: Aktion „Verbinden“ eingeschlossen haben, bevor Sie eine Google Cloud-Aktion aufrufen.
Dieses Beispiel zeigt, wie man dem Modell ein Foto eines Tellers mit Keksen schickt und es auffordert, mit der „Vertex AI: Multimodal Prompt AI“-Aktion ein Rezept für diese Kekse zu erstellen und eine passende Antwort erhält.
Prozedur
Erleben Sie, wie die Aktion „Vertex AI: Multimodal Prompt AI“ neue Möglichkeiten eröffnet! Sehen Sie sich dieses Video an, das einen realen Anwendungsfall zeigt.
Wenn neben der Eingabeaufforderung das folgende Bild als Eingabe verwendet wird, wird die in der nachstehenden Tabelle dargestellte Antwort generiert:
Eingabeaufforderung | Antwort |
---|---|
Generiere ein Rezept. |
Zutaten:
Zubereitung:
|