Обзор - Git

microsoft / UniVL

Python 0 0

An official implementation for " UniVL: A Unified Video and Language Pre-Training Model for Multimodal Understanding and Generation"

video localization segmentation caption-task coin joint msrvtt multimodal-sentiment-analysis multimodality pretrain pretraining retrieval-task video-language video-text video-text-retrieval youcookii alignment caption

Обновлено 2024-07-25 14:07:31 +03:00