cs.AI」カテゴリーアーカイブ

Evaluating Image Hallucination in Text-to-Image Generation with Question-Answering

要約 Text-to-Image(TTI)生成モデルは目覚ましい成功を収めている … 続きを読む

カテゴリー: cs.AI, cs.CV | Evaluating Image Hallucination in Text-to-Image Generation with Question-Answering はコメントを受け付けていません

SCBench: A Sports Commentary Benchmark for Video LLMs

要約 最近、学術界と産業界の両方でビデオ大規模言語モデル (ビデオ LLM) が … 続きを読む

カテゴリー: cs.AI, cs.CV | SCBench: A Sports Commentary Benchmark for Video LLMs はコメントを受け付けていません

Enhanced Temporal Processing in Spiking Neural Networks for Static Object Detection Using 3D Convolutions

要約 スパイキング ニューラル ネットワーク (SNN) は、時空間情報を処理で … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.NE | Enhanced Temporal Processing in Spiking Neural Networks for Static Object Detection Using 3D Convolutions はコメントを受け付けていません

VidTwin: Video VAE with Decoupled Structure and Dynamics

要約 ビデオ オートエンコーダ (ビデオ AE) の最近の進歩により、ビデオ生成 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | VidTwin: Video VAE with Decoupled Structure and Dynamics はコメントを受け付けていません

DiffH2O: Diffusion-Based Synthesis of Hand-Object Interactions from Textual Descriptions

要約 3D で自然な手とオブジェクトのインタラクションを生成することは、結果とし … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG | DiffH2O: Diffusion-Based Synthesis of Hand-Object Interactions from Textual Descriptions はコメントを受け付けていません

Survey of Large Multimodal Model Datasets, Application Categories and Taxonomy

要約 人工知能の急速に進化している分野であるマルチモーダル学習は、テキスト、画像 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Survey of Large Multimodal Model Datasets, Application Categories and Taxonomy はコメントを受け付けていません

Cross-View Referring Multi-Object Tracking

要約 マルチオブジェクト追跡 (RMOT) の参照は、現在の追跡分野における重要 … 続きを読む

カテゴリー: cs.AI, cs.CV | Cross-View Referring Multi-Object Tracking はコメントを受け付けていません

Enhancing Trust in Autonomous Agents: An Architecture for Accountability and Explainability through Blockchain and Large Language Models

要約 人間の対話を伴う環境に自律エージェントを導入すると、セキュリティ上の懸念が … 続きを読む

カテゴリー: cs.AI, cs.RO | Enhancing Trust in Autonomous Agents: An Architecture for Accountability and Explainability through Blockchain and Large Language Models はコメントを受け付けていません

TalkWithMachines: Enhancing Human-Robot Interaction for Interpretable Industrial Robotics Through Large/Vision Language Models

要約 TalkWithMachines は、特に安全性が重要なアプリケーション向 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.HC, cs.LG, cs.RO | TalkWithMachines: Enhancing Human-Robot Interaction for Interpretable Industrial Robotics Through Large/Vision Language Models はコメントを受け付けていません

System Safety Monitoring of Learned Components Using Temporal Metric Forecasting

要約 学習可能な自律システムでは、システムの動作コンテキストを考慮して、その出力 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO, cs.SE | System Safety Monitoring of Learned Components Using Temporal Metric Forecasting はコメントを受け付けていません