cs.CV」カテゴリーアーカイブ

Evaluating Intelligence via Trial and Error

要約 知能は、限られた回数の試行錯誤の中で解決策を見出す種にとって重要な特性であ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.IR | コメントする

EchoONE: Segmenting Multiple echocardiography Planes in One Model

要約 臨床における心エコー検査では、心疾患のスクリーニング、診断、治療において、 … 続きを読む

カテゴリー: cs.CV | コメントする

Stereo Hand-Object Reconstruction for Human-to-Robot Handover

要約 手と物体の形状を共同で推定することで、人間からロボットへのハンドオーバーに … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする

Towards Physically Realizable Adversarial Attacks in Embodied Vision Navigation

要約 具現化ビジョンナビゲーションの大幅な進歩により、ディープニューラルネットワ … 続きを読む

カテゴリー: cs.CV, cs.RO | コメントする

Mitigating Hallucinations in Large Vision-Language Models via DPO: On-Policy Data Hold the Key

要約 幻覚は、大規模視覚言語モデル(LVLM)にとって依然として大きな課題である … 続きを読む

カテゴリー: cs.CV | コメントする

StarVid: Enhancing Semantic Alignment in Video Diffusion Models via Spatial and SynTactic Guided Attention Refocusing

要約 拡散モデルを用いたテキスト映像(T2V)生成における最近の進歩は、大きな注 … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする

Self-Supervised Iterative Refinement for Anomaly Detection in Industrial Quality Control

要約 本研究では、ロバストな異常検出手法である反復的精密化プロセス(IRP)を紹 … 続きを読む

カテゴリー: cs.CV, cs.LG | コメントする

FoodMLLM-JP: Leveraging Multimodal Large Language Models for Japanese Recipe Generation

要約 レシピデータを用いた食品イメージの理解に関する研究は、そのデータの多様性と … 続きを読む

カテゴリー: cs.CV, cs.MM | コメントする

ModeDreamer: Mode Guiding Score Distillation for Text-to-3D Generation using Reference Image Prompts

要約 既存のスコアディスティレーションサンプリング(SDS)ベースの手法は、テキ … 続きを読む

カテゴリー: cs.CV | コメントする

The PanAf-FGBG Dataset: Understanding the Impact of Backgrounds in Wildlife Behaviour Recognition

要約 捕獲された行動は個体群の健康状態の変化を示す最も早い指標となるため、カメラ … 続きを読む

カテゴリー: cs.AI, cs.CV | コメントする