「cs.CV」カテゴリーアーカイブ

VGR: Visual Grounded Reasoning

投稿日: 2025年6月17日作成者: jarxiv

要約マルチモーダルの考え方（COT）の推論の分野では、既存のアプローチは主に言 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

AgentSense: Virtual Sensor Data Generation Using LLM Agents in Simulated Home Environments

投稿日: 2025年6月17日作成者: jarxiv

要約堅牢で一般化可能なスマートホームベースのヒューマンアクティビティ認識（HA … 続きを読む →

カテゴリー: cs.CV, cs.HC | コメントを受け付けていません

Poutine: Vision-Language-Trajectory Pre-Training and Reinforcement Learning Post-Training Enable Robust End-to-End Autonomous Driving

投稿日: 2025年6月16日作成者: jarxiv

要約ロングテールドライビングシナリオでエンドツーエンドの自律運転に合わせて調整 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Gondola: Grounded Vision Language Planning for Generalizable Robotic Manipulation

投稿日: 2025年6月16日作成者: jarxiv

要約ロボット操作は、多様な言語指示によって指定された目に見えないオブジェクト、 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Control Architecture and Design for a Multi-robotic Visual Servoing System in Automated Manufacturing Environment

投稿日: 2025年6月16日作成者: jarxiv

要約ロボット技術の使用は、21世紀の製造において大幅に増加しています。しかし … 続きを読む →

カテゴリー: (Primary), 93B52, cs.CV, cs.RO, cs.SY, eess.SY | コメントを受け付けていません

Linearly Solving Robust Rotation Estimation

投稿日: 2025年6月16日作成者: jarxiv

要約回転推定は、コンピュータービジョンおよびロボットタスクに基本的な役割を果た … 続きを読む →

カテゴリー: cs.CV, cs.RO, cs.SY, eess.SY | コメントを受け付けていません

MTabVQA: Evaluating Multi-Tabular Reasoning of Language Models in Visual Space

投稿日: 2025年6月16日作成者: jarxiv

要約ビジョン言語モデル（VLM）は、視覚的なレイアウトとテキストを解釈する際の … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Beyond the Visible: Multispectral Vision-Language Learning for Earth Observation

投稿日: 2025年6月16日作成者: jarxiv

要約地球観測のビジョン言語モデル（EO）は通常、視覚的なデータのスペクトルに唯 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

DMAF-Net: An Effective Modality Rebalancing Framework for Incomplete Multi-Modal Medical Image Segmentation

投稿日: 2025年6月16日作成者: jarxiv

要約不完全なマルチモーダル医療画像セグメンテーションは、不均衡なモダリティの欠 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Foundation Models in Medical Imaging — A Review and Outlook

投稿日: 2025年6月16日作成者: jarxiv

要約ファンデーションモデル（FMS）は、非標識データの大規模なコレクションから … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

VGR: Visual Grounded Reasoning

AgentSense: Virtual Sensor Data Generation Using LLM Agents in Simulated Home Environments

Poutine: Vision-Language-Trajectory Pre-Training and Reinforcement Learning Post-Training Enable Robust End-to-End Autonomous Driving

Gondola: Grounded Vision Language Planning for Generalizable Robotic Manipulation

Control Architecture and Design for a Multi-robotic Visual Servoing System in Automated Manufacturing Environment

Linearly Solving Robust Rotation Estimation

MTabVQA: Evaluating Multi-Tabular Reasoning of Language Models in Visual Space

Beyond the Visible: Multispectral Vision-Language Learning for Earth Observation

DMAF-Net: An Effective Modality Rebalancing Framework for Incomplete Multi-Modal Medical Image Segmentation

Foundation Models in Medical Imaging — A Review and Outlook

最近の投稿

最近のコメント

アーカイブ

カテゴリー