月別アーカイブ: 2025年4月

STING-BEE: Towards Vision-Language Model for Real-World X-ray Baggage Security Inspection

要約 コンピュータ支援スクリーニング(CAS)システムの進歩は、X線手荷物検査に … 続きを読む

カテゴリー: cs.CV, eess.IV | STING-BEE: Towards Vision-Language Model for Real-World X-ray Baggage Security Inspection はコメントを受け付けていません

THRONE: An Object-based Hallucination Benchmark for the Free-form Generations of Large Vision-Language Models

要約 大規模視覚言語モデル(LVLM)における幻覚の軽減は、依然として未解決の問 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | THRONE: An Object-based Hallucination Benchmark for the Free-form Generations of Large Vision-Language Models はコメントを受け付けていません

Envisioning Beyond the Pixels: Benchmarking Reasoning-Informed Visual Editing

要約 ラージ・マルチ・モダリティ・モデル(LMM)は、視覚の理解と生成において大 … 続きを読む

カテゴリー: cs.CV | Envisioning Beyond the Pixels: Benchmarking Reasoning-Informed Visual Editing はコメントを受け付けていません

Concept Lancet: Image Editing with Compositional Representation Transplant

要約 拡散モデルは画像編集作業に広く用いられている。既存の編集手法は、多くの場合 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Concept Lancet: Image Editing with Compositional Representation Transplant はコメントを受け付けていません

RoboAct-CLIP: Video-Driven Pre-training of Atomic Action Understanding for Robotics

要約 視覚言語モデル(VLM)は、マルチモーダル知覚と意味論的推論を通じて、タス … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | RoboAct-CLIP: Video-Driven Pre-training of Atomic Action Understanding for Robotics はコメントを受け付けていません

Evaluation of Flight Parameters in UAV-based 3D Reconstruction for Rooftop Infrastructure Assessment

要約 UAVを用いた写真測量による屋上の3D再構築は、インフラ評価のための有望な … 続きを読む

カテゴリー: cs.CV, cs.RO, eess.IV | Evaluation of Flight Parameters in UAV-based 3D Reconstruction for Rooftop Infrastructure Assessment はコメントを受け付けていません

A Chefs KISS — Utilizing semantic information in both ICP and SLAM framework

要約 都市部で自律走行車を利用するためには、信頼性の高いローカライゼーションが必 … 続きを読む

カテゴリー: cs.RO | A Chefs KISS — Utilizing semantic information in both ICP and SLAM framework はコメントを受け付けていません

AutoEval: Autonomous Evaluation of Generalist Robot Manipulation Policies in the Real World

要約 スケーラブルで再現性のある政策評価は、ロボット学習における長年の課題であっ … 続きを読む

カテゴリー: cs.AI, cs.RO | AutoEval: Autonomous Evaluation of Generalist Robot Manipulation Policies in the Real World はコメントを受け付けていません

Let’s move on: Topic Change in Robot-Facilitated Group Discussions

要約 ロボットが司会するグループディスカッションは、人間の参加者間の魅力的で生産 … 続きを読む

カテゴリー: cs.HC, cs.RO | Let’s move on: Topic Change in Robot-Facilitated Group Discussions はコメントを受け付けていません

Preference-Driven Active 3D Scene Representation for Robotic Inspection in Nuclear Decommissioning

要約 能動的な3Dシーン表現は、遠隔検査、マニピュレーション、テレプレゼンスなど … 続きを読む

カテゴリー: cs.CV, cs.RO | Preference-Driven Active 3D Scene Representation for Robotic Inspection in Nuclear Decommissioning はコメントを受け付けていません