月別アーカイブ: 2025年3月

StageDesigner: Artistic Stage Generation for Scenography via Theater Scripts

要約 この作業では、レイアウト制御拡散モデルと組み合わせた大規模な言語モデルを使 … 続きを読む

カテゴリー: cs.AI, cs.CV | StageDesigner: Artistic Stage Generation for Scenography via Theater Scripts はコメントを受け付けていません

Seeing is Understanding: Unlocking Causal Attention into Modality-Mutual Attention for Multimodal LLMs

要約 最近のマルチモーダル大手言語モデル(MLLMS)は、マルチモーダルの問い合 … 続きを読む

カテゴリー: cs.AI, cs.CV | Seeing is Understanding: Unlocking Causal Attention into Modality-Mutual Attention for Multimodal LLMs はコメントを受け付けていません

Resource-Efficient Affordance Grounding with Complementary Depth and Semantic Prompts

要約 アフォーダンスとは、エージェントが環境から認識し、利用する機能特性を指し、 … 続きを読む

カテゴリー: cs.CV, cs.RO, eess.IV | Resource-Efficient Affordance Grounding with Complementary Depth and Semantic Prompts はコメントを受け付けていません

ARC-Flow : Articulated, Resolution-Agnostic, Correspondence-Free Matching and Interpolation of 3D Shapes Under Flow Fields

要約 この作業は、2つの3Dの明確な形状とそれらの間の密な対応の自動推定の間の物 … 続きを読む

カテゴリー: cs.CV | ARC-Flow : Articulated, Resolution-Agnostic, Correspondence-Free Matching and Interpolation of 3D Shapes Under Flow Fields はコメントを受け付けていません

Smoothing the Shift: Towards Stable Test-Time Adaptation under Complex Multimodal Noises

要約 テスト時間適応(TTA)は、ソースデータにアクセスせずに、無ー化されたテス … 続きを読む

カテゴリー: cs.CV, cs.LG | Smoothing the Shift: Towards Stable Test-Time Adaptation under Complex Multimodal Noises はコメントを受け付けていません

ZAPBench: A Benchmark for Whole-Brain Activity Prediction in Zebrafish

要約 データ駆動型のベンチマークは、気象や構造生物学を含む主要な科学モデリングド … 続きを読む

カテゴリー: cs.CV, cs.LG, q-bio.NC | ZAPBench: A Benchmark for Whole-Brain Activity Prediction in Zebrafish はコメントを受け付けていません

XFMamba: Cross-Fusion Mamba for Multi-View Medical Image Classification

要約 シングルビューの医療画像分類と比較して、複数のビューを使用すると、ビュー間 … 続きを読む

カテゴリー: cs.CV | XFMamba: Cross-Fusion Mamba for Multi-View Medical Image Classification はコメントを受け付けていません

WalnutData: A UAV Remote Sensing Dataset of Green Walnuts and Model Evaluation

要約 UAVテクノロジーは徐々に成熟しており、スマートな農業と正確な監視に対する … 続きを読む

カテゴリー: cs.AI, cs.CV | WalnutData: A UAV Remote Sensing Dataset of Green Walnuts and Model Evaluation はコメントを受け付けていません

R2Det: Exploring Relaxed Rotation Equivariance in 2D object detection

要約 Group Equivariant Convolution(GCONV)は … 続きを読む

カテゴリー: cs.AI, cs.CV | R2Det: Exploring Relaxed Rotation Equivariance in 2D object detection はコメントを受け付けていません

A dataset-free approach for self-supervised learning of 3D reflectional symmetries

要約 このホワイトペーパーでは、入力オブジェクト自体のみでデータセットに依存する … 続きを読む

カテゴリー: cs.AI, cs.CV | A dataset-free approach for self-supervised learning of 3D reflectional symmetries はコメントを受け付けていません