月別アーカイブ: 2024年3月

Low-power, Continuous Remote Behavioral Localization with Event Cameras

投稿日: 2024年3月20日作成者: jarxiv

要約自然科学の研究者は、動物の行動を定量化するための信頼できる方法を必要として … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

MambaMIR: An Arbitrary-Masked Mamba for Joint Medical Image Reconstruction and Uncertainty Estimation

投稿日: 2024年3月20日作成者: jarxiv

要約最近の Mamba モデルは、医療画像タスクなどの視覚表現学習に顕著な適応 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

PoNQ: a Neural QEM-based Mesh Representation

投稿日: 2024年3月20日作成者: jarxiv

要約ポリゴンメッシュはジオメトリ処理における標準的な表現ですが、その不規則で … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Confusing Pair Correction Based on Category Prototype for Domain Adaptation under Noisy Environments

投稿日: 2024年3月20日作成者: jarxiv

要約この論文では、従来のドメイン適応よりも困難かつ現実的である、ノイズの多い環 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

HYDRA: A Hyper Agent for Dynamic Compositional Visual Reasoning

投稿日: 2024年3月20日作成者: jarxiv

要約特に大規模視覚言語モデル (VLM) を活用した視覚的推論 (VR) の最 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

EmoVOCA: Speech-Driven Emotional 3D Talking Heads

投稿日: 2024年3月20日作成者: jarxiv

要約 3D トーキングヘッド生成の分野は、近年大幅な進歩を遂げています。この … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Cross-Domain Few-Shot Object Detection via Enhanced Open-Set Object Detector

投稿日: 2024年3月20日作成者: jarxiv

要約この論文では、最小限のラベル付きサンプルで新しいドメイン向けの正確な物体検 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training

投稿日: 2024年3月20日作成者: jarxiv

要約この作業では、パフォーマンスの高いマルチモーダル大規模言語モデル (MLL … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

BugNIST – a Large Volumetric Dataset for Object Detection under Domain Shift

投稿日: 2024年3月20日作成者: jarxiv

要約ドメインシフトは、特にボリューム 3D 画像内のオブジェクト検出において … 続きを読む →

カテゴリー: cs.AI, cs.CV, I.2.10 | コメントを受け付けていません

Adaptive Visual Imitation Learning for Robotic Assisted Feeding Across Varied Bowl Configurations and Food Types

投稿日: 2024年3月20日作成者: jarxiv

要約この研究では、ロボット支援給餌 (RAF) のための空間注意モジュールを備 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

月別アーカイブ: 2024年3月

Low-power, Continuous Remote Behavioral Localization with Event Cameras

MambaMIR: An Arbitrary-Masked Mamba for Joint Medical Image Reconstruction and Uncertainty Estimation

PoNQ: a Neural QEM-based Mesh Representation

Confusing Pair Correction Based on Category Prototype for Domain Adaptation under Noisy Environments

HYDRA: A Hyper Agent for Dynamic Compositional Visual Reasoning

EmoVOCA: Speech-Driven Emotional 3D Talking Heads

Cross-Domain Few-Shot Object Detection via Enhanced Open-Set Object Detector

MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training

BugNIST – a Large Volumetric Dataset for Object Detection under Domain Shift

Adaptive Visual Imitation Learning for Robotic Assisted Feeding Across Varied Bowl Configurations and Food Types

最近の投稿

最近のコメント

アーカイブ

カテゴリー