-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年6月
AdaNCA: Neural Cellular Automata As Adaptors For More Robust Vision Transformer
要約 ビジョン トランスフォーマー (ViT) は、特に領域アテンションや畳み込 … 続きを読む
カテゴリー: cs.CV
AdaNCA: Neural Cellular Automata As Adaptors For More Robust Vision Transformer はコメントを受け付けていません
Behind the Magic, MERLIM: Multi-modal Evaluation Benchmark for Large Image-Language Models
要約 大規模なビジョンおよび言語モデルにより、完全に監視されたゼロショットの視覚 … 続きを読む
From Chaos to Clarity: 3DGS in the Dark
要約 RAW 画像からの新規ビュー合成は、低ダイナミック レンジ RGB 画像か … 続きを読む
Event Transformer
要約 イベント カメラは消費電力が低く、マイクロ秒単位の明るさの変化をキャプチャ … 続きを読む
カテゴリー: cs.CV
Event Transformer はコメントを受け付けていません
Diffusion Model with Cross Attention as an Inductive Bias for Disentanglement
要約 解きほぐされた表現学習は、観察されたデータ内の固有の要素を抽出することを目 … 続きを読む
LaMOT: Language-Guided Multi-Object Tracking
要約 視覚言語 MOT は重要な追跡問題であり、最近ますます注目を集めています。 … 続きを読む
カテゴリー: cs.CV
LaMOT: Language-Guided Multi-Object Tracking はコメントを受け付けていません
LEAP-VO: Long-term Effective Any Point Tracking for Visual Odometry
要約 ビジュアル オドメトリは、視覚入力に基づいて移動カメラの動きを推定します。 … 続きを読む
カテゴリー: cs.CV
LEAP-VO: Long-term Effective Any Point Tracking for Visual Odometry はコメントを受け付けていません
UDON: Universal Dynamic Online distillatioN for generic image representations
要約 ユニバーサルな画像表現は、あらゆるドメインのオブジェクトやエンティティを大 … 続きを読む
カテゴリー: cs.CV
UDON: Universal Dynamic Online distillatioN for generic image representations はコメントを受け付けていません
CoLM-DSR: Leveraging Neural Codec Language Modeling for Multi-Modal Dysarthric Speech Reconstruction
要約 構音障害音声再構成 (DSR) は、構音障害のある音声を正常な音声に変換す … 続きを読む
WMAdapter: Adding WaterMark Control to Latent Diffusion Models
要約 透かしは、AI によって生成された画像の著作権を保護するために非常に重要で … 続きを読む