-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年7月
LAKE-RED: Camouflaged Images Generation by Latent Background Knowledge Retrieval-Augmented Diffusion
要約 カモフラージュされた視覚認識は、多くの実際的な応用例がある重要な視覚タスク … 続きを読む
カテゴリー: cs.CV
LAKE-RED: Camouflaged Images Generation by Latent Background Knowledge Retrieval-Augmented Diffusion はコメントを受け付けていません
SPIQA: A Dataset for Multimodal Question Answering on Scientific Papers
要約 長い科学研究論文の中で疑問に対する答えを探すことは、読者が疑問に素早く対処 … 続きを読む
Glyph-ByT5: A Customized Text Encoder for Accurate Visual Text Rendering
要約 視覚的なテキストのレンダリングは、現代のテキストから画像への生成モデルにと … 続きを読む
カテゴリー: cs.CV
Glyph-ByT5: A Customized Text Encoder for Accurate Visual Text Rendering はコメントを受け付けていません
OmniSat: Self-Supervised Modality Fusion for Earth Observation
要約 地球観測 (EO) の分野では、さまざまなセンサーからの豊富なデータが提供 … 続きを読む
カテゴリー: cs.CV
OmniSat: Self-Supervised Modality Fusion for Earth Observation はコメントを受け付けていません
Improving Alignment and Robustness with Circuit Breakers
要約 AI システムは有害な動作を行う可能性があり、敵対的な攻撃に対して非常に脆 … 続きを読む
Rethinking temporal self-similarity for repetitive action counting
要約 トリミングされていない長いビデオ内の反復アクションをカウントすることは、リ … 続きを読む
カテゴリー: cs.CV
Rethinking temporal self-similarity for repetitive action counting はコメントを受け付けていません
D2S: Representing sparse descriptors and 3D coordinates for camera relocalization
要約 最先端の視覚的位置特定手法は、主に、ローカル記述子と 3D 点群を照合する … 続きを読む
Let Me DeCode You: Decoder Conditioning with Tabular Data
要約 3D セグメンテーション タスク用のディープ ニューラル ネットワークのト … 続きを読む
GraspXL: Generating Grasping Motions for Diverse Objects at Scale
要約 人間の手は、物体の特定の部分を掴んだり、目的の方向から近づいたりするなど、 … 続きを読む
Facial Affective Behavior Analysis with Instruction Tuning
要約 顔の感情行動分析 (FABA) は、画像から人間の精神状態を理解するために … 続きを読む
カテゴリー: cs.CV
Facial Affective Behavior Analysis with Instruction Tuning はコメントを受け付けていません