-
最近の投稿
- Physical Reservoir Computing in Hook-Shaped Rover Wheel Spokes for Real-Time Terrain Identification
- Chain-of-Modality: Learning Manipulation Programs from Multimodal Human Videos with Vision-Language-Models
- Multi-Sensor Fusion-Based Mobile Manipulator Remote Control for Intelligent Smart Home Assistance
- Integration of a Graph-Based Path Planner and Mixed-Integer MPC for Robot Navigation in Cluttered Environments
- Demonstrating CavePI: Autonomous Exploration of Underwater Caves by Semantic Guidance
-
最近のコメント
表示できるコメントはありません。 cs.AI (36829) cs.CL (27883) cs.CV (42623) cs.HC (2814) cs.LG (41781) cs.RO (21795) cs.SY (3320) eess.IV (4979) eess.SY (3312) stat.ML (5469)
月別アーカイブ: 2024年6月
Exploring Multi-Timestep Multi-Stage Diffusion Features for Hyperspectral Image Classification
要約 スペクトル空間特徴学習の有効性は、ハイパースペクトル画像(HSI)の分類タ … 続きを読む
カテゴリー: cs.CV
Exploring Multi-Timestep Multi-Stage Diffusion Features for Hyperspectral Image Classification はコメントを受け付けていません
Stratified Avatar Generation from Sparse Observations
要約 AR/VRデバイスから3Dフルボディアバターを推定することは、AR/VRア … 続きを読む
CoMat: Aligning Text-to-Image Diffusion Model with Image-to-Text Concept Matching
要約 拡散モデルは、テキストから画像への生成の分野で大きな成功を収めている。しか … 続きを読む
Scaling White-Box Transformers for Vision
要約 CRATEは、圧縮された疎な表現を学習するために設計されたホワイトボックス … 続きを読む
カテゴリー: cs.CV
Scaling White-Box Transformers for Vision はコメントを受け付けていません
The Socface Project: Large-Scale Collection, Processing, and Analysis of a Century of French Censuses
要約 本稿では、1836年から1936年までのフランスの国勢調査リストから情報を … 続きを読む
カテゴリー: cs.CV
The Socface Project: Large-Scale Collection, Processing, and Analysis of a Century of French Censuses はコメントを受け付けていません
DoRA: Weight-Decomposed Low-Rank Adaptation
要約 広く使われているパラメータ効率的ファインチューニング(PEFT)手法の中で … 続きを読む
EgoNCE++: Do Egocentric Video-Language Models Really Understand Hand-Object Interactions?
要約 エゴセントリックなビデオ言語による事前学習は、エゴセントリックな手とオブジ … 続きを読む
カテゴリー: cs.CV
EgoNCE++: Do Egocentric Video-Language Models Really Understand Hand-Object Interactions? はコメントを受け付けていません
SPAFormer: Sequential 3D Part Assembly with Transformers
要約 3D部品組立(3D-PA)タスクにおける組合せ爆発の課題を克服するために設 … 続きを読む
Boosting Continual Learning of Vision-Language Models via Mixture-of-Experts Adapters
要約 継続的な学習により、視覚言語モデルは、過去の全データセットにアクセスするこ … 続きを読む
カテゴリー: cs.CV
Boosting Continual Learning of Vision-Language Models via Mixture-of-Experts Adapters はコメントを受け付けていません
Edit As You Wish: Video Caption Editing with Multi-grained User Control
要約 ユーザの要求に応じて自然言語で自動的にナレーションを行うこと、すなわち、制 … 続きを読む