-
最近の投稿
- A Data-Driven Modeling and Motion Control of Heavy-Load Hydraulic Manipulators via Reversible Transformation
- Data-Driven Multi-step Nonlinear Model Predictive Control for Industrial Heavy Load Hydraulic Robot
- Image Compression Using Novel View Synthesis Priors
- OTO Planner: An Efficient Only Travelling Once Exploration Planner for Complex and Unknown Environments
- t-READi: Transformer-Powered Robust and Efficient Multimodal Inference for Autonomous Driving
-
最近のコメント
表示できるコメントはありません。 cs.AI (29990) cs.CL (22653) cs.CR (2325) cs.CV (36362) cs.LG (34812) cs.RO (17416) cs.SY (2673) eess.IV (4425) eess.SY (2667) stat.ML (4642)
月別アーカイブ: 2024年3月
TOGS: Gaussian Splatting with Temporal Opacity Offset for Real-Time 4D DSA Rendering
要約 4 次元デジタル サブトラクション アンギオグラフィー (4D DSA) … 続きを読む
Quantifying and Mitigating Unimodal Biases in Multimodal Large Language Models: A Causal Perspective
要約 大規模言語モデル (LLM) の最近の進歩により、マルチモーダル LLM … 続きを読む
DenseNets Reloaded: Paradigm Shift Beyond ResNets and ViTs
要約 この論文では、Densely Connected Convolutiona … 続きを読む
TOD3Cap: Towards 3D Dense Captioning in Outdoor Scenes
要約 3D 高密度キャプションは、自然言語を通じて 3D シーンの包括的な理解を … 続きを読む
カテゴリー: cs.CV
TOD3Cap: Towards 3D Dense Captioning in Outdoor Scenes はコメントを受け付けていません
Classifying Objects in 3D Point Clouds Using Recurrent Neural Network: A GRU LSTM Hybrid Approach
要約 3D 点群内のオブジェクトの正確な分類は、自律ナビゲーションや拡張現実/仮 … 続きを読む
Frame by Familiar Frame: Understanding Replication in Video Diffusion Models
要約 画像生成普及モデルの勢いに基づいて、ビデオベースの普及モデルへの関心が高ま … 続きを読む
カテゴリー: cs.CV
Frame by Familiar Frame: Understanding Replication in Video Diffusion Models はコメントを受け付けていません
Situation Awareness for Driver-Centric Driving Style Adaptation
要約 乗客の受け入れと信頼を高めるには、自動運転車の運転スタイルが重要であるとい … 続きを読む
LocCa: Visual Pretraining with Location-aware Captioners
要約 画像キャプションは、対照的な事前トレーニングと同様の効果的な事前トレーニン … 続きを読む
カテゴリー: cs.CV
LocCa: Visual Pretraining with Location-aware Captioners はコメントを受け付けていません
Zero-shot Referring Expression Comprehension via Structural Similarity Between Images and Captions
要約 ゼロショット参照表現の理解は、提供されたテキスト プロンプトに対応する画像 … 続きを読む
カテゴリー: cs.CV
Zero-shot Referring Expression Comprehension via Structural Similarity Between Images and Captions はコメントを受け付けていません
Enhance Image Classification via Inter-Class Image Mixup with Diffusion Model
要約 Text-to-image (T2I) 生成モデルは、写真のようにリアルな … 続きを読む
カテゴリー: cs.CV
Enhance Image Classification via Inter-Class Image Mixup with Diffusion Model はコメントを受け付けていません