-
最近の投稿
- A Data-Driven Modeling and Motion Control of Heavy-Load Hydraulic Manipulators via Reversible Transformation
- Data-Driven Multi-step Nonlinear Model Predictive Control for Industrial Heavy Load Hydraulic Robot
- Image Compression Using Novel View Synthesis Priors
- OTO Planner: An Efficient Only Travelling Once Exploration Planner for Complex and Unknown Environments
- t-READi: Transformer-Powered Robust and Efficient Multimodal Inference for Autonomous Driving
-
最近のコメント
表示できるコメントはありません。 cs.AI (29990) cs.CL (22653) cs.CR (2325) cs.CV (36362) cs.LG (34812) cs.RO (17416) cs.SY (2673) eess.IV (4425) eess.SY (2667) stat.ML (4642)
月別アーカイブ: 2024年6月
SimTxtSeg: Weakly-Supervised Medical Image Segmentation with Simple Text Cues
要約 弱い教師付き医療画像のセグメンテーションは、セグメンテーションのパフォーマ … 続きを読む
カテゴリー: cs.CV
SimTxtSeg: Weakly-Supervised Medical Image Segmentation with Simple Text Cues はコメントを受け付けていません
Mamba or RWKV: Exploring High-Quality and High-Efficiency Segment Anything Model
要約 トランスフォーマーベースのセグメンテーション手法は、高解像度の画像を扱う際 … 続きを読む
カテゴリー: cs.CV
Mamba or RWKV: Exploring High-Quality and High-Efficiency Segment Anything Model はコメントを受け付けていません
Taming Data and Transformers for Audio Generation
要約 環境音や環境効果の生成は、データ不足とキャプションの品質が不十分なことが多 … 続きを読む
OMG-LLaVA: Bridging Image-level, Object-level, Pixel-level Reasoning and Understanding
要約 現在のユニバーサル セグメンテーション手法は、ピクセル レベルの画像とビデ … 続きを読む
カテゴリー: cs.CV
OMG-LLaVA: Bridging Image-level, Object-level, Pixel-level Reasoning and Understanding はコメントを受け付けていません
SALVe: Semantic Alignment Verification for Floorplan Reconstruction from Sparse Panoramas
要約 私たちは、新しいペアワイズ学習アライメント検証器である SALVe によっ … 続きを読む
カテゴリー: cs.CV
SALVe: Semantic Alignment Verification for Floorplan Reconstruction from Sparse Panoramas はコメントを受け付けていません
Fibottention: Inceptive Visual Representation Learning with Diverse Attention Across Heads
要約 視覚認識タスクは、主に Vision Transformer (ViT) … 続きを読む
カテゴリー: cs.CV
Fibottention: Inceptive Visual Representation Learning with Diverse Attention Across Heads はコメントを受け付けていません
ReXTime: A Benchmark Suite for Reasoning-Across-Time in Videos
要約 ビデオ イベント内で時間的推論を実行する AI モデルの能力を厳密にテスト … 続きを読む
カテゴリー: cs.CV
ReXTime: A Benchmark Suite for Reasoning-Across-Time in Videos はコメントを受け付けていません
Looking 3D: Anomaly Detection with 2D-3D Alignment
要約 視覚的な手がかりに基づく自動異常検出は、製造や製品品質評価などのさまざまな … 続きを読む
カテゴリー: cs.CV
Looking 3D: Anomaly Detection with 2D-3D Alignment はコメントを受け付けていません
HUWSOD: Holistic Self-training for Unified Weakly Supervised Object Detection
要約 ほとんどの WSOD 手法は、候補領域を生成するために従来のオブジェクト提 … 続きを読む
カテゴリー: cs.CV
HUWSOD: Holistic Self-training for Unified Weakly Supervised Object Detection はコメントを受け付けていません
Dataset Size Recovery from LoRA Weights
要約 モデル反転攻撃とメンバーシップ推論攻撃は、モデルがトレーニングされたデータ … 続きを読む
カテゴリー: cs.CV
Dataset Size Recovery from LoRA Weights はコメントを受け付けていません