-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.CV」カテゴリーアーカイブ
Which Viewpoint Shows it Best? Language for Weakly Supervising View Selection in Multi-view Videos
要約 マルチビュー ビデオが与えられた場合、人間の観察者にとってどの視点が最も有 … 続きを読む
カテゴリー: cs.CV
Which Viewpoint Shows it Best? Language for Weakly Supervising View Selection in Multi-view Videos はコメントを受け付けていません
Weakly-Supervised Anomaly Detection in Surveillance Videos Based on Two-Stream I3D Convolution Network
要約 都市監視システムの広範な導入により、公共の安全を強化するために異常検出のた … 続きを読む
Masked Image Modeling Boosting Semi-Supervised Semantic Segmentation
要約 半教師あり学習と自己教師あり学習はラベルなしデータから知識を効果的にモデル … 続きを読む
カテゴリー: cs.CV
Masked Image Modeling Boosting Semi-Supervised Semantic Segmentation はコメントを受け付けていません
HiFi-Syn: Hierarchical Granularity Discrimination for High-Fidelity Synthesis of MR Images with Structure Preservation
要約 医療画像の構造情報を保存しながら医療画像を合成することは、医学研究において … 続きを読む
Sharingan: Extract User Action Sequence from Desktop Recordings
要約 ユーザー アクティビティのビデオ録画、特にデスクトップ録画は、ユーザーの行 … 続きを読む
LUDO: Low-Latency Understanding of Highly Deformable Objects using Point Cloud Occupancy Functions
要約 変形可能な物体の内部構造の形状と位置を正確に決定することは、ロボットによる … 続きを読む
Textured-GS: Gaussian Splatting with Spatially Defined Color and Opacity
要約 このペーパーでは、球面調和関数 (SH) を使用して空間的に定義された色と … 続きを読む
Quantifying and Mitigating Unimodal Biases in Multimodal Large Language Models: A Causal Perspective
要約 大規模言語モデル (LLM) の最近の進歩により、マルチモーダル LLM … 続きを読む
GaussianObject: High-Quality 3D Object Reconstruction from Four Views with Gaussian Splatting
要約 非常にまばらなビューから 3D オブジェクトを再構築してレンダリングするこ … 続きを読む
Multimodal Instruction Tuning with Hybrid State Space Models
要約 長いコンテキストの処理は、高解像度画像や高フレーム レート ビデオの処理な … 続きを読む
カテゴリー: cs.CV
Multimodal Instruction Tuning with Hybrid State Space Models はコメントを受け付けていません