-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2024年2月
ChartX & ChartVLM: A Versatile Benchmark and Foundation Model for Complicated Chart Reasoning
要約 最近、多くの汎用性の高いマルチモーダル大規模言語モデル (MLLM) が継 … 続きを読む
カテゴリー: cs.CV
ChartX & ChartVLM: A Versatile Benchmark and Foundation Model for Complicated Chart Reasoning はコメントを受け付けていません
Adversarial Feature Alignment: Balancing Robustness and Accuracy in Deep Learning via Adversarial Training
要約 深層学習モデルの精度は向上し続けていますが、依然として敵対的な攻撃に対して … 続きを読む
Pan-Mamba: Effective pan-sharpening with State Space Model
要約 パンシャープニングでは、低解像度のマルチスペクトル画像と高解像度のパンクロ … 続きを読む
カテゴリー: cs.CV
Pan-Mamba: Effective pan-sharpening with State Space Model はコメントを受け付けていません
Zero shot VLMs for hate meme detection: Are we there yet?
要約 ソーシャル メディア上のマルチメディア コンテンツは急速に進化しており、ミ … 続きを読む
LaneGraph2Seq: Lane Topology Extraction with Language Model via Vertex-Edge Encoding and Connectivity Enhancement
要約 自動運転には道路構造の理解が重要です。 複雑な道路構造は、多くの場合、有向 … 続きを読む
カテゴリー: cs.CV
LaneGraph2Seq: Lane Topology Extraction with Language Model via Vertex-Edge Encoding and Connectivity Enhancement はコメントを受け付けていません
Pushing Auto-regressive Models for 3D Shape Generation at Capacity and Scalability
要約 自己回帰モデルは、グリッド空間内の結合分布をモデル化することにより、2D … 続きを読む
カテゴリー: cs.CV
Pushing Auto-regressive Models for 3D Shape Generation at Capacity and Scalability はコメントを受け付けていません
AnyGPT: Unified Multimodal LLM with Discrete Sequence Modeling
要約 AnyGPT は、音声、テキスト、画像、音楽などのさまざまなモダリティの統 … 続きを読む
Task-Specific Normalization for Continual Learning of Blind Image Quality Models
要約 この論文では、品質予測精度、可塑性と安定性のトレードオフ、およびタスク順序 … 続きを読む
カテゴリー: cs.CV
Task-Specific Normalization for Continual Learning of Blind Image Quality Models はコメントを受け付けていません
Mixed Gaussian Flow for Diverse Trajectory Prediction
要約 既存の軌道予測研究は生成モデルを集中的に活用しています。 フローの正規化は … 続きを読む
カテゴリー: cs.CV
Mixed Gaussian Flow for Diverse Trajectory Prediction はコメントを受け付けていません
Open3DSG: Open-Vocabulary 3D Scene Graphs from Point Clouds with Queryable Objects and Open-Set Relationships
要約 3D シーン グラフ予測の現在のアプローチは、ラベル付きデータセットに依存 … 続きを読む
カテゴリー: cs.CV
Open3DSG: Open-Vocabulary 3D Scene Graphs from Point Clouds with Queryable Objects and Open-Set Relationships はコメントを受け付けていません