-
最近の投稿
- Physical Reservoir Computing in Hook-Shaped Rover Wheel Spokes for Real-Time Terrain Identification
- Chain-of-Modality: Learning Manipulation Programs from Multimodal Human Videos with Vision-Language-Models
- Multi-Sensor Fusion-Based Mobile Manipulator Remote Control for Intelligent Smart Home Assistance
- Integration of a Graph-Based Path Planner and Mixed-Integer MPC for Robot Navigation in Cluttered Environments
- Demonstrating CavePI: Autonomous Exploration of Underwater Caves by Semantic Guidance
-
最近のコメント
表示できるコメントはありません。 cs.AI (36829) cs.CL (27883) cs.CV (42623) cs.HC (2814) cs.LG (41781) cs.RO (21795) cs.SY (3320) eess.IV (4979) eess.SY (3312) stat.ML (5469)
月別アーカイブ: 2024年6月
Mamba: Linear-Time Sequence Modeling with Selective State Spaces
要約 現在、深層学習におけるエキサイティングなアプリケーションのほとんどを強化し … 続きを読む
Code Pretraining Improves Entity Tracking Abilities of Language Models
要約 最近の研究では、コード上で言語モデルを事前トレーニングすると、自然言語で表 … 続きを読む
Context-aware Difference Distilling for Multi-change Captioning
要約 マルチチェンジキャプションは、画像ペア内の複雑で結合した変化を自然言語で説 … 続きを読む
カテゴリー: cs.CV
Context-aware Difference Distilling for Multi-change Captioning はコメントを受け付けていません
Rethinking Open-World Semi-Supervised Learning: Distribution Mismatch and Inductive Inference
要約 オープンワールド半教師あり学習 (OWSSL) は、ラベルのないデータセッ … 続きを読む
Attention-aware Semantic Communications for Collaborative Inference
要約 ビジョントランスフォーマー(ViT)モデルの効率的な使用に焦点を当て、エッ … 続きを読む
Retrieval Meets Reasoning: Even High-school Textbook Knowledge Benefits Multimodal Reasoning
要約 検索拡張生成 (RAG) を備えた大規模言語モデルは、外部知識ベースを活用 … 続きを読む
カテゴリー: cs.CV
Retrieval Meets Reasoning: Even High-school Textbook Knowledge Benefits Multimodal Reasoning はコメントを受け付けていません
einspace: Searching for Neural Architectures from Fundamental Operations
要約 ニューラル アーキテクチャ検索 (NAS) は、特定のタスクに対して高性能 … 続きを読む
Exposure Bracketing is All You Need for Unifying Image Restoration and Enhancement Tasks
要約 暗い環境で鮮明なコンテンツを含む高品質の写真を取得することは非常に望まれて … 続きを読む
MegActor: Harness the Power of Raw Video for Vivid Portrait Animation
要約 生の運転ビデオには、ポートレート アニメーションの分野におけるランドマーク … 続きを読む
カテゴリー: cs.CV
MegActor: Harness the Power of Raw Video for Vivid Portrait Animation はコメントを受け付けていません
MeshXL: Neural Coordinate Field for Generative 3D Foundation Models
要約 3D データのポリゴン メッシュ表現は、優れた柔軟性、高速なレンダリング速 … 続きを読む
カテゴリー: cs.CV
MeshXL: Neural Coordinate Field for Generative 3D Foundation Models はコメントを受け付けていません