-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2023年8月
Whose Emotion Matters? Speaking Activity Localisation without Prior Knowledge
要約 会話中の感情認識 (ERC) のタスクは、たとえばビデオベースの Mult … 続きを読む
Memory-and-Anticipation Transformer for Online Action Understanding
要約 既存の予測システムのほとんどは、さまざまな記憶メカニズムを使用して人間の予 … 続きを読む
カテゴリー: cs.CV
Memory-and-Anticipation Transformer for Online Action Understanding はコメントを受け付けていません
Tirtha — An Automated Platform to Crowdsource Images and Create 3D Models of Heritage Sites
要約 文化遺産 (CH) のデジタル保存は、自然災害や人間の活動による被害から保 … 続きを読む
A Foundation LAnguage-Image model of the Retina (FLAIR): Encoding expert knowledge in text supervision
要約 財団のビジョン言語モデルは現在、コンピューター ビジョンを変革しており、そ … 続きを読む
カテゴリー: cs.CV
A Foundation LAnguage-Image model of the Retina (FLAIR): Encoding expert knowledge in text supervision はコメントを受け付けていません
Relightable and Animatable Neural Avatar from Sparse-View Video
要約 この論文では、未知の照明の下で動的な人間のスパースビュー (または単眼) … 続きを読む
Helping Hands: An Object-Aware Ego-Centric Video Recognition Model
要約 私たちは、エゴ中心のビデオにおける時空間表現のパフォーマンスを向上させるた … 続きを読む
カテゴリー: cs.CV
Helping Hands: An Object-Aware Ego-Centric Video Recognition Model はコメントを受け付けていません
Solving Challenging Math Word Problems Using GPT-4 Code Interpreter with Code-based Self-Verification
要約 GPT-4 や PaLM-2 などの大規模言語モデル (LLM) における … 続きを読む
CoDeF: Content Deformation Fields for Temporally Consistent Video Processing
要約 我々は、新しいタイプのビデオ表現としてコンテンツ変形フィールド CoDeF … 続きを読む
カテゴリー: cs.CV
CoDeF: Content Deformation Fields for Temporally Consistent Video Processing はコメントを受け付けていません
Multiscale Attention via Wavelet Neural Operators for Vision Transformers
要約 トランスフォーマーは、コンピューター ビジョンにおいて広く成功を収めてきま … 続きを読む
Large Language Models for Information Retrieval: A Survey
要約 情報取得の主要な手段として、検索エンジンなどの情報検索 (IR) システム … 続きを読む