月別アーカイブ: 2024年7月

Learn from the Learnt: Source-Free Active Domain Adaptation via Contrastive Sampling and Visual Persistence

投稿日: 2024年7月29日作成者: jarxiv

要約ドメインアダプテーション (DA) は、ソースドメインから関連するター … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

A Scalable Quantum Non-local Neural Network for Image Classification

投稿日: 2024年7月29日作成者: jarxiv

要約非ローカル演算はコンピュータビジョンにおいて重要な役割を果たし、入力全体 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.IT, cs.LG, math.IT, quant-ph | コメントを受け付けていません

SHIC: Shape-Image Correspondences with no Keypoint Supervision

投稿日: 2024年7月29日作成者: jarxiv

要約正準表面マッピングは、オブジェクトの各ピクセルを 3D テンプレート内の対 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Wolf: Captioning Everything with a World Summarization Framework

投稿日: 2024年7月29日作成者: jarxiv

要約私たちは、正確なビデオキャプションを作成するための WOrLd 要約フレー … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

UGG: Unified Generative Grasping

投稿日: 2024年7月29日作成者: jarxiv

要約器用な掴みは、高い掴み成功率で多様な掴み姿勢を生み出すことを目的としていま … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

HRP: Human Affordances for Robotic Pre-Training

投稿日: 2024年7月29日作成者: jarxiv

要約現実のさまざまなタスクに「一般化」するために、ロボットエージェントには、 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

Floating No More: Object-Ground Reconstruction from a Single Image

投稿日: 2024年7月29日作成者: jarxiv

要約単一画像からの 3D オブジェクト再構成における最近の進歩は、主にオブジェ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Dallah: A Dialect-Aware Multimodal Large Language Model for Arabic

投稿日: 2024年7月29日作成者: jarxiv

要約最近の進歩により、画像からテキストへのコンテンツの生成と理解におけるマルチ … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

Exploring Scaling Trends in LLM Robustness

投稿日: 2024年7月29日作成者: jarxiv

要約言語モデルの機能は、モデルのサイズとトレーニングデータをスケーリングする … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG, I.2.7 | コメントを受け付けていません

Recursive Introspection: Teaching Language Model Agents How to Self-Improve

投稿日: 2024年7月29日作成者: jarxiv

要約基礎モデルでインテリジェントなエージェントの動作を可能にするための中心的な … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

月別アーカイブ: 2024年7月

Learn from the Learnt: Source-Free Active Domain Adaptation via Contrastive Sampling and Visual Persistence

A Scalable Quantum Non-local Neural Network for Image Classification

SHIC: Shape-Image Correspondences with no Keypoint Supervision

Wolf: Captioning Everything with a World Summarization Framework

UGG: Unified Generative Grasping

HRP: Human Affordances for Robotic Pre-Training

Floating No More: Object-Ground Reconstruction from a Single Image

Dallah: A Dialect-Aware Multimodal Large Language Model for Arabic

Exploring Scaling Trends in LLM Robustness

Recursive Introspection: Teaching Language Model Agents How to Self-Improve

最近の投稿

最近のコメント

アーカイブ

カテゴリー