「cs.AI」カテゴリーアーカイブ

Robots Pre-train Robots: Manipulation-Centric Robotic Representation from Large-Scale Robot Dataset

投稿日: 2024年10月30日作成者: jarxiv

要約視覚表現の事前トレーニングにより、ロボットの学習効率が向上しました。大規 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

EEG-Driven 3D Object Reconstruction with Color Consistency and Diffusion Prior

投稿日: 2024年10月30日作成者: jarxiv

要約 EEG に基づく視覚認識の再構築は、現在の研究の注目の的となっています。 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

AutoBench-V: Can Large Vision-Language Models Benchmark Themselves?

投稿日: 2024年10月30日作成者: jarxiv

要約 Large Vision-Language Model (LVLM) は、 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

EMOCPD: Efficient Attention-based Models for Computational Protein Design Using Amino Acid Microenvironment

投稿日: 2024年10月30日作成者: jarxiv

要約計算タンパク質設計 (CPD) とは、タンパク質を設計するための計算手法の … 続きを読む →

カテゴリー: cs.AI, cs.LG, q-bio.BM | コメントを受け付けていません

Document Parsing Unveiled: Techniques, Challenges, and Prospects for Structured Information Extraction

投稿日: 2024年10月30日作成者: jarxiv

要約文書解析は、契約書、学術論文、請求書などの非構造化文書および半構造化文書を … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | コメントを受け付けていません

Aligning Text-to-Image Diffusion Models with Reward Backpropagation

投稿日: 2024年10月30日作成者: jarxiv

要約テキストから画像への拡散モデルは、非常に大規模な教師なしまたは弱く教師付き … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

WildOcc: A Benchmark for Off-Road 3D Semantic Occupancy Prediction

投稿日: 2024年10月29日作成者: jarxiv

要約 3D セマンティック占有予測は自動運転に不可欠な部分であり、シーンの幾何学 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

RadarOcc: Robust 3D Occupancy Prediction with 4D Imaging Radar

投稿日: 2024年10月29日作成者: jarxiv

要約 3D 占有ベースの認識パイプラインは、詳細なシーンの説明をキャプチャし、さ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Creativity and Visual Communication from Machine to Musician: Sharing a Score through a Robotic Camera

投稿日: 2024年10月29日作成者: jarxiv

要約この論文では、「Guided Harmony」音楽ゲーム内にロボットカメ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.HC, cs.RO | コメントを受け付けていません

Guide-LLM: An Embodied LLM Agent and Text-Based Topological Map for Robotic Guidance of People with Visual Impairments

投稿日: 2024年10月29日作成者: jarxiv

要約視覚障害者 (PVI) にとって、ナビゲーションは大きな課題となります。 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.RO | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Robots Pre-train Robots: Manipulation-Centric Robotic Representation from Large-Scale Robot Dataset

EEG-Driven 3D Object Reconstruction with Color Consistency and Diffusion Prior

AutoBench-V: Can Large Vision-Language Models Benchmark Themselves?

EMOCPD: Efficient Attention-based Models for Computational Protein Design Using Amino Acid Microenvironment

Document Parsing Unveiled: Techniques, Challenges, and Prospects for Structured Information Extraction

Aligning Text-to-Image Diffusion Models with Reward Backpropagation

WildOcc: A Benchmark for Off-Road 3D Semantic Occupancy Prediction

RadarOcc: Robust 3D Occupancy Prediction with 4D Imaging Radar

Creativity and Visual Communication from Machine to Musician: Sharing a Score through a Robotic Camera

Guide-LLM: An Embodied LLM Agent and Text-Based Topological Map for Robotic Guidance of People with Visual Impairments

最近の投稿

最近のコメント

アーカイブ

カテゴリー