「cs.CL」カテゴリーアーカイブ

SynWorld: Virtual Scenario Synthesis for Agentic Action Knowledge Refinement

投稿日: 2025年5月29日作成者: jarxiv

要約エージェントとその環境間の相互作用において、エージェントはアクションを計画 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MA | コメントを受け付けていません

RICO: Improving Accuracy and Completeness in Image Recaptioning via Visual Reconstruction

投稿日: 2025年5月29日作成者: jarxiv

要約画像の復帰は、さまざまなマルチモーダルタスクの品質が向上したトレーニングデ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Chain-of-Talkers (CoTalk): Fast Human Annotation of Dense Image Captions

投稿日: 2025年5月29日作成者: jarxiv

要約密に注釈付きの画像キャプションは、堅牢な視覚系のアラインメントの学習を大幅 … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Spatial Knowledge Graph-Guided Multimodal Synthesis

投稿日: 2025年5月29日作成者: jarxiv

要約マルチモーダル大手言語モデル（MLLM）の最近の進歩により、能力が大幅に向 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

Sherlock: Self-Correcting Reasoning in Vision-Language Models

投稿日: 2025年5月29日作成者: jarxiv

要約推論ビジョン言語モデル（VLM）は、複雑なマルチモーダルタスクで有望なパフ … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG | コメントを受け付けていません

3DLLM-Mem: Long-Term Spatial-Temporal Memory for Embodied 3D Large Language Model

投稿日: 2025年5月29日作成者: jarxiv

要約人間は、時間的および空間的経験を越えて長期的なメモリを活用することにより、 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | コメントを受け付けていません

Something’s Fishy In The Data Lake: A Critical Re-evaluation of Table Union Search Benchmarks

投稿日: 2025年5月29日作成者: jarxiv

要約最近のテーブル表現学習およびデータ発見方法は、データレイク内のテーブルユニ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.DB, cs.IR, cs.LG | コメントを受け付けていません

PEDANTIC: A Dataset for the Automatic Examination of Definiteness in Patent Claims

投稿日: 2025年5月29日作成者: jarxiv

要約特許請求は、発明の保護範囲を定義します。請求に曖昧さがある場合、それは特 … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Pangu Pro MoE: Mixture of Grouped Experts for Efficient Sparsity

投稿日: 2025年5月29日作成者: jarxiv

要約大規模な言語モデルにおける専門家（MOE）の混合物の外科は、はるかに大きな … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Visuospatial Cognitive Assistant

投稿日: 2025年5月29日作成者: jarxiv

要約ビデオベースの空間認知は、ロボット工学と具体化されたAIにとって不可欠です … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

SynWorld: Virtual Scenario Synthesis for Agentic Action Knowledge Refinement

RICO: Improving Accuracy and Completeness in Image Recaptioning via Visual Reconstruction

Chain-of-Talkers (CoTalk): Fast Human Annotation of Dense Image Captions

Spatial Knowledge Graph-Guided Multimodal Synthesis

Sherlock: Self-Correcting Reasoning in Vision-Language Models

3DLLM-Mem: Long-Term Spatial-Temporal Memory for Embodied 3D Large Language Model

Something’s Fishy In The Data Lake: A Critical Re-evaluation of Table Union Search Benchmarks

PEDANTIC: A Dataset for the Automatic Examination of Definiteness in Patent Claims

Pangu Pro MoE: Mixture of Grouped Experts for Efficient Sparsity

Visuospatial Cognitive Assistant

最近の投稿

最近のコメント

アーカイブ

カテゴリー