-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
月別アーカイブ: 2023年5月
Balancing the Picture: Debiasing Vision-Language Datasets with Synthetic Contrast Sets
要約 画像を大規模に生成、編集、キャプションを付けるための視覚言語モデルの人気が … 続きを読む
カテゴリー: cs.CV
Balancing the Picture: Debiasing Vision-Language Datasets with Synthetic Contrast Sets はコメントを受け付けていません
ChatCoT: Tool-Augmented Chain-of-Thought Reasoning on Chat-based Large Language Models
要約 大規模言語モデル (LLM) はさまざまな評価ベンチマークで優れたパフォー … 続きを読む
カテゴリー: cs.CL
ChatCoT: Tool-Augmented Chain-of-Thought Reasoning on Chat-based Large Language Models はコメントを受け付けていません
Large Language Models are Better Reasoners with Self-Verification
要約 最近、思考連鎖 (CoT) の促進により、GPT-3 などの大規模言語モデ … 続きを読む
3D Open-vocabulary Segmentation with Foundation Models
要約 3D シーンのオープンボキャブラリーセグメンテーションは人間の知覚の基本的 … 続きを読む
カテゴリー: cs.CV
3D Open-vocabulary Segmentation with Foundation Models はコメントを受け付けていません
GrACE: Generation using Associated Code Edits
要約 開発者は、バグ修正や新機能の追加など、さまざまな理由でコードの編集にかなり … 続きを読む
Anchor Prediction: Automatic Refinement of Internet Links
要約 インターネット リンクにより、ユーザーは関連情報に簡単にアクセスできるため … 続きを読む
Instruct2Act: Mapping Multi-modality Instructions to Robotic Actions with Large Language Model
要約 基礎モデルは、テキストから画像への生成、パノプティック セグメンテーション … 続きを読む
How Old is GPT?: The HumBEL Framework for Evaluating Language Models using Human Demographic Data
要約 大規模な事前トレーニング済み言語モデル (LM) は NLP 全体でより多 … 続きを読む
DetGPT: Detect What You Need via Reasoning
要約 近年、大規模言語モデル (LLM) の開発により、コンピューター ビジョン … 続きを読む
DUBLIN — Document Understanding By Language-Image Network
要約 視覚的な文書の理解は、文書画像内のテキストと視覚的要素の両方の分析を伴う複 … 続きを読む