-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Analyzing The Language of Visual Tokens
要約 LLaVA や Chameleon など、視覚および言語タスク用のトランス … 続きを読む
ReCapture: Generative Video Camera Controls for User-Provided Videos using Masked Video Fine-Tuning
要約 最近、ビデオ モデリングの進歩により、生成されたビデオ内でカメラの軌道を制 … 続きを読む
MEG: Medical Knowledge-Augmented Large Language Models for Question Answering
要約 質問応答は、明示的なコンテキストと、明言されていない関連分野の知識の両方に … 続きを読む
TableGPT2: A Large Multimodal Model with Tabular Data Integration
要約 GPT、Claude、LLaMA、Qwen などのモデルの出現により、AI … 続きを読む
A Collaborative Content Moderation Framework for Toxicity Detection based on Conformalized Estimates of Annotation Disagreement
要約 コンテンツのモデレーションは通常、人間のモデレーターと機械学習モデルの取り … 続きを読む
How Transformers Solve Propositional Logic Problems: A Mechanistic Analysis
要約 大規模言語モデル (LLM) は、計画と推論を必要とするタスクで驚くべきパ … 続きを読む
GS2Pose: Two-stage 6D Object Pose Estimation Guided by Gaussian Splatting
要約 この論文では、GS2Pose と呼ばれる、新しいオブジェクトの正確かつロバ … 続きを読む
Precise and Dexterous Robotic Manipulation via Human-in-the-Loop Reinforcement Learning
要約 強化学習 (RL) は、複雑なロボット操作スキルの自律的な習得を可能にする … 続きを読む
Hunyuan-Large: An Open-Source MoE Model with 52 Billion Activated Parameters by Tencent
要約 このペーパーでは、Hunyuan-Large について紹介します。これは現 … 続きを読む