-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「cs.AI」カテゴリーアーカイブ
Wavelet Latent Diffusion (Wala): Billion-Parameter 3D Generative Model with Compact Wavelet Encodings
要約 大規模な 3D 生成モデルは大量の計算リソースを必要としますが、高解像度で … 続きを読む
LLMPhy: Complex Physical Reasoning Using Large Language Models and World Models
要約 物理的推論は、現実世界で動作するロボット エージェントに必要な重要なスキル … 続きを読む
GaussianAnything: Interactive Point Cloud Latent Diffusion for 3D Generation
要約 3D コンテンツの生成は大幅に進歩しましたが、既存の方法は入力形式、潜在空 … 続きを読む
Scaling Properties of Diffusion Models for Perceptual Tasks
要約 この論文では、拡散モデルを使用した反復計算が、生成タスクだけでなく視覚認識 … 続きを読む
OCMDP: Observation-Constrained Markov Decision Process
要約 多くの実際のアプリケーションでは、意思決定プロセスでは、情報を取得するコス … 続きを読む
On Active Privacy Auditing in Supervised Fine-tuning for White-Box Language Models
要約 事前トレーニングと微調整のアプローチは、さまざまな NLP アプリケーショ … 続きを読む
Stronger Models are NOT Stronger Teachers for Instruction Tuning
要約 命令チューニングは、大規模言語モデル (LLM) がユーザーの命令に効果的 … 続きを読む
Add-it: Training-Free Object Insertion in Images With Pretrained Diffusion Models
要約 テキストの指示に基づいて画像にオブジェクトを追加することは、セマンティック … 続きを読む
Is Linear Feedback on Smoothed Dynamics Sufficient for Stabilizing Contact-Rich Plans?
要約 接触は多くの勾配ベースのコントローラー合成ツールが想定している滑らかさの条 … 続きを読む
Beyond Text: Utilizing Vocal Cues to Improve Decision Making in LLMs for Robot Navigation Tasks
要約 LLM は人間の会話におけるテキストの処理には優れていますが、ソーシャル … 続きを読む