NVIDIA Meningkatkan Kemampuan Robot dengan VLM dan LLM 10/2530

Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

NVIDIA meningkatkan kemampuan robot dengan VLM dan LLM

Generatived

24/9/24 4:00

Model bahasa visual (VLM) meningkatkan kemampuan robot dengan memungkinkan mereka memproses dan memahami data multimodal. Menggabungkan pemahaman bahasa dan kemampuan visual, model ini memungkinkan robot membangun dan menanyakan memori jangka panjang, meningkatkan kemampuan mereka untuk bernavigasi dan berinteraksi dengan lingkungannya dalam jangka waktu yang lama. Project ReMEmbR mendemonstrasikan kemajuan ini dengan menggunakan VLM dan database vektor untuk membuat memori semantik robot, yang kemudian disimpulkan oleh agen LLM.

Sistem dua tahap ReMEmbR dimulai dengan fase konstruksi memori di mana robot menangkap dan menyimpan segmen video. Segmen video kemudian diberi teks dan dimasukkan ke dalam database vektor. Memori terstruktur ini memungkinkan penyimpanan dan permintaan informasi yang efisien. Fase kueri berikutnya melibatkan agen LLM yang dapat mengambil data ini dan membuat kesimpulan untuk menjawab pertanyaan kompleks dari pengguna. Proses ini memungkinkan robot melakukan tugas-tugas yang memerlukan pemahaman spasial dan temporal.

Penerapan praktis ReMembR didemonstrasikan dengan robot nyata yang ditenagai oleh NVIDIA Isaac ROS dan Nova Carter. Robot ini dapat bergerak di lingkungan kantor, menjawab pertanyaan, dan mengarahkan orang ke lokasi tertentu. Integrasi pengenalan suara memungkinkan interaksi pengguna secara alami dan menunjukkan potensi VLM dan LLM dalam robotika.

Sifat sumber terbuka ReMEmbR serta kode dan sumber daya bersama memungkinkan pengembang untuk mengeksplorasi dan berkontribusi pada bidang AI generatif dalam robotika. Keberhasilan proyek ini menunjukkan masa depan di mana robot dapat bergerak secara mandiri dalam jangka waktu yang lama, berinteraksi dengan lingkungannya, dan memberikan bantuan berharga dalam berbagai situasi.

Sumber: Blog Pengembang NVIDIA

Bagikan artikel ini:

Berita terkini

Fungsi pembuatan menit otomatis AI baru Nishika

24/11/6 5:30

Nishika (Minato-ku, Tokyo) telah menambahkan fitur baru ke SecureMemoCloud yang disebut ``menit hampir selesai''.

Baca lebih lanjut

Layanan koreksi AI video medis Aspiretech

24/11/6 5:30

Aspire Tech (Chiyoda-ku, Tokyo) telah meluncurkan ``Kaisei-kun,'' sebuah layanan baru yang menggunakan AI untuk mengotomatiskan pengoreksian konten video untuk industri medis.

Baca lebih lanjut

Pengenalan obrolan AI AliDremNext

24/11/6 5:30

AliDremNext (Suita City, Prefektur Osaka), bekerja sama dengan Ryoyu Systems (Minato Ward, Tokyo), telah mengembangkan chatbot AI yang berjalan pada infrastruktur internalnya.

Baca lebih lanjut

Teknologi yang Dipatenkan dan Pemenang Penghargaan AI At Home Lab

24/11/6 5:30

At Home Lab (Chiyoda-ku, Tokyo) memenangkan penghargaan Award of Excellence pada Konferensi Nasional Masyarakat Kecerdasan Buatan Jepang 2024 untuk penelitian Sho Hattori

Baca lebih lanjut

Bagikan artikel ini:

Kategori

Peningkat Gambar AI

Pembuat kode AI

Manajemen tugas AI

Tanpa kode/kode rendah

Generator desain grafis AI

Generator seni/ilustrasi AI

Semua alat

Berita

AI dan hukum/peraturan/masyarakat

Perusahaan/produk/teknologi AI

AI Teknologi Besar

OpenAI/ChatGPT

AI generasi kreatif

AI generasi berbasis teks

AI generatif Jepang

Dasar-dasar AI generatif

Panduan penerapan AI terbaik

Profil perusahaan

Tentang kami

Kebijakan Privasi

Ketentuan Penggunaan Situs

Perusahaan yang mengoperasikan

Ikuti kami

Bahasa

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Ikuti kami

Bahasa

Kategori

Semua alat

Manajemen tugas AI

Generator desain grafis AI

Tanpa kode/kode rendah

Pembuat kode AI

Peningkat Gambar AI

Generator seni/ilustrasi AI

AI dan hukum/sistem/ekonomi/masyarakat

Perusahaan/produk/teknologi AI

AI Teknologi Besar

OpenAI/ChatGPT

AI generasi kreatif

AI generasi berbasis teks

AI generatif Jepang

Dasar-dasar AI generatif

Panduan aplikasi AI terbaik

Berita

Tentang kami

Kebijakan privasi

Ketentuan Penggunaan Situs

Perusahaan pengelola

Profil perusahaan

Berita terkini

Fungsi pembuatan menit otomatis AI baru Nishika

24/11/6 5:30

Nishika (Minato-ku, Tokyo) telah menambahkan fitur baru ke SecureMemoCloud yang disebut ``menit hampir selesai''.

Baca lebih lanjut

Layanan koreksi AI video medis Aspiretech

24/11/6 5:30

Aspire Tech (Chiyoda-ku, Tokyo) telah meluncurkan ``Kaisei-kun,'' sebuah layanan baru yang menggunakan AI untuk mengotomatiskan pengoreksian konten video untuk industri medis.

Baca lebih lanjut

Pengenalan obrolan AI AliDremNext

24/11/6 5:30

AliDremNext (Suita City, Prefektur Osaka), bekerja sama dengan Ryoyu Systems (Minato Ward, Tokyo), telah mengembangkan chatbot AI yang berjalan pada infrastruktur internalnya.

Baca lebih lanjut

Teknologi yang Dipatenkan dan Pemenang Penghargaan AI At Home Lab

24/11/6 5:30

At Home Lab (Chiyoda-ku, Tokyo) memenangkan penghargaan Award of Excellence pada Konferensi Nasional Masyarakat Kecerdasan Buatan Jepang 2024 untuk penelitian Sho Hattori

Baca lebih lanjut