top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

AI21 Labs mengumumkan model bahasa Jamba 1.5

Generatived

24/8/23 9:00

AI21 Labs baru-baru ini mengumumkan rangkaian model Jamba 1.5, rangkaian model bahasa skala besar (LLM) canggih yang cocok untuk berbagai tugas AI generatif. Tugas-tugas ini mencakup pembuatan konten, peringkasan dokumen, perbandingan, dan penggalian wawasan dari kumpulan data yang luas. Model ini memanfaatkan arsitektur hibrid yang menggabungkan struktur Transformer dan Mamba dengan modul Mix of Experts (MoE) untuk meningkatkan efisiensi, latensi, dan penanganan konteks yang panjang. Ini juga dirancang agar mudah diterapkan pada platform yang dipercepat, memungkinkan bisnis menjalankan aplikasi dengan aman dan dekat dengan data mereka.

Model Jamba 1.5, dioptimalkan dan dihosting oleh NVIDIA, kini dapat diakses melalui Katalog API NVIDIA. Model ini mengintegrasikan arsitektur Mamba, yang dikenal dengan manajemen konteks panjangnya, dan lapisan transformator yang memberikan kemampuan presisi dan inferensi. Modul MoE meningkatkan kapasitas model tanpa tuntutan komputasi tambahan. Setiap blok Jamba terdiri dari delapan lapisan dengan rasio perhatian terhadap Mamba 1:7 dan muat pada satu GPU NVIDIA H100 80 GB. Model ini juga menawarkan jendela konteks token 256 ribu, yang setara dengan sekitar 800 halaman teks, memungkinkan pemrosesan dan pembangkitan respons yang lebih tepat.

Fitur penting dari model Jamba 1.5 adalah fungsionalitas pemanggilan fungsi yang didukung oleh pertukaran data JSON. Hal ini meningkatkan interaktivitas AI, memungkinkan model melakukan tindakan kompleks dan memproses kueri data terstruktur. Keserbagunaan tersebut memungkinkan model untuk diterapkan di berbagai industri, mulai dari menghasilkan dokumen keuangan hingga membantu lingkungan ritel, semuanya dengan presisi real-time.

Selain itu, model Jamba 1.5 kompatibel dengan Search Augmentation Generation (RAG), yang meningkatkan kemampuannya dalam memberikan respons yang akurat dan sesuai konteks. Jendela konteks token yang diperluas memungkinkan model menangani informasi dalam jumlah besar, sehingga ideal untuk analisis data mendetail. RAG telah terbukti bermanfaat dalam lingkungan dengan basis pengetahuan yang luas dan terdistribusi, karena modelnya membantu menyederhanakan pencarian dan meningkatkan akurasi. Pihak yang berminat dapat menjelajahi model Jamba 1.5 di Katalog API NVIDIA. Katalog ini menampilkan berbagai model AI yang didukung oleh layanan mikro NVIDIA NIM untuk mengoptimalkan penerapan dalam aplikasi perusahaan. saus:

Bagikan artikel ini:

Berita terkini
Red Hat Akuisisi Neural Magic untuk Tingkatkan Kinerja AI

Red Hat Akuisisi Neural Magic untuk Tingkatkan Kinerja AI

24/11/13 4:30

Red Hat, Inc. telah menandatangani perjanjian definitif untuk mengakuisisi Neural Magic, sebuah perusahaan yang mengkhususkan diri dalam perangkat lunak yang meningkatkan kinerja beban kerja inferensi AI generatif.

Red Hat Mengumumkan OpenShift 4.17 dan Pratinjau Lightspeed

Red Hat Mengumumkan OpenShift 4.17 dan Pratinjau Lightspeed

24/11/13 4:30

Pada acara KubeCon + CloudNativeCon NA di Salt Lake City, Red Hat Inc. mengumumkan fitur dan penyempurnaan baru untuk Red Hat OpenShift, platform aplikasi cloud hibrid bertenaga Kubernetes.

Red Hat OpenShift AI 2.15 Mendukung Enterprise Hybrid Cloud

Red Hat OpenShift AI 2.15 Mendukung Enterprise Hybrid Cloud

24/11/13 4:30

Red Hat hari ini mengumumkan Red Hat OpenShift AI 2.15, versi terbaru platform AI dan ML yang dirancang untuk membantu perusahaan meningkatkan skala aplikasi berkemampuan AI di seluruh cloud hybrid.

RelationalAI Meluncurkan Aplikasi Asli Snowflake di BUILD

RelationalAI Meluncurkan Aplikasi Asli Snowflake di BUILD

24/11/13 4:30

SAN FRANCISCO, 12 November 2024 – RelationalAI mengumumkan aplikasi asli Snowflake di konferensi pengembang BUILD 2024 dan telah membuatnya tersedia secara umum di Snowflake Marketplace.

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Ikuti kami

  • Facebook
  • X

Bahasa

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Generatived

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Red Hat Akuisisi Neural Magic untuk Tingkatkan Kinerja AI

Red Hat Akuisisi Neural Magic untuk Tingkatkan Kinerja AI

24/11/13 4:30

Red Hat, Inc. telah menandatangani perjanjian definitif untuk mengakuisisi Neural Magic, sebuah perusahaan yang mengkhususkan diri dalam perangkat lunak yang meningkatkan kinerja beban kerja inferensi AI generatif.

Red Hat Mengumumkan OpenShift 4.17 dan Pratinjau Lightspeed

Red Hat Mengumumkan OpenShift 4.17 dan Pratinjau Lightspeed

24/11/13 4:30

Pada acara KubeCon + CloudNativeCon NA di Salt Lake City, Red Hat Inc. mengumumkan fitur dan penyempurnaan baru untuk Red Hat OpenShift, platform aplikasi cloud hibrid bertenaga Kubernetes.

Red Hat OpenShift AI 2.15 Mendukung Enterprise Hybrid Cloud

Red Hat OpenShift AI 2.15 Mendukung Enterprise Hybrid Cloud

24/11/13 4:30

Red Hat hari ini mengumumkan Red Hat OpenShift AI 2.15, versi terbaru platform AI dan ML yang dirancang untuk membantu perusahaan meningkatkan skala aplikasi berkemampuan AI di seluruh cloud hybrid.

RelationalAI Meluncurkan Aplikasi Asli Snowflake di BUILD

RelationalAI Meluncurkan Aplikasi Asli Snowflake di BUILD

24/11/13 4:30

SAN FRANCISCO, 12 November 2024 – RelationalAI mengumumkan aplikasi asli Snowflake di konferensi pengembang BUILD 2024 dan telah membuatnya tersedia secara umum di Snowflake Marketplace.

bottom of page