Google Cloud meluncurkan model AI Gemma 3 2/3436

Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

Google Cloud meluncurkan model AI Gemma 3

Generatived

13/3/25, 04.30

Peluncuran Gemma 3 menandai kemajuan besar dalam bidang AI, yang menyediakan serangkaian model yang mengutamakan kecepatan dan portabilitas bagi para pengembang. Model-model ini dirancang untuk memudahkan pembuatan aplikasi AI canggih dalam skala besar. Saat diintegrasikan dengan Cloud Run, pengembang dapat dengan mudah menerapkan beban kerja tanpa server yang menggabungkan model AI, sehingga meningkatkan efisiensi dan pengalaman pengguna.

Gemma 3 menonjol karena kinerjanya yang unggul dan menawarkan jejak memori yang lebih kecil yang ideal untuk beban kerja inferensi yang hemat biaya. Evaluasi awal telah menunjukkan bahwa Gemma 3 mengungguli pesaing seperti Llama-405B, DeepSeek-V3, dan o3-mini, yang mengakui rasio kinerja-terhadap-ukurannya yang unggul. Keluarga model ini memungkinkan pengembang untuk membuat aplikasi dengan kemampuan inferensi teks dan visual tingkat lanjut yang mampu menganalisis gambar, teks, dan video pendek. Selain itu, jendela konteks Gemma 3 yang besar dengan 128k token memungkinkannya untuk memproses informasi yang lebih luas, seperti keseluruhan novel, yang memungkinkan tugas AI yang lebih kompleks.

Gemma 3 dan Cloud Run bekerja sama untuk menghadirkan pengalaman inferensi tanpa server yang lancar. Cloud Run, platform tanpa server Google yang dikelola sepenuhnya oleh Google Cloud, memungkinkan developer memanfaatkan runtime kontainer tanpa repot mengelola infrastruktur. Pengaturan ini tidak hanya mengoptimalkan biaya dan performa dengan model zero-scaling selama tidak aktif dan melakukan penskalaan dinamis sesuai permintaan, tetapi juga memastikan developer hanya membayar sumber daya yang mereka gunakan. Dengan manfaat tambahan akselerasi GPU, layanan Cloud Run dapat menjalankan instans hanya dalam waktu lima detik dan memberikan hasil inferensi AI dalam waktu kurang dari 30 detik. Kemampuan penerapan cepat ini sangat penting untuk aplikasi yang memerlukan pengalaman pengguna yang responsif. Selain itu, biaya penggunaan GPU di Cloud Run telah dikurangi, yang selanjutnya mengoptimalkan efisiensi biaya penerapan model AI.

Sumber: Siaran pers

Bagikan artikel ini:

Tin tức mới nhất

Produsen Elektronik Gunakan Benang Digital untuk Penarikan Produk

17/3/25, 04.00

Ketika produsen elektronik besar mengalami masalah komponen kritis dengan produk yang baru diluncurkan, mereka memanfaatkan kerangka kerja digital thread

Baca lebih lanjut

Panduan Pemilihan Platform Magic Semi AI

17/3/25, 04.00

Magicemi (Lokasi kantor pusat) akan mengadakan webinar dengan topik "Bagaimana perusahaan harus menggunakan Generative AI) dan departemen IT dan Digital Transformation memilih platform AI?"

Baca lebih lanjut

Layanan dukungan agen AI "Caster NEO" diluncurkan

17/3/25, 04.00

Caster (Chiyoda-ku, Tokyo) akan mulai menawarkan layanan agensi produksi agen AI "CASTER NEO" mulai 13 Maret 2025.

Baca lebih lanjut

Fitur pengenalan pembicara ditambahkan ke notulen AI Nishikawa

17/3/25, 04.00

Nishika (Minato-ku, Tokyo) telah menambahkan fitur baru ke layanan menit AI-nya "SecureMemoCloud."

Baca lebih lanjut

Bagikan artikel ini:

Kategori

Peningkat Gambar AI

Pembuat kode AI

Manajemen tugas AI

Tanpa kode/kode rendah

Generator desain grafis AI

Generator seni/ilustrasi AI

Semua alat

Berita

AI dan hukum/peraturan/masyarakat

Perusahaan/produk/teknologi AI

AI Teknologi Besar

OpenAI/ChatGPT

AI generasi kreatif

AI generasi berbasis teks

AI generatif Jepang

Dasar-dasar AI generatif

Panduan penerapan AI terbaik

Profil perusahaan

Tentang kami

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Ikuti kami

Bahasa

Kategori

Semua alat

Manajemen tugas AI

Generator desain grafis AI

Tanpa kode/kode rendah

Pembuat kode AI

Peningkat Gambar AI

Pembuat Seni/Ilustrasi AI

AI dan hukum/sistem/ekonomi/masyarakat

Perusahaan/produk/teknologi AI

AI berteknologi besar

OpenAI/ChatGPT

AI generasi inovatif

AI generasi berbasis teks

AI inovatif Jepang

Dasar-dasar AI generatif

Petunjuk dasar aplikasi AI

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Berita terkini

Produsen Elektronik Gunakan Benang Digital untuk Penarikan Produk

17/3/25, 04.00

Ketika produsen elektronik besar mengalami masalah komponen kritis dengan produk yang baru diluncurkan, mereka memanfaatkan kerangka kerja digital thread

Baca lebih lanjut

Panduan Pemilihan Platform Magic Semi AI

17/3/25, 04.00

Magicemi (Lokasi kantor pusat) akan mengadakan webinar dengan topik "Bagaimana perusahaan harus menggunakan Generative AI) dan departemen IT dan Digital Transformation memilih platform AI?"

Baca lebih lanjut

Layanan dukungan agen AI "Caster NEO" diluncurkan

17/3/25, 04.00

Caster (Chiyoda-ku, Tokyo) akan mulai menawarkan layanan agensi produksi agen AI "CASTER NEO" mulai 13 Maret 2025.

Baca lebih lanjut

Fitur pengenalan pembicara ditambahkan ke notulen AI Nishikawa

17/3/25, 04.00

Nishika (Minato-ku, Tokyo) telah menambahkan fitur baru ke layanan menit AI-nya "SecureMemoCloud."

Baca lebih lanjut