Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

Google Cloud meluncurkan model AI Gemma 3
Generatived
13/3/25, 04.30
Peluncuran Gemma 3 menandai kemajuan besar dalam bidang AI, yang menyediakan serangkaian model yang mengutamakan kecepatan dan portabilitas bagi para pengembang. Model-model ini dirancang untuk memudahkan pembuatan aplikasi AI canggih dalam skala besar. Saat diintegrasikan dengan Cloud Run, pengembang dapat dengan mudah menerapkan beban kerja tanpa server yang menggabungkan model AI, sehingga meningkatkan efisiensi dan pengalaman pengguna.
Gemma 3 menonjol karena kinerjanya yang unggul dan menawarkan jejak memori yang lebih kecil yang ideal untuk beban kerja inferensi yang hemat biaya. Evaluasi awal telah menunjukkan bahwa Gemma 3 mengungguli pesaing seperti Llama-405B, DeepSeek-V3, dan o3-mini, yang mengakui rasio kinerja-terhadap-ukurannya yang unggul. Keluarga model ini memungkinkan pengembang untuk membuat aplikasi dengan kemampuan inferensi teks dan visual tingkat lanjut yang mampu menganalisis gambar, teks, dan video pendek. Selain itu, jendela konteks Gemma 3 yang besar dengan 128k token memungkinkannya untuk memproses informasi yang lebih luas, seperti keseluruhan novel, yang memungkinkan tugas AI yang lebih kompleks.
Gemma 3 dan Cloud Run bekerja sama untuk menghadirkan pengalaman inferensi tanpa server yang lancar. Cloud Run, platform tanpa server Google yang dikelola sepenuhnya oleh Google Cloud, memungkinkan developer memanfaatkan runtime kontainer tanpa repot mengelola infrastruktur. Pengaturan ini tidak hanya mengoptimalkan biaya dan performa dengan model zero-scaling selama tidak aktif dan melakukan penskalaan dinamis sesuai permintaan, tetapi juga memastikan developer hanya membayar sumber daya yang mereka gunakan. Dengan manfaat tambahan akselerasi GPU, layanan Cloud Run dapat menjalankan instans hanya dalam waktu lima detik dan memberikan hasil inferensi AI dalam waktu kurang dari 30 detik. Kemampuan penerapan cepat ini sangat penting untuk aplikasi yang memerlukan pengalaman pengguna yang responsif. Selain itu, biaya penggunaan GPU di Cloud Run telah dikurangi, yang selanjutnya mengoptimalkan efisiensi biaya penerapan model AI.
Bagikan artikel ini:
Tin tức mới nhất
Cyver Core GenAI Meningkatkan Efisiensi untuk Tim Keamanan Siber
18/3/25, 04.30
Cyver Core mengumumkan keberhasilan implementasi GenAI, produk Generative AI , yang telah meningkatkan efisiensi tim keamanan siber secara signifikan sejak diluncurkan pada tahun 2024.
Ethical Web AI Mengumumkan Peluncuran AI Vault
18/3/25, 04.30
Ethical Web AI telah mengumumkan AI Vault, solusi perangkat lunak-sebagai-layanan (SaaS) keamanan perusahaan baru yang didukung oleh AI generatif.
Gradial mengamankan $13 juta untuk memperluas pemasaran AI
18/3/25, 04.30
Startup AI yang berbasis di Seattle, Gradial, baru-baru ini mengumumkan telah mendapatkan pendanaan Seri A sebesar $13 juta, mencapai tonggak keuangan yang signifikan.
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
Cyver Core GenAI Meningkatkan Efisiensi untuk Tim Keamanan Siber
18/3/25, 04.30
Cyver Core mengumumkan keberhasilan implementasi GenAI, produk Generative AI , yang telah meningkatkan efisiensi tim keamanan siber secara signifikan sejak diluncurkan pada tahun 2024.
Ethical Web AI Mengumumkan Peluncuran AI Vault
18/3/25, 04.30
Ethical Web AI telah mengumumkan AI Vault, solusi perangkat lunak-sebagai-layanan (SaaS) keamanan perusahaan baru yang didukung oleh AI generatif.
Gradial mengamankan $13 juta untuk memperluas pemasaran AI
18/3/25, 04.30
Startup AI yang berbasis di Seattle, Gradial, baru-baru ini mengumumkan telah mendapatkan pendanaan Seri A sebesar $13 juta, mencapai tonggak keuangan yang signifikan.