Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
Groq kembali memecahkan rekor kinerja LLM dengan sistem LPU™
Generatived
23/8/31 17:00
Groq, penyedia solusi AI, mengumumkan peningkatan signifikan dalam kinerja inferensi untuk model bahasa skala besar (LLM), Llama-2 70B. Hanya dalam tiga minggu, perusahaan mampu mencapai kinerja lebih dari dua kali lipat, berjalan pada lebih dari 240 token per detik (T/s) per pengguna pada sistem LPU™. Pencapaian ini terjadi setelah Groq mencapai 100T/s per pengguna untuk pertama kalinya dengan Llama-2 70B, menimbulkan pertanyaan tentang potensi peningkatan kinerja lebih lanjut pada silikon 14nm generasi pertama yang diproduksi di AS.
Pelanggan Groq menerbitkan demo pribadi, membuka dunia baru kemungkinan kasus penggunaan LLM latensi rendah di industri masing-masing. Misalnya, LLM dapat digunakan untuk memantau data tekstual dalam jumlah besar dari forum online dan media sosial untuk mendeteksi potensi serangan siber dan pelanggaran keamanan dengan cepat. Latensi yang sangat rendah pada model-model ini sangat penting untuk analisis dan respons real-time, yang memainkan peran penting dalam melindungi informasi sensitif, infrastruktur penting, dan keamanan nasional.
LLM juga berpotensi merevolusi tanggap darurat lokal saat terjadi bencana alam. Dengan menganalisis data real-time dari media sosial, panggilan darurat, dan prakiraan cuaca, model-model ini mengidentifikasi daerah-daerah yang sangat membutuhkan bantuan, memprediksi ancaman, dan memberikan informasi akurat kepada petugas pertolongan pertama dan masyarakat yang terkena dampak. dapat memberikan bimbingan.
Bagikan artikel ini:
Berita terkini
Red Hat Akuisisi Neural Magic untuk Tingkatkan Kinerja AI
24/11/13 4:30
Red Hat, Inc. telah menandatangani perjanjian definitif untuk mengakuisisi Neural Magic, sebuah perusahaan yang mengkhususkan diri dalam perangkat lunak yang meningkatkan kinerja beban kerja inferensi AI generatif.
Red Hat Mengumumkan OpenShift 4.17 dan Pratinjau Lightspeed
24/11/13 4:30
Pada acara KubeCon + CloudNativeCon NA di Salt Lake City, Red Hat Inc. mengumumkan fitur dan penyempurnaan baru untuk Red Hat OpenShift, platform aplikasi cloud hibrid bertenaga Kubernetes.
Red Hat OpenShift AI 2.15 Mendukung Enterprise Hybrid Cloud
24/11/13 4:30
Red Hat hari ini mengumumkan Red Hat OpenShift AI 2.15, versi terbaru platform AI dan ML yang dirancang untuk membantu perusahaan meningkatkan skala aplikasi berkemampuan AI di seluruh cloud hybrid.
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.
Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.
Profil perusahaan
Berita terkini
Red Hat Akuisisi Neural Magic untuk Tingkatkan Kinerja AI
24/11/13 4:30
Red Hat, Inc. telah menandatangani perjanjian definitif untuk mengakuisisi Neural Magic, sebuah perusahaan yang mengkhususkan diri dalam perangkat lunak yang meningkatkan kinerja beban kerja inferensi AI generatif.
Red Hat Mengumumkan OpenShift 4.17 dan Pratinjau Lightspeed
24/11/13 4:30
Pada acara KubeCon + CloudNativeCon NA di Salt Lake City, Red Hat Inc. mengumumkan fitur dan penyempurnaan baru untuk Red Hat OpenShift, platform aplikasi cloud hibrid bertenaga Kubernetes.
Red Hat OpenShift AI 2.15 Mendukung Enterprise Hybrid Cloud
24/11/13 4:30
Red Hat hari ini mengumumkan Red Hat OpenShift AI 2.15, versi terbaru platform AI dan ML yang dirancang untuk membantu perusahaan meningkatkan skala aplikasi berkemampuan AI di seluruh cloud hybrid.