top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

Google Cloud mengumumkan penyempurnaan jaringan untuk AI

Generatived

24/6/18 5:18

Google Cloud secara aktif mengatasi tantangan spesifik jaringan yang dihadapi oleh perusahaan yang menerapkan model bahasa skala besar (LLM) untuk aplikasi AI generatif. Tidak seperti aplikasi web tradisional, yang memiliki pola lalu lintas yang dapat diprediksi, aplikasi AI generatif memiliki waktu permintaan/respons yang bervariasi dan dapat sepenuhnya menggunakan sumber daya GPU atau TPU, sehingga menghasilkan waktu pemrosesan yang lebih lama. Teknik manajemen lalu lintas tradisional tidak cukup untuk mengelola hal ini secara efektif.

Untuk memenuhi kebutuhan spesifik AI generatif, Google Cloud telah memperkenalkan beberapa fitur jaringan baru. Penyempurnaan ini dirancang untuk mengoptimalkan lalu lintas untuk aplikasi AI dan menggunakan sumber daya GPU dan TPU secara efisien untuk meningkatkan pengalaman pengguna akhir. Ketika inovasi seperti Vertex AI diintegrasikan ke dalam jaringan cloud, perusahaan dapat memanfaatkan kemajuan ini di berbagai platform LLM.

Salah satu layanan utamanya adalah jaringan lintas cloud yang memungkinkan transfer data berkecepatan tinggi antar cloud, yang penting untuk melatih model AI generatif. Jaringan ini memanfaatkan jaringan global Google untuk aplikasi terdistribusi guna menyediakan konektivitas yang andal, aman, dan didukung SLA. Selain itu, titik akhir model-as-a-service yang dikembangkan untuk mendukung aplikasi inferensi AI menyediakan konektivitas yang aman dan memungkinkan penemuan dan penggunaan kembali model AI.

Google Cloud juga memperkenalkan penyeimbangan beban khusus yang mendukung AI untuk meminimalkan latensi inferensi. Fitur baru ini memungkinkan Anda mendistribusikan lalu lintas berdasarkan metrik khusus seperti kedalaman antrean dan mempertahankan waktu respons yang konsisten. Selain itu, Google Cloud Networking menyertakan fitur bawaan yang membuat aplikasi AI generatif lebih andal dan efisien, seperti health check untuk penyeimbangan beban dan pemisahan lalu lintas berbobot untuk meningkatkan efektivitas model.

Ekstensi layanan Google Cloud Application Load Balancer kini tersedia secara umum, memungkinkan Anda mengintegrasikan solusi dan penyesuaian SaaS ke jalur data Anda. Hal ini meningkatkan pengalaman pengguna dengan memungkinkan permintaan diblokir dengan cepat dan dialihkan ke model backend yang paling sesuai.

Peningkatan jaringan oleh Google Cloud ini menunjukkan komitmennya dalam menyediakan solusi yang memungkinkan perusahaan memanfaatkan sepenuhnya kekuatan AI dan mengoptimalkan performa serta skalabilitas aplikasi AI generatif mereka. saus:

Bagikan artikel ini:

Berita terkini
NTT DATA Merilis Laporan Adopsi GenAI Global 2025

NTT DATA Merilis Laporan Adopsi GenAI Global 2025

24/11/15 4:30

NTT DATA telah merilis temuan dari survei komprehensif yang menunjukkan bahwa para pemimpin mengalihkan fokus dari tahap eksplorasi ke implementasi strategis Generative AI (GenAI)

Asia Foundation Mengumumkan Lokakarya Pengembangan Karier Wanita STEM

Asia Foundation Mengumumkan Lokakarya Pengembangan Karier Wanita STEM

24/11/15 4:30

Pada tanggal 21 November, acara daring yang disebut " STEM ConnectHER: Generative AI x Self x Career Workshop & STEM x Gender CAFE" akan diadakan untuk mendukung pengembangan karier mahasiswi di bidang STEM .

Accenture membuka pusat AI canggih di Kyoto

Accenture membuka pusat AI canggih di Kyoto

24/11/15 4:30

Accenture telah mengumumkan Pusat Kyoto untuk AI Tingkat Lanjut yang baru, sebuah fasilitas yang dirancang untuk membantu klien mengubah bisnis mereka menggunakan teknik AI tingkat lanjut, termasuk AI generatif.

Survei Intelijen Pendapatan Mengungkapkan Perbedaan dalam Evaluasi AI

Survei Intelijen Pendapatan Mengungkapkan Perbedaan dalam Evaluasi AI

24/11/15 4:30

Survei terkini oleh firma intelijen pendapatan terkemuka mengungkap perbedaan pendapat antara CIO dan pemimpin TI dalam hal mengevaluasi keberhasilan proyek AI.

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Ikuti kami

  • Facebook
  • X

Bahasa

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Generatived

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
NTT DATA Merilis Laporan Adopsi GenAI Global 2025

NTT DATA Merilis Laporan Adopsi GenAI Global 2025

24/11/15 4:30

NTT DATA telah merilis temuan dari survei komprehensif yang menunjukkan bahwa para pemimpin mengalihkan fokus dari tahap eksplorasi ke implementasi strategis Generative AI (GenAI)

Asia Foundation Mengumumkan Lokakarya Pengembangan Karier Wanita STEM

Asia Foundation Mengumumkan Lokakarya Pengembangan Karier Wanita STEM

24/11/15 4:30

Pada tanggal 21 November, acara daring yang disebut " STEM ConnectHER: Generative AI x Self x Career Workshop & STEM x Gender CAFE" akan diadakan untuk mendukung pengembangan karier mahasiswi di bidang STEM .

Accenture membuka pusat AI canggih di Kyoto

Accenture membuka pusat AI canggih di Kyoto

24/11/15 4:30

Accenture telah mengumumkan Pusat Kyoto untuk AI Tingkat Lanjut yang baru, sebuah fasilitas yang dirancang untuk membantu klien mengubah bisnis mereka menggunakan teknik AI tingkat lanjut, termasuk AI generatif.

Survei Intelijen Pendapatan Mengungkapkan Perbedaan dalam Evaluasi AI

Survei Intelijen Pendapatan Mengungkapkan Perbedaan dalam Evaluasi AI

24/11/15 4:30

Survei terkini oleh firma intelijen pendapatan terkemuka mengungkap perbedaan pendapat antara CIO dan pemimpin TI dalam hal mengevaluasi keberhasilan proyek AI.

bottom of page