top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

MangoBoost Mengumumkan Mango LLMBoost untuk Efisiensi AI

Generatived

25/1/17 4:30

MangoBoost telah mengumumkan Mango LLMBoost™, perangkat lunak pengoptimalan sistem baru yang ditujukan untuk meningkatkan kinerja pusat data AI. Perangkat lunak ini menjanjikan peningkatan efisiensi inferensi AI secara signifikan, dengan peningkatan kinerja hingga 12,6x dan pengurangan biaya 92% dibandingkan dengan mesin inferensi LLM pesaing. Mango LLMBoost™ memanfaatkan teknik canggih seperti penjadwalan sistem, pengoptimalan kernel, dan mekanisme prapengambilan unik untuk mengoptimalkan penggunaan GPU dengan memanfaatkan kuantisasi model.

Perusahaan telah menyediakan Mango LLMBoost™ di AWS Marketplace, dengan rencana untuk menyediakannya bagi layanan cloud lain dan penerapan di lokasi. Perangkat lunak ini mendukung berbagai GPU dari NVIDIA dan AMD dan dapat mengelola beberapa model AI, termasuk Llama dan Gemma, pada satu server. Mango LLMBoost™ menyederhanakan penerapan dengan API web dan API streaming, dan secara otomatis mengonfigurasi pengaturan kinerja optimal untuk perangkat keras dan model tertentu.

CEO MangoBoost Jangwoo Kim menyoroti komitmen perusahaan untuk meningkatkan kinerja dan efisiensi di tingkat sistem. Mango LLMBoost™ merupakan bukti komitmen ini, yang dibangun berdasarkan keahlian DPU MangoBoost untuk mengoptimalkan komponen perangkat keras dan perangkat lunak. Inovasi ini membantu perusahaan mewujudkan potensi penuh infrastruktur AI mereka.

Mereka yang tertarik dengan Mango LLMBoost™ dapat mengetahui informasi selengkapnya di halaman web produk. Didirikan pada tahun 2022, MangoBoost didukung oleh pendanaan lebih dari $60 juta dan tim yang terdiri dari lebih dari 100 pakar, termasuk banyak pemegang gelar PhD, dan dengan cepat menjadi terkenal di bidang efisiensi pusat data AI. Inti dari solusinya, teknologi DPU milik perusahaan dilindungi oleh lebih dari 30 paten dan dirancang untuk bekerja dengan lancar dengan berbagai produk GPU dan penyimpanan.

Bagikan artikel ini:

Berita terkini
Google Cloud Umumkan Trillium TPU, VM A3 Ultra

Google Cloud Umumkan Trillium TPU, VM A3 Ultra

25/1/17 4:30

Akhir tahun 2024 menyaksikan pengumuman serangkaian kemajuan dalam infrastruktur AI, termasuk peluncuran Trillium, TPU generasi keenam, dan VM A3 Ultra dengan GPU NVIDIA H200.

Microsoft mengumumkan peran AI dalam upaya keberlanjutan global

Microsoft mengumumkan peran AI dalam upaya keberlanjutan global

25/1/17 4:30

Microsoft baru-baru ini menerbitkan makalah komprehensif berjudul, "Mempercepat Keberlanjutan dengan AI: Berinovasi untuk Future yang Lebih Baik."

Berkeley Lab mengembangkan AI untuk menemukan sumur terlantar

Berkeley Lab mengembangkan AI untuk menemukan sumur terlantar

25/1/17 4:30

Para peneliti di Lawrence Berkeley National Laboratory telah mengembangkan model AI untuk menemukan sumur minyak yatim piatu yang tidak tercatat (UOW) di seluruh Amerika Serikat.

iGenius Mengembangkan AI dengan Model Colosseum 355B

iGenius Mengembangkan AI dengan Model Colosseum 355B

25/1/17 4:30

Perusahaan teknologi AI Italia iGenius membuat langkah besar dalam meningkatkan model bahasa berskala besar (LLM) untuk domain yang sangat diatur.

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Ikuti kami

  • Facebook
  • X

Bahasa

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Google Cloud Umumkan Trillium TPU, VM A3 Ultra

Google Cloud Umumkan Trillium TPU, VM A3 Ultra

25/1/17 4:30

Akhir tahun 2024 menyaksikan pengumuman serangkaian kemajuan dalam infrastruktur AI, termasuk peluncuran Trillium, TPU generasi keenam, dan VM A3 Ultra dengan GPU NVIDIA H200.

Microsoft mengumumkan peran AI dalam upaya keberlanjutan global

Microsoft mengumumkan peran AI dalam upaya keberlanjutan global

25/1/17 4:30

Microsoft baru-baru ini menerbitkan makalah komprehensif berjudul, "Mempercepat Keberlanjutan dengan AI: Berinovasi untuk Future yang Lebih Baik."

Berkeley Lab mengembangkan AI untuk menemukan sumur terlantar

Berkeley Lab mengembangkan AI untuk menemukan sumur terlantar

25/1/17 4:30

Para peneliti di Lawrence Berkeley National Laboratory telah mengembangkan model AI untuk menemukan sumur minyak yatim piatu yang tidak tercatat (UOW) di seluruh Amerika Serikat.

iGenius Mengembangkan AI dengan Model Colosseum 355B

iGenius Mengembangkan AI dengan Model Colosseum 355B

25/1/17 4:30

Perusahaan teknologi AI Italia iGenius membuat langkah besar dalam meningkatkan model bahasa berskala besar (LLM) untuk domain yang sangat diatur.

bottom of page