Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
Pengecer Fortune 100 Mempercepat Pemrosesan Data JSON
Generatived
25/1/30 5:00
Pengecer Fortune 100 memanfaatkan format JSON dengan baik karena fleksibilitasnya dalam memproses informasi yang tidak terstruktur dan mengelola sejumlah besar data inventaris. Perusahaan menerapkan akselerasi GPU, yang secara signifikan meningkatkan efisiensi beban kerja pemrosesan datanya. Menjalankan beban kerja ini pada GPU secara drastis mengurangi waktu eksekusi dari 16,7 jam menjadi hanya 3,8 jam, menghasilkan pengurangan biaya sebesar 80% dibandingkan dengan menggunakan kluster CPU.
Kemajuan pemrosesan data pengecer dimungkinkan oleh penggunaan instans GCP n1-standard-16, yang masing-masing dilengkapi dengan GPU NVIDIA T4. Pengaturan ini terbukti efektif dalam menangani beban kerja Spark pengecer, yang melibatkan permintaan data JSON yang ekstensif, terkadang melebihi puluhan terabyte pada satu instans.
Tantangan dalam memproses data JSON pada GPU diatasi oleh RAPIDS Accelerator untuk Apache Spark, khususnya saat menggunakan fungsi get_json_object Spark untuk mengurai string JSON dalam kueri SQL . Meskipun ada tantangan awal karena ukuran string yang besar dan seringnya pemanggilan fungsi, kemampuan fungsi untuk mengekstrak objek dari rekaman JSON berdasarkan jalur yang ditentukan sangat penting bagi alur kerja ETL pengecer.
Serangkaian perbaikan strategis diterapkan untuk mengoptimalkan pemrosesan JSON pada GPU, khususnya untuk data yang jarang. Ini termasuk pengelompokan data serupa dalam warp untuk meminimalkan divergensi thread dan mengurutkan kueri untuk lebih mengurangi divergensi. Penggunaan tokenizer paralel data dalam pustaka RAPIDS cuDF juga berkontribusi pada peningkatan kinerja yang signifikan. Pengoptimalan ini menghasilkan percepatan 5,6x dalam waktu pemrosesan, dengan peningkatan lebih lanjut yang dijadwalkan akan dirilis akhir tahun ini. RAPIDS Accelerator untuk Apache Spark, bersama dengan cuDF, membantu meningkatkan pemrosesan data JSON oleh GPU, memberikan perusahaan peluang untuk memigrasikan beban kerja Spark yang ada ke GPU tanpa perubahan kode.
Bagikan artikel ini:
Berita terkini
Tren Penyimpanan Perusahaan Infinidat
25/1/30 5:00
Infinidat (Kantor pusat: ) telah mengumumkan tren saluran penyimpanan perusahaan untuk tahun 2025.
Sistem manajemen produksi NEC menempati posisi teratas
25/1/30 5:00
NEC (Minato-ku, Tokyo) mengumumkan bahwa sistem manajemen produksinya "EXPLANNER/J Series" telah mencapai pangsa pasar teratas dalam kategori manajemen produksi untuk bisnis menengah dan kecil dalam survei
Rekrutmen Tes Asisten AI PCA
25/1/30 5:00
PCA (Chiyoda-ku, Tokyo) sedang merekrut pengguna uji untuk "PCA AI Assistant (nama sementara)," yang memanfaatkan Generative AI.
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.
Profil perusahaan
Berita terkini
Tren Penyimpanan Perusahaan Infinidat
25/1/30 5:00
Infinidat (Kantor pusat: ) telah mengumumkan tren saluran penyimpanan perusahaan untuk tahun 2025.
Sistem manajemen produksi NEC menempati posisi teratas
25/1/30 5:00
NEC (Minato-ku, Tokyo) mengumumkan bahwa sistem manajemen produksinya "EXPLANNER/J Series" telah mencapai pangsa pasar teratas dalam kategori manajemen produksi untuk bisnis menengah dan kecil dalam survei
Rekrutmen Tes Asisten AI PCA
25/1/30 5:00
PCA (Chiyoda-ku, Tokyo) sedang merekrut pengguna uji untuk "PCA AI Assistant (nama sementara)," yang memanfaatkan Generative AI.