Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
%20(1)%20(1).webp)
Peneliti Google mengungkap cara memangkas jaringan saraf secara efisien
Generatived
18/8/23, 10.01
Menurut Hussein Hazimeh, peneliti di tim Athena Google, dan Riade Benbaki, mahasiswa pascasarjana di MIT, kinerja jaringan saraf modern yang unggul sering kali mengorbankan sumber daya komputasi yang menuntut, yang dikatakan sulit untuk diperkenalkan. itu di lingkungan dengan batasan.
Untuk mengatasi masalah ini, Google memperkenalkan pendekatan CHITA (Combinatorial Hessian-free Iterative Thresholding Algorithm) untuk memangkas jaringan neural terlatih secara efisien tanpa mengurangi performa.
Penulis menjelaskan dalam makalah mereka bahwa pemangkasan melibatkan penghapusan bobot tertentu dari jaringan saraf untuk mengurangi kompleksitas komputasi sambil mempertahankan kegunaannya. CHITA menyediakan metode berbasis optimasi baru yang secara signifikan mengungguli pendekatan yang ada baik dari segi skalabilitas dan kinerja trade-off.
Pendekatan CHITA mencakup dua perbaikan penting:
Penggunaan informasi sekunder secara efisien: Metode tradisional sering kali mengandalkan matriks Hessian, yang secara komputasi mahal karena ukurannya yang besar. CHITA menggunakan informasi sekunder secara efisien tanpa secara eksplisit menghitung matriks Hessian, sehingga meningkatkan skalabilitas.
Pengoptimalan kombinatorial: Tidak seperti metode berbasis pengoptimalan tradisional yang memangkas bobot satu per satu, CHITA menggunakan pengoptimalan kombinatorial tingkat lanjut. Hal ini memastikan bahwa dampak pemangkasan satu beban pada beban lainnya diperhitungkan dan menghindari kemungkinan hilangnya beban penting.
Penulis mendeskripsikan formulasi CHITA yang menganggap pemangkasan sebagai masalah pemilihan subset terbaik, dengan tujuan mempertahankan bobot paling penting untuk meminimalkan kerugian. Dengan secara cerdik mengeksploitasi struktur peringkat rendah dari matriks informasi empiris Fisher, CHITA menggunakan informasi tersebut secara efektif sambil menghindari beban komputasi matriks Hessian.
Dalam hal skalabilitas dan akurasi, CHITA telah menunjukkan kemampuan unggulnya melalui eksperimen dengan berbagai arsitektur jaringan saraf. Misalnya, kami mendemonstrasikan percepatan lebih dari 1000x saat memangkas ResNet, dan akurasi pengujian kami mengungguli metode serupa di berbagai tingkat ketersebaran.
Bagikan artikel ini:
Tin tức mới nhất
Teknologi Bantuan Pegunungan Alpen untuk Tunanetra
11/4/25, 03.30
Alps Alpine (Tokyo) telah membentuk konsorsium dengan Omron (Kyoto), Shimizu Corporation (Tokyo), dan IBM Jepang (Tokyo) untuk mengembangkan teknologi dukungan mobilitas generasi berikutnya
CAPITA Mengumumkan Penguatan Kemitraan dengan Pembentukan Digital Transformation Informasi Keuangan
11/4/25, 03.30
CAPITA (lokasi kantor pusat tidak diketahui) mengoperasikan media informasi keuangan dan investasi "Capita Investment Navi"
Pengembangan LSI inferensi AI video 4K NTT
11/4/25, 03.30
NTT (Chiyoda-ku, Tokyo) telah mengembangkan LSI inferensi AI yang memungkinkan pemrosesan inferensi AI waktu nyata pada video 4K.
Copyright © 2024 Generatived - All right Reserved.
Bagikan artikel ini:
Bagikan artikel ini:
Kategori
Berita
AI dan hukum/peraturan/masyarakat
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Berita terkini
Teknologi Bantuan Pegunungan Alpen untuk Tunanetra
11/4/25, 03.30
Alps Alpine (Tokyo) telah membentuk konsorsium dengan Omron (Kyoto), Shimizu Corporation (Tokyo), dan IBM Jepang (Tokyo) untuk mengembangkan teknologi dukungan mobilitas generasi berikutnya
CAPITA Mengumumkan Penguatan Kemitraan dengan Pembentukan Digital Transformation Informasi Keuangan
11/4/25, 03.30
CAPITA (lokasi kantor pusat tidak diketahui) mengoperasikan media informasi keuangan dan investasi "Capita Investment Navi"
Pengembangan LSI inferensi AI video 4K NTT
11/4/25, 03.30
NTT (Chiyoda-ku, Tokyo) telah mengembangkan LSI inferensi AI yang memungkinkan pemrosesan inferensi AI waktu nyata pada video 4K.