Model AI NVIDIA Mendukung Generasi Kernel GPU

Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

Model AI NVIDIA Mendukung Generasi Kernel GPU

Generatived

25/2/13 4:30

Untuk mengatasi tantangan pembuatan kernel perhatian GPU tanpa pemrograman eksplisit, teknisi NVIDIA melakukan eksperimen dengan model AI DeepSeek-R1 sumber terbuka. Dengan memanfaatkan daya komputasi tambahan selama fase inferensi, model tersebut mampu menghasilkan kernel yang, dalam beberapa kasus, mengungguli kernel yang dibuat oleh teknisi berpengalaman. Pendekatan ini, yang disebut penskalaan waktu pengujian, meningkatkan kinerja AI dengan mempertimbangkan beberapa hasil sebelum memilih yang paling efektif.

Konsep perhatian telah memainkan peran penting dalam kemajuan model bahasa skala besar (LLM), yang memungkinkan AI untuk fokus pada segmen data yang relevan guna meningkatkan prediksi dan menemukan pola tersembunyi. Namun, kompleksitas operasi perhatian bertambah seiring dengan panjangnya urutan input, yang memerlukan kernel GPU yang dioptimalkan demi efisiensi dan menghindari masalah waktu proses. Teknisi sering kali menggabungkan berbagai varian perhatian untuk menangani tugas tertentu, yang selanjutnya mempersulit pembuatan kernel yang dioptimalkan ini.

Untuk mengatasi kompleksitas ini, teknisi NVIDIA merancang alur kerja yang menggabungkan model DeepSeek-R1 dengan alat validasi yang berjalan pada GPU NVIDIA H100. Dimulai dengan perintah manual, sistem loop tertutup ini menyempurnakan kode GPU yang dihasilkan secara berulang. Proses 15 menit tersebut menghasilkan kernel yang benar secara numerik untuk semua masalah Level 1 dan 96% masalah Level 2, menurut tolok ukur KernelBench Universitas Stanford.

Hasil dari eksperimen kami menunjukkan bahwa memanfaatkan penskalaan waktu pengujian dapat secara signifikan meningkatkan pembuatan kernel GPU yang dioptimalkan. Kemampuan model DeepSeek-R1 untuk secara otomatis menghasilkan kernel perhatian yang efektif menunjukkan potensi area penelitian baru ini. Meskipun lebih banyak pekerjaan diperlukan untuk mencapai hasil yang baik secara konsisten pada rentang masalah yang lebih luas, hasil awal cukup menjanjikan. Pihak yang berminat dapat mempelajari lebih lanjut di layanan mikro NIM DeepSeek-R1.

Sumber: Blog Pengembang NVIDIA

Bagikan artikel ini:

Tin tức mới nhất

Kuliah Cyber AI: "Kreativitas Generative AI"

25/2/13 4:30

Produser Kenjiro Akai dari Cyber AI Productions (Shibuya-ku, Tokyo) dan insinyur Baison XR akan memberikan pidato di Adobe MAX Japan 2025 pada 13 Februari 2025.

Baca lebih lanjut

Sistem pendukung latihan piano MUSICLE AI

25/2/13 4:30

MUSICLE (Akasaka, Minato-ku, Tokyo) telah melewati tinjauan internal sebagai tema bisnis baru dari Honda, dan bertujuan untuk menjadi perusahaan independen pada tahun 2025.

Baca lebih lanjut

Pengumuman efektivitas konten diagnostik Catolce

25/2/13 4:30

Quatorce (Chuo-ku, Tokyo) menyediakan konten diagnostik di mana pengguna dapat memperoleh hasil dengan menjawab pertanyaan.

Baca lebih lanjut

Pelatihan TI/AI MJS untuk medis dan kesejahteraan

25/2/13 4:30

Miroku Information Services (Shinjuku-ku, Tokyo) menawarkan berbagai seminar yang diajarkan oleh para ahli di bidang keuangan dan manajemen.

Baca lebih lanjut

Bagikan artikel ini:

Kategori

Peningkat Gambar AI

Pembuat kode AI

Manajemen tugas AI

Tanpa kode/kode rendah

Generator desain grafis AI

Generator seni/ilustrasi AI

Semua alat

Berita

AI dan hukum/peraturan/masyarakat

Perusahaan/produk/teknologi AI

AI Teknologi Besar

OpenAI/ChatGPT

AI generasi kreatif

AI generasi berbasis teks

AI generatif Jepang

Dasar-dasar AI generatif

Panduan penerapan AI terbaik

Profil perusahaan

Tentang kami

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Ikuti kami

Bahasa

Kategori

Semua alat

Manajemen tugas AI

Generator desain grafis AI

Tanpa kode/kode rendah

Pembuat kode AI

Peningkat Gambar AI

Pembuat Seni/Ilustrasi AI

AI dan hukum/sistem/ekonomi/masyarakat

Perusahaan/produk/teknologi AI

AI berteknologi besar

OpenAI/ChatGPT

AI generasi inovatif

AI generasi berbasis teks

AI inovatif Jepang

Dasar-dasar AI generatif

Petunjuk dasar aplikasi AI

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Berita terkini

Kuliah Cyber AI: "Kreativitas Generative AI"

25/2/13 4:30

Produser Kenjiro Akai dari Cyber AI Productions (Shibuya-ku, Tokyo) dan insinyur Baison XR akan memberikan pidato di Adobe MAX Japan 2025 pada 13 Februari 2025.

Baca lebih lanjut

Sistem pendukung latihan piano MUSICLE AI

25/2/13 4:30

MUSICLE (Akasaka, Minato-ku, Tokyo) telah melewati tinjauan internal sebagai tema bisnis baru dari Honda, dan bertujuan untuk menjadi perusahaan independen pada tahun 2025.

Baca lebih lanjut

Pengumuman efektivitas konten diagnostik Catolce

25/2/13 4:30

Quatorce (Chuo-ku, Tokyo) menyediakan konten diagnostik di mana pengguna dapat memperoleh hasil dengan menjawab pertanyaan.

Baca lebih lanjut

Pelatihan TI/AI MJS untuk medis dan kesejahteraan

25/2/13 4:30

Miroku Information Services (Shinjuku-ku, Tokyo) menawarkan berbagai seminar yang diajarkan oleh para ahli di bidang keuangan dan manajemen.

Baca lebih lanjut