Analisis data AIsmiley Peta kekacauan AI dirilis 4/3178

Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif

Analisis data AIsmiley Peta kekacauan AI dirilis

Generatived

25/2/11 4:30

HackerRank telah meluncurkan ASTRABenchmark, alat terbarunya yang ditujukan untuk mengevaluasi kinerja model AI tingkat lanjut dalam tugas pengembangan perangkat lunak. Benchmark ini dirancang untuk menguji kemampuan AI dalam skenario pengodean dunia nyata menggunakan masalah berbasis proyek yang memiliki banyak berkas. Vivek Ravisankar, CEO HackerRank, menekankan pentingnya memahami gabungan kemampuan manusia dan AI dalam pengembangan perangkat lunak, dan percaya bahwa keahlian mereka di bidang ini menempatkan mereka pada posisi yang menguntungkan untuk mengevaluasi model AI.

ASTRABenchmark menyediakan evaluasi komprehensif model AI, yang menampilkan 65 masalah pengkodean berbasis proyek di 10 bidang keterampilan pengkodean utama. Setiap masalah berisi rata-rata 12 kode sumber dan berkas konfigurasi, dan rata-rata 61 baris kode solusi. Benchmark ini juga menyediakan penilaian terperinci tentang akurasi dan konsistensi model, menggunakan metrik seperti skor rata-rata dan deviasi standar median.

Hasil awal dari ASTRABenchmark menunjukkan bahwa model o1 OpenAI berkinerja lebih baik daripada model lainnya, dengan Claude- -3.5-sonnet menunjukkan hasil yang lebih konsisten. HackerRank membuka sumber acuan untuk mendorong komunitas AI menguji model dan berkontribusi pada kemajuan teknologi AI. Laporan dan analisis lengkap hasil acuan tersedia di situs web HackerRank.

HackerRank adalah pemimpin dalam bidang keterampilan pengembang, melayani lebih dari 2.500 klien dan memiliki komunitas lebih dari 25 juta pengembang. Perusahaan ini dikenal membantu perusahaan menetapkan strategi keterampilan mereka, mempromosikan merek mereka kepada pengembang, dan menerapkan proses perekrutan berbasis keterampilan menggunakan AI. Untuk informasi lebih lanjut tentang ASTRABenchmark, silakan hubungi kami melalui email kontak yang tersedia.

Sumber: Siaran pers

Bagikan artikel ini:

Tin tức mới nhất

Check Point Memperkuat Keamanan Cloud Hibrida dengan Wiz

25/2/12 5:45

Exa Enterprise AI (Minato-ku, Tokyo) telah mulai menguji implementasi menggunakan agen AI otonom yang dioperasikan browser.

Baca lebih lanjut

Cognyte Tech Merilis Analisis Investigasi Penegakan Hukum Global

25/2/12 5:45

Schibsted Media Group telah bermitra dengan OpenAI untuk mengintegrasikan konten mereka yang tersedia untuk umum, yang dipilih dari surat kabar terkenal, ke dalam produk OpenAI, termasuk ChatGPT yang populer.

Baca lebih lanjut

Aviz dan WWT Memperkenalkan Bantuan Jaringan Bertenaga AI

25/2/12 5:45

AISmiley (Shibuya-ku, Tokyo) akan mengadakan webinar pada tanggal 26 Februari dengan topik agen AI dan Digital Transformation pengembangan sumber daya manusia.

Baca lebih lanjut

Sardine mengamankan $70 juta untuk memperluas manajemen risiko berbasis AI

25/2/12 5:45

Untuk memperingati jumlah peserta "Pelatihan Peningkatan Keterampilan Generative AI " yang telah melampaui 100 orang, Crea Anabuki akan menyelenggarakan webinar bertajuk

Baca lebih lanjut

Bagikan artikel ini:

Kategori

Peningkat Gambar AI

Pembuat kode AI

Manajemen tugas AI

Tanpa kode/kode rendah

Generator desain grafis AI

Generator seni/ilustrasi AI

Semua alat

Berita

AI dan hukum/peraturan/masyarakat

Perusahaan/produk/teknologi AI

AI Teknologi Besar

OpenAI/ChatGPT

AI generasi kreatif

AI generasi berbasis teks

AI generatif Jepang

Dasar-dasar AI generatif

Panduan penerapan AI terbaik

Profil perusahaan

Tentang kami

Chính sách quyền riêng tư

Điều khoản sử dụng trang web

Công ty điều hành

Hãy theo dõi chúng tôi

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

Ikuti kami

Bahasa

Kategori

Semua alat

Manajemen tugas AI

Generator desain grafis AI

Tanpa kode/kode rendah

Pembuat kode AI

Peningkat Gambar AI

Pembuat Seni/Ilustrasi AI

AI dan hukum/sistem/ekonomi/masyarakat

Perusahaan/produk/teknologi AI

AI berteknologi besar

OpenAI/ChatGPT

AI generasi inovatif

AI generasi berbasis teks

AI inovatif Jepang

Dasar-dasar AI generatif

Petunjuk dasar aplikasi AI

Tin tức

Giới thiệu về chúng tôi

Chính sách quyền riêng tư

Điều khoản sử dụng của trang web

Công ty điều hành

Hồ sơ công ty

Berita terkini

Check Point Memperkuat Keamanan Cloud Hibrida dengan Wiz

25/2/12 5:45

Exa Enterprise AI (Minato-ku, Tokyo) telah mulai menguji implementasi menggunakan agen AI otonom yang dioperasikan browser.

Baca lebih lanjut

Cognyte Tech Merilis Analisis Investigasi Penegakan Hukum Global

25/2/12 5:45

Schibsted Media Group telah bermitra dengan OpenAI untuk mengintegrasikan konten mereka yang tersedia untuk umum, yang dipilih dari surat kabar terkenal, ke dalam produk OpenAI, termasuk ChatGPT yang populer.

Baca lebih lanjut

Aviz dan WWT Memperkenalkan Bantuan Jaringan Bertenaga AI

25/2/12 5:45

AISmiley (Shibuya-ku, Tokyo) akan mengadakan webinar pada tanggal 26 Februari dengan topik agen AI dan Digital Transformation pengembangan sumber daya manusia.

Baca lebih lanjut

Sardine mengamankan $70 juta untuk memperluas manajemen risiko berbasis AI

25/2/12 5:45

Untuk memperingati jumlah peserta "Pelatihan Peningkatan Keterampilan Generative AI " yang telah melampaui 100 orang, Crea Anabuki akan menyelenggarakan webinar bertajuk

Baca lebih lanjut