top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

Analisis data AIsmiley Peta kekacauan AI dirilis

Generatived

25/2/11 4:30

HackerRank telah meluncurkan ASTRABenchmark, alat terbarunya yang ditujukan untuk mengevaluasi kinerja model AI tingkat lanjut dalam tugas pengembangan perangkat lunak. Benchmark ini dirancang untuk menguji kemampuan AI dalam skenario pengodean dunia nyata menggunakan masalah berbasis proyek yang memiliki banyak berkas. Vivek Ravisankar, CEO HackerRank, menekankan pentingnya memahami gabungan kemampuan manusia dan AI dalam pengembangan perangkat lunak, dan percaya bahwa keahlian mereka di bidang ini menempatkan mereka pada posisi yang menguntungkan untuk mengevaluasi model AI.

ASTRABenchmark menyediakan evaluasi komprehensif model AI, yang menampilkan 65 masalah pengkodean berbasis proyek di 10 bidang keterampilan pengkodean utama. Setiap masalah berisi rata-rata 12 kode sumber dan berkas konfigurasi, dan rata-rata 61 baris kode solusi. Benchmark ini juga menyediakan penilaian terperinci tentang akurasi dan konsistensi model, menggunakan metrik seperti skor rata-rata dan deviasi standar median.

Hasil awal dari ASTRABenchmark menunjukkan bahwa model o1 OpenAI berkinerja lebih baik daripada model lainnya, dengan Claude- -3.5-sonnet menunjukkan hasil yang lebih konsisten. HackerRank membuka sumber acuan untuk mendorong komunitas AI menguji model dan berkontribusi pada kemajuan teknologi AI. Laporan dan analisis lengkap hasil acuan tersedia di situs web HackerRank.

HackerRank adalah pemimpin dalam bidang keterampilan pengembang, melayani lebih dari 2.500 klien dan memiliki komunitas lebih dari 25 juta pengembang. Perusahaan ini dikenal membantu perusahaan menetapkan strategi keterampilan mereka, mempromosikan merek mereka kepada pengembang, dan menerapkan proses perekrutan berbasis keterampilan menggunakan AI. Untuk informasi lebih lanjut tentang ASTRABenchmark, silakan hubungi kami melalui email kontak yang tersedia.

Bagikan artikel ini:

Tin tức mới nhất
KRAFTON Melaporkan Pertumbuhan Rekor, Memperluas IP PUBG Secara Global

KRAFTON Melaporkan Pertumbuhan Rekor, Memperluas IP PUBG Secara Global

25/2/12 5:45

NTT Data Group (Tokyo) melakukan survei terhadap 810 pengambil keputusan departemen TI di lembaga keuangan di 14 negara di seluruh dunia dan merilis laporan penelitian berjudul "Perbankan Cerdas di Era AI."

F5 Memperkenalkan ADC yang Disempurnakan untuk Aplikasi AI Modern

F5 Memperkenalkan ADC yang Disempurnakan untuk Aplikasi AI Modern

25/2/12 5:45

NTT DATA telah merilis laporan penelitian global baru yang menyelidiki adopsi Generative AI (GenAI) di industri perbankan.

HackerRank merilis ASTRABenchmark untuk mengevaluasi model AI

HackerRank merilis ASTRABenchmark untuk mengevaluasi model AI

25/2/12 5:45

TENHO (Shibuya-ku, Tokyo) telah mulai memberikan dukungan kepada pejabat kota di Omura, Prefektur Nagasaki, dengan mengajari mereka dasar-dasar Generative AI dan cara menggunakannya.

nCino Akuisisi Sandbox untuk Memperkuat Operasi Perbankan

nCino Akuisisi Sandbox untuk Memperkuat Operasi Perbankan

25/2/12 5:45

AI inside (Tokyo) mengumumkan telah membuat langkah besar dalam digitalisasi Nissan Motor melalui penerapan layanan AI-OCR "Digital Transformation Suite" di seluruh perusahaan.

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
KRAFTON Melaporkan Pertumbuhan Rekor, Memperluas IP PUBG Secara Global

KRAFTON Melaporkan Pertumbuhan Rekor, Memperluas IP PUBG Secara Global

25/2/12 5:45

NTT Data Group (Tokyo) melakukan survei terhadap 810 pengambil keputusan departemen TI di lembaga keuangan di 14 negara di seluruh dunia dan merilis laporan penelitian berjudul "Perbankan Cerdas di Era AI."

F5 Memperkenalkan ADC yang Disempurnakan untuk Aplikasi AI Modern

F5 Memperkenalkan ADC yang Disempurnakan untuk Aplikasi AI Modern

25/2/12 5:45

NTT DATA telah merilis laporan penelitian global baru yang menyelidiki adopsi Generative AI (GenAI) di industri perbankan.

HackerRank merilis ASTRABenchmark untuk mengevaluasi model AI

HackerRank merilis ASTRABenchmark untuk mengevaluasi model AI

25/2/12 5:45

TENHO (Shibuya-ku, Tokyo) telah mulai memberikan dukungan kepada pejabat kota di Omura, Prefektur Nagasaki, dengan mengajari mereka dasar-dasar Generative AI dan cara menggunakannya.

nCino Akuisisi Sandbox untuk Memperkuat Operasi Perbankan

nCino Akuisisi Sandbox untuk Memperkuat Operasi Perbankan

25/2/12 5:45

AI inside (Tokyo) mengumumkan telah membuat langkah besar dalam digitalisasi Nissan Motor melalui penerapan layanan AI-OCR "Digital Transformation Suite" di seluruh perusahaan.

bottom of page