top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

Analisis data AIsmiley Peta kekacauan AI dirilis

Generatived

25/2/11 4:30

HackerRank telah meluncurkan ASTRABenchmark, alat terbarunya yang ditujukan untuk mengevaluasi kinerja model AI tingkat lanjut dalam tugas pengembangan perangkat lunak. Benchmark ini dirancang untuk menguji kemampuan AI dalam skenario pengodean dunia nyata menggunakan masalah berbasis proyek yang memiliki banyak berkas. Vivek Ravisankar, CEO HackerRank, menekankan pentingnya memahami gabungan kemampuan manusia dan AI dalam pengembangan perangkat lunak, dan percaya bahwa keahlian mereka di bidang ini menempatkan mereka pada posisi yang menguntungkan untuk mengevaluasi model AI.

ASTRABenchmark menyediakan evaluasi komprehensif model AI, yang menampilkan 65 masalah pengkodean berbasis proyek di 10 bidang keterampilan pengkodean utama. Setiap masalah berisi rata-rata 12 kode sumber dan berkas konfigurasi, dan rata-rata 61 baris kode solusi. Benchmark ini juga menyediakan penilaian terperinci tentang akurasi dan konsistensi model, menggunakan metrik seperti skor rata-rata dan deviasi standar median.

Hasil awal dari ASTRABenchmark menunjukkan bahwa model o1 OpenAI berkinerja lebih baik daripada model lainnya, dengan Claude- -3.5-sonnet menunjukkan hasil yang lebih konsisten. HackerRank membuka sumber acuan untuk mendorong komunitas AI menguji model dan berkontribusi pada kemajuan teknologi AI. Laporan dan analisis lengkap hasil acuan tersedia di situs web HackerRank.

HackerRank adalah pemimpin dalam bidang keterampilan pengembang, melayani lebih dari 2.500 klien dan memiliki komunitas lebih dari 25 juta pengembang. Perusahaan ini dikenal membantu perusahaan menetapkan strategi keterampilan mereka, mempromosikan merek mereka kepada pengembang, dan menerapkan proses perekrutan berbasis keterampilan menggunakan AI. Untuk informasi lebih lanjut tentang ASTRABenchmark, silakan hubungi kami melalui email kontak yang tersedia.

Bagikan artikel ini:

Tin tức mới nhất
Voicy memperkuat teknologi dengan menunjuk eksekutif baru

Voicy memperkuat teknologi dengan menunjuk eksekutif baru

25/2/17 4:30

Voicy (Shibuya-ku, Tokyo) mengumumkan bahwa Yamamoto Ryosuke telah ditunjuk sebagai VPoE dan Ishihara Naoki telah ditunjuk sebagai VPoP.

Otomasi AI konstruksi Ilgurum EC dimulai

Otomasi AI konstruksi Ilgurum EC dimulai

25/2/17 4:30

EC-CUBE (Kita-ku, Osaka), anak perusahaan konsolidasi Ilgurumu (Kita-ku, Osaka), mengumumkan bahwa mereka telah mulai membangun dan menerapkan "EC-CUBE EQ,"

Peringkat ke 7 dalam peringkat kepuasan kerja Grup Lima

Peringkat ke 7 dalam peringkat kepuasan kerja Grup Lima

25/2/17 4:30

Five Group (Kota Musashino, Tokyo) menempati peringkat ke-7 dalam peringkat "Perusahaan Terbaik untuk Bekerja" yang diumumkan oleh GPTW pada 13 Februari 2025.

Fraisly “1ROLL untuk Agentforce” diluncurkan

Fraisly “1ROLL untuk Agentforce” diluncurkan

25/2/17 4:30

Frey Three (Shinagawa-ku, Tokyo) telah memperbarui "1ROLL AI Agent" dan mulai menawarkan "1ROLL for Agentforce," yang bekerja bersama dengan "Agentforce" milik Salesforce.

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Voicy memperkuat teknologi dengan menunjuk eksekutif baru

Voicy memperkuat teknologi dengan menunjuk eksekutif baru

25/2/17 4:30

Voicy (Shibuya-ku, Tokyo) mengumumkan bahwa Yamamoto Ryosuke telah ditunjuk sebagai VPoE dan Ishihara Naoki telah ditunjuk sebagai VPoP.

Otomasi AI konstruksi Ilgurum EC dimulai

Otomasi AI konstruksi Ilgurum EC dimulai

25/2/17 4:30

EC-CUBE (Kita-ku, Osaka), anak perusahaan konsolidasi Ilgurumu (Kita-ku, Osaka), mengumumkan bahwa mereka telah mulai membangun dan menerapkan "EC-CUBE EQ,"

Peringkat ke 7 dalam peringkat kepuasan kerja Grup Lima

Peringkat ke 7 dalam peringkat kepuasan kerja Grup Lima

25/2/17 4:30

Five Group (Kota Musashino, Tokyo) menempati peringkat ke-7 dalam peringkat "Perusahaan Terbaik untuk Bekerja" yang diumumkan oleh GPTW pada 13 Februari 2025.

Fraisly “1ROLL untuk Agentforce” diluncurkan

Fraisly “1ROLL untuk Agentforce” diluncurkan

25/2/17 4:30

Frey Three (Shinagawa-ku, Tokyo) telah memperbarui "1ROLL AI Agent" dan mulai menawarkan "1ROLL for Agentforce," yang bekerja bersama dengan "Agentforce" milik Salesforce.

bottom of page