top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

Analisis data AIsmiley Peta kekacauan AI dirilis

Generatived

25/2/11 4:30

HackerRank telah meluncurkan ASTRABenchmark, alat terbarunya yang ditujukan untuk mengevaluasi kinerja model AI tingkat lanjut dalam tugas pengembangan perangkat lunak. Benchmark ini dirancang untuk menguji kemampuan AI dalam skenario pengodean dunia nyata menggunakan masalah berbasis proyek yang memiliki banyak berkas. Vivek Ravisankar, CEO HackerRank, menekankan pentingnya memahami gabungan kemampuan manusia dan AI dalam pengembangan perangkat lunak, dan percaya bahwa keahlian mereka di bidang ini menempatkan mereka pada posisi yang menguntungkan untuk mengevaluasi model AI.

ASTRABenchmark menyediakan evaluasi komprehensif model AI, yang menampilkan 65 masalah pengkodean berbasis proyek di 10 bidang keterampilan pengkodean utama. Setiap masalah berisi rata-rata 12 kode sumber dan berkas konfigurasi, dan rata-rata 61 baris kode solusi. Benchmark ini juga menyediakan penilaian terperinci tentang akurasi dan konsistensi model, menggunakan metrik seperti skor rata-rata dan deviasi standar median.

Hasil awal dari ASTRABenchmark menunjukkan bahwa model o1 OpenAI berkinerja lebih baik daripada model lainnya, dengan Claude- -3.5-sonnet menunjukkan hasil yang lebih konsisten. HackerRank membuka sumber acuan untuk mendorong komunitas AI menguji model dan berkontribusi pada kemajuan teknologi AI. Laporan dan analisis lengkap hasil acuan tersedia di situs web HackerRank.

HackerRank adalah pemimpin dalam bidang keterampilan pengembang, melayani lebih dari 2.500 klien dan memiliki komunitas lebih dari 25 juta pengembang. Perusahaan ini dikenal membantu perusahaan menetapkan strategi keterampilan mereka, mempromosikan merek mereka kepada pengembang, dan menerapkan proses perekrutan berbasis keterampilan menggunakan AI. Untuk informasi lebih lanjut tentang ASTRABenchmark, silakan hubungi kami melalui email kontak yang tersedia.

Bagikan artikel ini:

Tin tức mới nhất
Konferensi Dovetail Insight Out Kembali ke San Francisco

Konferensi Dovetail Insight Out Kembali ke San Francisco

25/2/13 4:30

Dovetail telah mengumumkan bahwa konferensi andalannya, Insight Out, akan berlangsung pada 23-24 April 2025 di Fort Mason di San Francisco.

Enfabrica membuka pusat R&D AI di Hyderabad, India

Enfabrica membuka pusat R&D AI di Hyderabad, India

25/2/13 4:30

Enfabrica Corporation baru-baru ini membuka fasilitas R&D baru di Hyderabad, India.

Experian bekerja sama dengan ValidMind untuk memperkuat compliance keuangan

Experian bekerja sama dengan ValidMind untuk memperkuat compliance keuangan

25/2/13 4:30

Experian telah membentuk kemitraan strategis dengan ValidMind untuk meningkatkan cara lembaga keuangan menangani compliance peraturan dan manajemen risiko.

Fal Mengamankan $49 Juta untuk Memperluas Platform Media AI

Fal Mengamankan $49 Juta untuk Memperluas Platform Media AI

25/2/13 4:30

fal, platform infrastruktur terkemuka untuk produksi media berbasis AI, telah berhasil mengumpulkan $49 juta dalam putaran pendanaan Seri B.

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Konferensi Dovetail Insight Out Kembali ke San Francisco

Konferensi Dovetail Insight Out Kembali ke San Francisco

25/2/13 4:30

Dovetail telah mengumumkan bahwa konferensi andalannya, Insight Out, akan berlangsung pada 23-24 April 2025 di Fort Mason di San Francisco.

Enfabrica membuka pusat R&D AI di Hyderabad, India

Enfabrica membuka pusat R&D AI di Hyderabad, India

25/2/13 4:30

Enfabrica Corporation baru-baru ini membuka fasilitas R&D baru di Hyderabad, India.

Experian bekerja sama dengan ValidMind untuk memperkuat compliance keuangan

Experian bekerja sama dengan ValidMind untuk memperkuat compliance keuangan

25/2/13 4:30

Experian telah membentuk kemitraan strategis dengan ValidMind untuk meningkatkan cara lembaga keuangan menangani compliance peraturan dan manajemen risiko.

Fal Mengamankan $49 Juta untuk Memperluas Platform Media AI

Fal Mengamankan $49 Juta untuk Memperluas Platform Media AI

25/2/13 4:30

fal, platform infrastruktur terkemuka untuk produksi media berbasis AI, telah berhasil mengumpulkan $49 juta dalam putaran pendanaan Seri B.

bottom of page