top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

Analisis data AIsmiley Peta kekacauan AI dirilis

Generatived

25/2/11 4:30

HackerRank telah meluncurkan ASTRABenchmark, alat terbarunya yang ditujukan untuk mengevaluasi kinerja model AI tingkat lanjut dalam tugas pengembangan perangkat lunak. Benchmark ini dirancang untuk menguji kemampuan AI dalam skenario pengodean dunia nyata menggunakan masalah berbasis proyek yang memiliki banyak berkas. Vivek Ravisankar, CEO HackerRank, menekankan pentingnya memahami gabungan kemampuan manusia dan AI dalam pengembangan perangkat lunak, dan percaya bahwa keahlian mereka di bidang ini menempatkan mereka pada posisi yang menguntungkan untuk mengevaluasi model AI.

ASTRABenchmark menyediakan evaluasi komprehensif model AI, yang menampilkan 65 masalah pengkodean berbasis proyek di 10 bidang keterampilan pengkodean utama. Setiap masalah berisi rata-rata 12 kode sumber dan berkas konfigurasi, dan rata-rata 61 baris kode solusi. Benchmark ini juga menyediakan penilaian terperinci tentang akurasi dan konsistensi model, menggunakan metrik seperti skor rata-rata dan deviasi standar median.

Hasil awal dari ASTRABenchmark menunjukkan bahwa model o1 OpenAI berkinerja lebih baik daripada model lainnya, dengan Claude- -3.5-sonnet menunjukkan hasil yang lebih konsisten. HackerRank membuka sumber acuan untuk mendorong komunitas AI menguji model dan berkontribusi pada kemajuan teknologi AI. Laporan dan analisis lengkap hasil acuan tersedia di situs web HackerRank.

HackerRank adalah pemimpin dalam bidang keterampilan pengembang, melayani lebih dari 2.500 klien dan memiliki komunitas lebih dari 25 juta pengembang. Perusahaan ini dikenal membantu perusahaan menetapkan strategi keterampilan mereka, mempromosikan merek mereka kepada pengembang, dan menerapkan proses perekrutan berbasis keterampilan menggunakan AI. Untuk informasi lebih lanjut tentang ASTRABenchmark, silakan hubungi kami melalui email kontak yang tersedia.

Bagikan artikel ini:

Tin tức mới nhất
Sev1Tech Luncurkan Platform Digital Twin AI Vertasyn

Sev1Tech Luncurkan Platform Digital Twin AI Vertasyn

25/2/12 5:45

Datumix (Toshima-ku, Tokyo) mengumumkan bahwa "Level Planner" yang mendukung Digital Transformation logistik telah dipilih untuk "Seleksi Batch 16 Rantai Pasokan".

Stellar Meraih Status Cloud Data AI Microsoft

Stellar Meraih Status Cloud Data AI Microsoft

25/2/12 5:45

XServer (Kita-ku, Osaka) secara signifikan meningkatkan spesifikasi "XServer VPS" pada tanggal 3 Februari 2025.

Fairmarkit meluncurkan integrasi dengan Coupa Spend Management

Fairmarkit meluncurkan integrasi dengan Coupa Spend Management

25/2/12 5:45

Optex (Chuo-ku, Osaka) akan membuka pusat data jenis kontainer pertama Kansai Electric Power Group di Mihama-cho, Prefektur Fukui selama tahun fiskal 2026.

Fivetran membuka kantor pusat baru di Bangalore untuk memperluas bisnis

Fivetran membuka kantor pusat baru di Bangalore untuk memperluas bisnis

25/2/12 5:45

LAS VEGAS, 10 Februari 2025 – Pando, pemimpin dalam AI logistik, telah meluncurkan AI Teams for Logistics, serangkaian agen AI yang ditujukan untuk mengotomatiskan proses logistik utama bagi merek global.

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Sev1Tech Luncurkan Platform Digital Twin AI Vertasyn

Sev1Tech Luncurkan Platform Digital Twin AI Vertasyn

25/2/12 5:45

Datumix (Toshima-ku, Tokyo) mengumumkan bahwa "Level Planner" yang mendukung Digital Transformation logistik telah dipilih untuk "Seleksi Batch 16 Rantai Pasokan".

Stellar Meraih Status Cloud Data AI Microsoft

Stellar Meraih Status Cloud Data AI Microsoft

25/2/12 5:45

XServer (Kita-ku, Osaka) secara signifikan meningkatkan spesifikasi "XServer VPS" pada tanggal 3 Februari 2025.

Fairmarkit meluncurkan integrasi dengan Coupa Spend Management

Fairmarkit meluncurkan integrasi dengan Coupa Spend Management

25/2/12 5:45

Optex (Chuo-ku, Osaka) akan membuka pusat data jenis kontainer pertama Kansai Electric Power Group di Mihama-cho, Prefektur Fukui selama tahun fiskal 2026.

Fivetran membuka kantor pusat baru di Bangalore untuk memperluas bisnis

Fivetran membuka kantor pusat baru di Bangalore untuk memperluas bisnis

25/2/12 5:45

LAS VEGAS, 10 Februari 2025 – Pando, pemimpin dalam AI logistik, telah meluncurkan AI Teams for Logistics, serangkaian agen AI yang ditujukan untuk mengotomatiskan proses logistik utama bagi merek global.

bottom of page