top of page
Generatif (Beta) |. Memberikan berita dan tren terkini dalam AI generatif
logo.png

Analisis data AIsmiley Peta kekacauan AI dirilis

Generatived

25/2/11 4:30

HackerRank telah meluncurkan ASTRABenchmark, alat terbarunya yang ditujukan untuk mengevaluasi kinerja model AI tingkat lanjut dalam tugas pengembangan perangkat lunak. Benchmark ini dirancang untuk menguji kemampuan AI dalam skenario pengodean dunia nyata menggunakan masalah berbasis proyek yang memiliki banyak berkas. Vivek Ravisankar, CEO HackerRank, menekankan pentingnya memahami gabungan kemampuan manusia dan AI dalam pengembangan perangkat lunak, dan percaya bahwa keahlian mereka di bidang ini menempatkan mereka pada posisi yang menguntungkan untuk mengevaluasi model AI.

ASTRABenchmark menyediakan evaluasi komprehensif model AI, yang menampilkan 65 masalah pengkodean berbasis proyek di 10 bidang keterampilan pengkodean utama. Setiap masalah berisi rata-rata 12 kode sumber dan berkas konfigurasi, dan rata-rata 61 baris kode solusi. Benchmark ini juga menyediakan penilaian terperinci tentang akurasi dan konsistensi model, menggunakan metrik seperti skor rata-rata dan deviasi standar median.

Hasil awal dari ASTRABenchmark menunjukkan bahwa model o1 OpenAI berkinerja lebih baik daripada model lainnya, dengan Claude- -3.5-sonnet menunjukkan hasil yang lebih konsisten. HackerRank membuka sumber acuan untuk mendorong komunitas AI menguji model dan berkontribusi pada kemajuan teknologi AI. Laporan dan analisis lengkap hasil acuan tersedia di situs web HackerRank.

HackerRank adalah pemimpin dalam bidang keterampilan pengembang, melayani lebih dari 2.500 klien dan memiliki komunitas lebih dari 25 juta pengembang. Perusahaan ini dikenal membantu perusahaan menetapkan strategi keterampilan mereka, mempromosikan merek mereka kepada pengembang, dan menerapkan proses perekrutan berbasis keterampilan menggunakan AI. Untuk informasi lebih lanjut tentang ASTRABenchmark, silakan hubungi kami melalui email kontak yang tersedia.

Bagikan artikel ini:

Tin tức mới nhất
Check Point Memperkuat Keamanan Cloud Hibrida dengan Wiz

Check Point Memperkuat Keamanan Cloud Hibrida dengan Wiz

25/2/12 5:45

Exa Enterprise AI (Minato-ku, Tokyo) telah mulai menguji implementasi menggunakan agen AI otonom yang dioperasikan browser.

Cognyte Tech Merilis Analisis Investigasi Penegakan Hukum Global

Cognyte Tech Merilis Analisis Investigasi Penegakan Hukum Global

25/2/12 5:45

Schibsted Media Group telah bermitra dengan OpenAI untuk mengintegrasikan konten mereka yang tersedia untuk umum, yang dipilih dari surat kabar terkenal, ke dalam produk OpenAI, termasuk ChatGPT yang populer.

Aviz dan WWT Memperkenalkan Bantuan Jaringan Bertenaga AI

Aviz dan WWT Memperkenalkan Bantuan Jaringan Bertenaga AI

25/2/12 5:45

AISmiley (Shibuya-ku, Tokyo) akan mengadakan webinar pada tanggal 26 Februari dengan topik agen AI dan Digital Transformation pengembangan sumber daya manusia.

Sardine mengamankan $70 juta untuk memperluas manajemen risiko berbasis AI

Sardine mengamankan $70 juta untuk memperluas manajemen risiko berbasis AI

25/2/12 5:45

Untuk memperingati jumlah peserta "Pelatihan Peningkatan Keterampilan Generative AI " yang telah melampaui 100 orang, Crea Anabuki akan menyelenggarakan webinar bertajuk

Copyright © 2024 Generatived - All right Reserved.

Bagikan artikel ini:

Bagikan artikel ini:

Generatived

Hãy theo dõi chúng tôi

  • Facebook
  • X

Bahasa

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

Generatived AI Logo

Generatived adalah layanan yang memberikan informasi dan tren khusus dalam AI Generatif. Kami akan melakukan yang terbaik untuk menyampaikan informasi tentang dunia yang berubah dengan cepat.

  • Facebook
  • X

Ikuti kami

Bahasa

Berita terkini
Check Point Memperkuat Keamanan Cloud Hibrida dengan Wiz

Check Point Memperkuat Keamanan Cloud Hibrida dengan Wiz

25/2/12 5:45

Exa Enterprise AI (Minato-ku, Tokyo) telah mulai menguji implementasi menggunakan agen AI otonom yang dioperasikan browser.

Cognyte Tech Merilis Analisis Investigasi Penegakan Hukum Global

Cognyte Tech Merilis Analisis Investigasi Penegakan Hukum Global

25/2/12 5:45

Schibsted Media Group telah bermitra dengan OpenAI untuk mengintegrasikan konten mereka yang tersedia untuk umum, yang dipilih dari surat kabar terkenal, ke dalam produk OpenAI, termasuk ChatGPT yang populer.

Aviz dan WWT Memperkenalkan Bantuan Jaringan Bertenaga AI

Aviz dan WWT Memperkenalkan Bantuan Jaringan Bertenaga AI

25/2/12 5:45

AISmiley (Shibuya-ku, Tokyo) akan mengadakan webinar pada tanggal 26 Februari dengan topik agen AI dan Digital Transformation pengembangan sumber daya manusia.

Sardine mengamankan $70 juta untuk memperluas manajemen risiko berbasis AI

Sardine mengamankan $70 juta untuk memperluas manajemen risiko berbasis AI

25/2/12 5:45

Untuk memperingati jumlah peserta "Pelatihan Peningkatan Keterampilan Generative AI " yang telah melampaui 100 orang, Crea Anabuki akan menyelenggarakan webinar bertajuk

bottom of page