Generatived(Beta)|生成AIの最新ニュースとトレンドを提供
![](https://static.wixstatic.com/media/2b1e48_72281c4d6b7842048463f67ffa7e9819~mv2.webp/v1/fill/w_980,h_613,al_c,q_85,usm_0.66_1.00_0.01,enc_avif,quality_auto/11%20(3)%20(1).webp)
AIsmileyデータ分析AIカオスマップ公開
Generatived
25/2/11 4:30
HackerRank は、ソフトウェア開発タスクにおける高度な AI モデルのパフォーマンスを評価することを目的とした最新ツール、ASTRABenchmarkを発表しました。このベンチマークは、複数のファイル、プロジェクトベースの問題を使用して、実際のコーディング シナリオで AI 機能をテストするように設計されています。HackerRank の CEO である Vivek Ravisankar 氏は、ソフトウェア開発における人間と AI の複合的な能力を理解することの重要性を強調し、この分野における専門知識により、AI モデルを評価する上で有利な立場に立つことができると考えています。
ASTRABenchmarkは、 10 の主要なコーディング スキル領域にわたる 65 のプロジェクトベースのコーディング問題を特徴とする、AI モデルの包括的な評価を提供します。問題ごとに平均 12 個のソース コードと構成ファイル、平均 61 行のソリューション コードが含まれます。ベンチマークでは、平均スコアや中央標準偏差などの指標を使用して、モデルの正確性と一貫性の詳細な評価も提供します。
ASTRABenchmarkの初期結果では、OpenAI の o1 モデルが他のモデルよりも優れたパフォーマンスを示し、Claude- -3.5-sonnet はより一貫した結果を示しました。HackerRank はベンチマークをオープンソース化し、AI コミュニティがモデルをテストして AI 技術の進歩に貢献することを奨励しています。ベンチマーク結果の完全なレポートと分析は、HackerRank の Web サイトで入手できます。
HackerRank は開発者スキル分野のリーダーであり、2,500 社を超える顧客にサービスを提供しており、2,500 万人を超える開発者のコミュニティを擁しています。同社は、AI を活用した企業のスキル戦略の確立、開発者へのブランド宣伝、スキルベースの採用プロセスの実装を支援していることで知られています。ASTRABenchmarkの詳細については、提供されている連絡先eメールまでお問い合わせください。
最新のニュース
MLCommons が AILuminate AI 安全Benchmarkを強化
25/2/12 5:45
マジセミ(東京都)は、社内情報の分散とナレッジ属人化が業務効率を低下させる問題に対処するためのウェビナーを開催する。
Antler日本支援プログラム7社出資
25/2/12 5:45
SORACOM は、生成AIとIoT (GenAIoT) に関する包括的な業界分析に基づき、Frost & Sullivan による「2025 テクノロジー イノベーション リーダーシップ アワード」を受賞しました。
Copyright © 2024 Generatived - All right Reserved.
ニュース
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
MLCommons が AILuminate AI 安全Benchmarkを強化
25/2/12 5:45
マジセミ(東京都)は、社内情報の分散とナレッジ属人化が業務効率を低下させる問題に対処するためのウェビナーを開催する。
Antler日本支援プログラム7社出資
25/2/12 5:45
SORACOM は、生成AIとIoT (GenAIoT) に関する包括的な業界分析に基づき、Frost & Sullivan による「2025 テクノロジー イノベーション リーダーシップ アワード」を受賞しました。