Generatived(Beta)|生成AIの最新ニュースとトレンドを提供
![](https://static.wixstatic.com/media/2b1e48_72281c4d6b7842048463f67ffa7e9819~mv2.webp/v1/fill/w_980,h_613,al_c,q_85,usm_0.66_1.00_0.01,enc_avif,quality_auto/11%20(3)%20(1).webp)
AIsmileyデータ分析AIカオスマップ公開
Generatived
25/2/11 4:30
HackerRank は、ソフトウェア開発タスクにおける高度な AI モデルのパフォーマンスを評価することを目的とした最新ツール、ASTRABenchmarkを発表しました。このベンチマークは、複数のファイル、プロジェクトベースの問題を使用して、実際のコーディング シナリオで AI 機能をテストするように設計されています。HackerRank の CEO である Vivek Ravisankar 氏は、ソフトウェア開発における人間と AI の複合的な能力を理解することの重要性を強調し、この分野における専門知識により、AI モデルを評価する上で有利な立場に立つことができると考えています。
ASTRABenchmarkは、 10 の主要なコーディング スキル領域にわたる 65 のプロジェクトベースのコーディング問題を特徴とする、AI モデルの包括的な評価を提供します。問題ごとに平均 12 個のソース コードと構成ファイル、平均 61 行のソリューション コードが含まれます。ベンチマークでは、平均スコアや中央標準偏差などの指標を使用して、モデルの正確性と一貫性の詳細な評価も提供します。
ASTRABenchmarkの初期結果では、OpenAI の o1 モデルが他のモデルよりも優れたパフォーマンスを示し、Claude- -3.5-sonnet はより一貫した結果を示しました。HackerRank はベンチマークをオープンソース化し、AI コミュニティがモデルをテストして AI 技術の進歩に貢献することを奨励しています。ベンチマーク結果の完全なレポートと分析は、HackerRank の Web サイトで入手できます。
HackerRank は開発者スキル分野のリーダーであり、2,500 社を超える顧客にサービスを提供しており、2,500 万人を超える開発者のコミュニティを擁しています。同社は、AI を活用した企業のスキル戦略の確立、開発者へのブランド宣伝、スキルベースの採用プロセスの実装を支援していることで知られています。ASTRABenchmarkの詳細については、提供されている連絡先eメールまでお問い合わせください。
最新のニュース
東洋経済新報社「 シン読解力」発売
25/2/12 5:45
カオナビ(東京都渋谷区)は、タレントマネジメントシステム「カオナビ」内の「プロファイルブック」に、生成AIを用いた要約機能を追加すると発表した。
ナレッジセンスChatGPT対応o3-mini
25/2/12 5:45
トランスコスモス(東京)は2月20日、オンラインセミナー「DX推進と業務最適化を加速するヘルプデスクPKSHA AI ヘルプデスクとBPOサービスの融合」を開催する。
Copyright © 2024 Generatived - All right Reserved.
ニュース
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
東洋経済新報社「シン読解力」発売
25/2/12 5:45
カオナビ(東京都渋谷区)は、タレントマネジメントシステム「カオナビ」内の「プロファイルブック」に、生成AIを用いた要約機能を追加すると発表した。
ナレッジセンスChatGPT対応o3-mini
25/2/12 5:45
トランスコスモス(東京)は2月20日、オンラインセミナー「DX推進と業務最適化を加速するヘルプデスクPKSHA AI ヘルプデスクとBPOサービスの融合」を開催する。