Generatived(Beta)|生成AIの最新ニュースとトレンドを提供
iAsk AI モデルが GPQA で人間や OpenAI を上回る
Generatived
24/10/30 4:30
iAsk は最近、同社の最新 AI モデルである iAsk Pro が、大学院レベルの Google 対応 Q&A ベンチマークで人間の専門家と OpenAI の o1 モデルの両方を上回り、新たなマイルストーンを達成したと発表しました。Z 世代のユーザー向けにカスタマイズされた AI 搭載の回答エンジンは、生物学、物理学、化学などの科目の複雑な質問に答える能力を評価するテストで 78.3% のスコアを獲得しました。このスコアは、OpenAI のモデルが達成した 77.3% を上回るだけでなく、人間の博士号取得者の平均スコアである 69.7% も上回っています。
同社の共同創設者兼 CEO である Dominik Mazur 氏は、世界中の知識を簡単にアクセスして理解できるようにするという同社の取り組みを強調しました。人間の専門知識を超える iAsk Pro の成功は、すべてのユーザーに直感的でアクセスしやすい洞察を提供するための一歩と見られています。 AI モデルは GPQA Diamond サブセットでテストされ、最も難しい質問に直面し、特に物理学において、さまざまな科学分野で一貫したパフォーマンスを示しました。
iAsk Pro の機能は GPQA ベンチマークを超えており、今年初めの Massive Multitask Language Understanding テストでも 93.9% のスコアで優れた成績を収めました。このテストでは、歴史や法律など、幅広い科目の知識を評価し、iAsk Pro の幅広い専門知識を披露しました。iAsk の共同創設者兼最高技術責任者である Brad Folkens 氏は、回答エンジンの精度と信頼性の重要性を強調し、iAsk Pro のベンチマーク パフォーマンスは、信頼できる知識を提供することへの献身を反映していると述べました。
高度な AI 検索エンジンで知られる iAsk では、ユーザーが自然言語で質問し、正確な回答を即座に受け取ることができます。このプラットフォームはトランスフォーマー ニューラル ネットワークを利用しており、さまざまな学術ベンチマークで優れた精度が認められ、他の AI モデルや検索エンジンを上回っています。詳細情報や iAsk 回答エンジンの体験については、iAsk の Web サイトをご覧ください。
最新のニュース
Broadcom VeloCloud新機能とTitan
24/11/6 5:30
Broadcom(NASDAQ:AVGO)は、AIと非AIワークロードの連携を強化するため、VeloCloud製品ポートフォリオの機能強化と新パートナープログラム「Titan」を発表。
Polimill自治体向けAIツール特集
24/11/6 5:30
Polimill(東京都)は、自治体職員向けに開発した業務支援AI「QommonsAI」を全国の情報サイト「ジチタイワークス」で特集した。
Copyright © 2024 Generatived - All right Reserved.
ニュース
AIと法律/制度/経済/社会
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。
最新のニュース
Broadcom VeloCloud新機能とTitan
24/11/6 5:30
Broadcom(NASDAQ:AVGO)は、AIと非AIワークロードの連携を強化するため、VeloCloud製品ポートフォリオの機能強化と新パートナープログラム「Titan」を発表。
Polimill自治体向けAIツール特集
24/11/6 5:30
Polimill(東京都)は、自治体職員向けに開発した業務支援AI「QommonsAI」を全国の情報サイト「ジチタイワークス」で特集した。