top of page

Generatived(Beta)|生成AIの最新ニュースとトレンドを提供

logo.png

iAsk AI モデルが GPQA で人間や OpenAI を上回る

Generatived

24/10/30 4:30

iAsk は最近、同社の最新 AI モデルである iAsk Pro が、大学院レベルの Google 対応 Q&A ベンチマークで人間の専門家と OpenAI の o1 モデルの両方を上回り、新たなマイルストーンを達成したと発表しました。Z 世代のユーザー向けにカスタマイズされた AI 搭載の回答エンジンは、生物学、物理学、化学などの科目の複雑な質問に答える能力を評価するテストで 78.3% のスコアを獲得しました。このスコアは、OpenAI のモデルが達成した 77.3% を上回るだけでなく、人間の博士号取得者の平均スコアである 69.7% も上回っています。

同社の共同創設者兼 CEO である Dominik Mazur 氏は、世界中の知識を簡単にアクセスして理解できるようにするという同社の取り組みを強調しました。人間の専門知識を超える iAsk Pro の成功は、すべてのユーザーに直感的でアクセスしやすい洞察を提供するための一歩と見られています。 AI モデルは GPQA Diamond サブセットでテストされ、最も難しい質問に直面し、特に物理学において、さまざまな科学分野で一貫したパフォーマンスを示しました。

iAsk Pro の機能は GPQA ベンチマークを超えており、今年初めの Massive Multitask Language Understanding テストでも 93.9% のスコアで優れた成績を収めました。このテストでは、歴史や法律など、幅広い科目の知識を評価し、iAsk Pro の幅広い専門知識を披露しました。iAsk の共同創設者兼最高技術責任者である Brad Folkens 氏は、回答エンジンの精度と信頼性の重要性を強調し、iAsk Pro のベンチマーク パフォーマンスは、信頼できる知識を提供することへの献身を反映していると述べました。

高度な AI 検索エンジンで知られる iAsk では、ユーザーが自然言語で質問し、正確な回答を即座に受け取ることができます。このプラットフォームはトランスフォーマー ニューラル ネットワークを利用しており、さまざまな学術ベンチマークで優れた精度が認められ、他の AI モデルや検索エンジンを上回っています。詳細情報や iAsk 回答エンジンの体験については、iAsk の Web サイトをご覧ください。

この記事を共有:

最新のニュース
トリプルアイズ生成AI共創ウェビナー

トリプルアイズ生成AI共創ウェビナー

24/11/6 5:30

トリプルアイズ(東京都千代田区)が運営する「IT批評」は、12月4日に特別ウェビナーを開催する。

MONO-X AI特許出願と新サービス開始

MONO-X AI特許出願と新サービス開始

24/11/6 5:30

MONO-X(東京都港区)は、2024年11月5日に「MONO-X AI」の特許を出願し、IBM i(AS/400)導入企業向けにサービスを開始した。

Nishika新AI議事録自動作成機能

Nishika新AI議事録自動作成機能

24/11/6 5:30

Nishika(東京都港区)は、SecureMemoCloudに「ほぼ完議事録」という新機能を搭載した。

アスピレテック医療動画AI校正サービス

アスピレテック医療動画AI校正サービス

24/11/6 5:30

アスピレテック(東京都千代田区)は、医療業界向けに動画コンテンツの校正作業をAIで自動化する新サービス「校正君」を開始した。

Copyright © 2024 Generatived - All right Reserved.

この記事を共有:

この記事を共有:

Generatived

Generatived は、Generative AIに特化した情報やトレンドをお届けするサービスです。大きく変わりゆく世界の情報を全力でお届けします。

  • Facebook
  • X

フォローをお願いします

最新のニュース
トリプルアイズ生成AI共創ウェビナー

トリプルアイズ生成AI共創ウェビナー

24/11/6 5:30

トリプルアイズ(東京都千代田区)が運営する「IT批評」は、12月4日に特別ウェビナーを開催する。

MONO-X AI特許出願と新サービス開始

MONO-X AI特許出願と新サービス開始

24/11/6 5:30

MONO-X(東京都港区)は、2024年11月5日に「MONO-X AI」の特許を出願し、IBM i(AS/400)導入企業向けにサービスを開始した。

Nishika新AI議事録自動作成機能

Nishika新AI議事録自動作成機能

24/11/6 5:30

Nishika(東京都港区)は、SecureMemoCloudに「ほぼ完議事録」という新機能を搭載した。

アスピレテック医療動画AI校正サービス

アスピレテック医療動画AI校正サービス

24/11/6 5:30

アスピレテック(東京都千代田区)は、医療業界向けに動画コンテンツの校正作業をAIで自動化する新サービス「校正君」を開始した。

bottom of page