top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

Phân tích dữ liệu AIsmiley Bản đồ hỗn loạn AI được phát hành

Generatived

25/2/11 4:30

HackerRank đã ra mắt ASTRABenchmark, công cụ mới nhất của họ nhằm mục đích đánh giá hiệu suất của các mô hình AI tiên tiến trong các tác vụ phát triển phần mềm. Điểm chuẩn được thiết kế để kiểm tra khả năng AI trong các tình huống mã hóa thực tế bằng cách sử dụng các vấn đề dựa trên dự án, nhiều tệp. Vivek Ravisankar, CEO của HackerRank, nhấn mạnh tầm quan trọng của việc hiểu được khả năng kết hợp của con người và AI trong phát triển phần mềm và tin rằng chuyên môn của họ trong lĩnh vực này giúp họ có lợi thế để đánh giá các mô hình AI.

ASTRABenchmark cung cấp đánh giá toàn diện về các mô hình AI, bao gồm 65 bài toán mã hóa dựa trên dự án trên 10 lĩnh vực kỹ năng mã hóa chính. Mỗi bài toán chứa trung bình 12 mã nguồn và tệp cấu hình, và trung bình 61 dòng mã giải pháp. Điểm chuẩn này cũng cung cấp đánh giá chi tiết về độ chính xác và tính nhất quán của mô hình, sử dụng các số liệu như điểm trung bình và độ lệch chuẩn trung vị.

Kết quả ban đầu từ ASTRABenchmark cho thấy mô hình o1 của OpenAI hoạt động tốt hơn các mô hình khác, trong đó Claude- -3.5-sonnet cho kết quả nhất quán hơn. HackerRank mở mã nguồn chuẩn để khuyến khích cộng đồng AI thử nghiệm các mô hình và đóng góp vào sự tiến bộ của công nghệ AI. Báo cáo và phân tích đầy đủ về kết quả chuẩn có sẵn trên trang web HackerRank.

HackerRank là công ty dẫn đầu trong lĩnh vực kỹ năng dành cho nhà phát triển, phục vụ hơn 2.500 khách hàng và có cộng đồng hơn 25 triệu nhà phát triển. Công ty này nổi tiếng với việc giúp các công ty thiết lập chiến lược kỹ năng, quảng bá thương hiệu của họ tới các nhà phát triển và triển khai quy trình tuyển dụng dựa trên kỹ năng bằng AI. Để biết thêm thông tin về ASTRABenchmark, vui lòng liên hệ với chúng tôi qua email liên hệ được cung cấp.

Chia sẻ bài viết này:

Tin tức mới nhất
Forrester dự đoán chi tiêu công nghệ toàn cầu sẽ tăng mạnh vào năm 2025

Forrester dự đoán chi tiêu công nghệ toàn cầu sẽ tăng mạnh vào năm 2025

25/2/13 4:30

Forrester dự đoán chi tiêu cho công nghệ toàn cầu sẽ tăng trưởng đáng kể, đạt 4,9 nghìn tỷ đô la vào năm 2025.

Glean ra mắt chương trình đối tác để tăng cường bảo mật AI

Glean ra mắt chương trình đối tác để tăng cường bảo mật AI

25/2/13 4:30

Glean đã công bố Chương trình Đối tác Quản trị và Bảo mật Mở, hợp tác với các nhà lãnh đạo trong ngành để tăng cường bảo mật dữ liệu doanh nghiệp và AI.

Phenom mở rộng danh sách diễn giả cho Hội nghị IAMPHENOM 2025

Phenom mở rộng danh sách diễn giả cho Hội nghị IAMPHENOM 2025

25/2/13 4:30

Phenom, một công ty về nguồn nhân lực tập trung vào AI, gần đây đã công bố việc mở rộng đáng kể danh sách diễn giả cho hội nghị IAMPHENOM 2025 bằng cách bổ sung thêm 42 diễn giả mới cho sự kiện.

Deepgram ra mắt Nova-3 với khả năng chuyển đổi giọng nói thành văn bản được cải tiến

Deepgram ra mắt Nova-3 với khả năng chuyển đổi giọng nói thành văn bản được cải tiến

25/2/13 4:30

Deepgram đã ra mắt Nova-3, mô hình chuyển giọng nói thành văn bản mới nhất được thiết kế để cải thiện độ chính xác của bản ghi trong môi trường âm thanh phức tạp.

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived AI Logo

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Forrester dự đoán chi tiêu công nghệ toàn cầu sẽ tăng mạnh vào năm 2025

Forrester dự đoán chi tiêu công nghệ toàn cầu sẽ tăng mạnh vào năm 2025

25/2/13 4:30

Forrester dự đoán chi tiêu cho công nghệ toàn cầu sẽ tăng trưởng đáng kể, đạt 4,9 nghìn tỷ đô la vào năm 2025.

Glean ra mắt chương trình đối tác để tăng cường bảo mật AI

Glean ra mắt chương trình đối tác để tăng cường bảo mật AI

25/2/13 4:30

Glean đã công bố Chương trình Đối tác Quản trị và Bảo mật Mở, hợp tác với các nhà lãnh đạo trong ngành để tăng cường bảo mật dữ liệu doanh nghiệp và AI.

Phenom mở rộng danh sách diễn giả cho Hội nghị IAMPHENOM 2025

Phenom mở rộng danh sách diễn giả cho Hội nghị IAMPHENOM 2025

25/2/13 4:30

Phenom, một công ty về nguồn nhân lực tập trung vào AI, gần đây đã công bố việc mở rộng đáng kể danh sách diễn giả cho hội nghị IAMPHENOM 2025 bằng cách bổ sung thêm 42 diễn giả mới cho sự kiện.

Deepgram ra mắt Nova-3 với khả năng chuyển đổi giọng nói thành văn bản được cải tiến

Deepgram ra mắt Nova-3 với khả năng chuyển đổi giọng nói thành văn bản được cải tiến

25/2/13 4:30

Deepgram đã ra mắt Nova-3, mô hình chuyển giọng nói thành văn bản mới nhất được thiết kế để cải thiện độ chính xác của bản ghi trong môi trường âm thanh phức tạp.

bottom of page