Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo
“Gorilla” dựa trên LLaMA cho phép bạn viết lệnh gọi API chính xác hơn GPT
Theo bài báo của Gorilla, trí tuệ nhân tạo (AI) tiếp tục phát triển và các mô hình ngôn ngữ quy mô lớn (LLM) đang đạt được những tiến bộ đáng kể trong nhiều nhiệm vụ khác nhau. Tuy nhiên, hiệu quả của nó trong việc sử dụng các công cụ thông qua lệnh gọi API (Giao diện lập trình ứng dụng) là một vấn đề. Các LLM tiên tiến như GPT-4 thường gặp khó khăn trong việc tạo ra các đối số đầu vào chính xác và thường trả lời các lệnh gọi API được viết không chính xác như thể chúng đúng.
Để giải quyết vấn đề này, các nhà nghiên cứu tại UC Berkeley và Microsoft Research đã giới thiệu Gorilla, một mô hình dựa trên LLaMA được tinh chỉnh nhằm tạo ra các lệnh gọi API với độ chính xác cao hơn GPT-4. Gorilla cải thiện khả năng của LLM trong việc tận dụng hiệu quả các công cụ bên ngoài và chọn API phù hợp cho một nhiệm vụ cụ thể.
Kết hợp với trình truy xuất tài liệu, Gorilla rất dễ thích ứng với những thay đổi của tài liệu trong quá trình dùng thử. Điều này cho phép người dùng phản hồi linh hoạt trước các bản cập nhật và thay đổi phiên bản, tăng tính thực tế. Ngoài ra, Gorilla còn giảm đáng kể các vấn đề ảo giác thường gặp khi trực tiếp nhắc nhở LLM. Bằng cách tạo các lệnh gọi API một cách chính xác, nó mang lại sự đảm bảo cao hơn GPT-4 rằng công cụ này đang được sử dụng đúng cách.
Để đánh giá khả năng của Gorilla, các nhà nghiên cứu đã giới thiệu APIBench, một bộ dữ liệu toàn diện về các API phổ biến như HuggingFace, TorchHub và TensorHub. Việc tích hợp hệ thống tìm kiếm với Gorilla cho thấy tiềm năng LLM sử dụng các công cụ chính xác hơn đồng thời cập nhật tài liệu được cập nhật thường xuyên.
Nhóm nghiên cứu đang xuất bản mã, mô hình, dữ liệu và bản trình diễn Gorilla trên GitHub để khuyến khích cộng tác và khám phá hơn nữa trong lĩnh vực AI và NLP. Bằng cách mở các tài nguyên này, chúng tôi khuyến khích các nhà nghiên cứu và nhà phát triển khám phá những khả năng mới dựa trên nền tảng của Gorilla.
Các mô hình ngôn ngữ quy mô lớn đã cách mạng hóa nhiều khía cạnh của AI, từ tóm tắt văn bản đến dịch ngôn ngữ. Tuy nhiên, có những hạn chế khi sử dụng các công cụ sử dụng lệnh gọi API và tiềm năng của chúng chưa được phát huy hết. Với Gorilla, các nhà nghiên cứu của UC Berkeley đã thực hiện một bước quan trọng trong việc phá bỏ những rào cản này.
Chia sẻ bài viết này:
Tin tức mới nhất
Giới thiệu về công nghệ nông nghiệp thực phẩm UnlocX CES
24/12/26 4:30
UnlocX (Tokyo) sẽ tổ chức "Báo cáo và chương trình công nghệ nông nghiệp - thực phẩm CES2025" để giới thiệu các xu hướng công nghệ nông nghiệp - thực phẩm tại CES.
Phân tích biên bản cuộc họp của nhà đầu tư Exa Enterprise AI
24/12/26 4:30
Exa Enterprise AI (Minato-ku, Tokyo) đã triển khai chức năng phân tích tự động biên bản cuộc họp của nhà đầu tư bằng cách sử dụng tác nhân AI vào "Trợ lý IR exaBase".
Hội thảo AI của Viện nghiên cứu hệ thống xã hội mới được tổ chức
24/12/26 4:30
Viện nghiên cứu hệ thống xã hội mới (Minato-ku, Tokyo) sẽ tổ chức hội thảo về việc sử dụng Generative AI.
Copyright © 2024 Generatived - All right Reserved.
Chia sẻ bài viết này:
Chia sẻ bài viết này:
Danh mục
Tin tức
AI và luật/hệ thống/kinh tế/xã hội
Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.
Tin tức mới nhất
Giới thiệu về công nghệ nông nghiệp thực phẩm UnlocX CES
24/12/26 4:30
UnlocX (Tokyo) sẽ tổ chức "Báo cáo và chương trình công nghệ nông nghiệp - thực phẩm CES2025" để giới thiệu các xu hướng công nghệ nông nghiệp - thực phẩm tại CES.
Phân tích biên bản cuộc họp của nhà đầu tư Exa Enterprise AI
24/12/26 4:30
Exa Enterprise AI (Minato-ku, Tokyo) đã triển khai chức năng phân tích tự động biên bản cuộc họp của nhà đầu tư bằng cách sử dụng tác nhân AI vào "Trợ lý IR exaBase".
Hội thảo AI của Viện nghiên cứu hệ thống xã hội mới được tổ chức
24/12/26 4:30
Viện nghiên cứu hệ thống xã hội mới (Minato-ku, Tokyo) sẽ tổ chức hội thảo về việc sử dụng Generative AI.