top of page

Generatived (Beta) | Cung cấp tin tức và xu hướng mới nhất về AI sáng tạo

logo.png

Viettel Solutions tăng cường AI cho người Việt Nam

Generatived

24/11/20 4:30

Viettel Solutions đã có những đóng góp đáng kể vào việc nâng cao khả năng AI cho tiếng Việt với NVIDIA NeMo Curator. Công cụ này đã giúp tạo ra các tập dữ liệu chất lượng cao để đào tạo Llama 3 cho ViettelSolution 8B, một mô hình ngôn ngữ tiên tiến. Bằng cách biên tập một tập dữ liệu mở rộng, Viettel Solutions đã cải thiện độ chính xác của mô hình, giảm thời gian đào tạo và giảm đáng kể kích thước của tập dữ liệu.

Quá trình bắt đầu bằng việc thu thập nhiều dữ liệu văn bản tiếng Việt từ nhiều nguồn, bao gồm dữ liệu thu thập trên web và Wikipedia. Sau đó, dữ liệu này được chuẩn hóa và định dạng để đảm bảo tính nhất quán. Viettel Solutions đã tinh chỉnh tập dữ liệu bằng nhiều kỹ thuật biên tập dữ liệu khác nhau, bao gồm định dạng lại Unicode và loại bỏ trùng lặp chính xác. Các bước này rất quan trọng để đảm bảo tính duy nhất và chất lượng của dữ liệu đào tạo.

Để cải thiện hơn nữa chất lượng của tập dữ liệu, các phương pháp lọc dựa trên phương pháp tìm kiếm và phân loại cũng đã được áp dụng. Các bộ lọc này giúp loại bỏ nội dung chất lượng thấp và tinh chỉnh dữ liệu dựa trên các mẫu phức tạp có thể bị bỏ qua bởi các quy tắc đơn giản. Kết quả là một tập dữ liệu có độ dài văn bản và số lượng mã thông báo phân bổ đều hơn, với việc giảm đáng kể các giá trị ngoại lai và dữ liệu nhiễu.

Những nỗ lực của Viettel Solutions không chỉ cải thiện hiệu suất mô hình ngôn ngữ mà còn duy trì tính đa dạng của tập dữ liệu, điều này rất cần thiết để xây dựng các mô hình ngôn ngữ đa năng, có mục đích chung. Sự hợp tác của công ty với NVIDIA và việc sử dụng NeMo Curator chứng minh tiềm năng của AI trong việc đáp ứng nhu cầu ngôn ngữ cụ thể của các quốc gia không nói tiếng Anh và đảm bảo trải nghiệm khách hàng toàn diện và có tác động hơn.

Chia sẻ bài viết này:

Tin tức mới nhất
Adkaru Hayabusa SEO/SEM PV tích lũy vượt quá 1 triệu

Adkaru Hayabusa SEO/SEM PV tích lũy vượt quá 1 triệu

24/11/20 4:30

Adcal (Kikugawa, Sumida-ku, Tokyo) thông báo rằng dịch vụ viết bài SEO/SEM của công ty, Hayabusa SEO/SEM, đã ghi nhận tổng số lượt xem trang là 1 triệu.

RX Japan Triển lãm trí tuệ nhân tạo AI lần thứ 5 vào mùa thu

RX Japan Triển lãm trí tuệ nhân tạo AI lần thứ 5 vào mùa thu

24/11/20 4:30

RX Japan (Chuo-ku, Tokyo) sẽ tổ chức Triển lãm AI/Trí tuệ nhân tạo lần thứ 5 [Mùa thu] tại Makuhari Messe trong ba ngày từ ngày 20 đến 22 tháng 11 năm 2024.

EAGLYS AI giúp các công ty tận dụng kiến thức của họ

EAGLYS AI giúp các công ty tận dụng kiến thức của họ

24/11/20 4:30

EAGLYS (Shibuya-ku, Tokyo) đã bắt đầu cung cấp "Dòng sản phẩm AI khai thác", một giải pháp AI sử dụng kiến thức và dữ liệu của doanh nghiệp.

HPE công bố cơ sở hạ tầng HPC và AI mới

HPE công bố cơ sở hạ tầng HPC và AI mới

24/11/20 4:30

HPE (Houston, Texas, Hoa Kỳ) vừa công bố danh mục cơ sở hạ tầng mới dành cho điện toán hiệu suất cao (HPC) và trí tuệ nhân tạo (AI).

Copyright © 2024 Generatived - All right Reserved.

Chia sẻ bài viết này:

Chia sẻ bài viết này:

Generatived

Generatived là dịch vụ cung cấp thông tin và xu hướng chuyên về Generative AI. Chúng tôi sẽ cố gắng hết sức để cung cấp thông tin về thế giới đang thay đổi nhanh chóng.

  • Facebook
  • X

Hãy theo dõi chúng tôi

Ngôn ngữ

Tin tức mới nhất
Adkaru Hayabusa SEO/SEM PV tích lũy vượt quá 1 triệu

Adkaru Hayabusa SEO/SEM PV tích lũy vượt quá 1 triệu

24/11/20 4:30

Adcal (Kikugawa, Sumida-ku, Tokyo) thông báo rằng dịch vụ viết bài SEO/SEM của công ty, Hayabusa SEO/SEM, đã ghi nhận tổng số lượt xem trang là 1 triệu.

RX Japan Triển lãm trí tuệ nhân tạo AI lần thứ 5 vào mùa thu

RX Japan Triển lãm trí tuệ nhân tạo AI lần thứ 5 vào mùa thu

24/11/20 4:30

RX Japan (Chuo-ku, Tokyo) sẽ tổ chức Triển lãm AI/Trí tuệ nhân tạo lần thứ 5 [Mùa thu] tại Makuhari Messe trong ba ngày từ ngày 20 đến 22 tháng 11 năm 2024.

EAGLYS AI giúp các công ty tận dụng kiến thức của họ

EAGLYS AI giúp các công ty tận dụng kiến thức của họ

24/11/20 4:30

EAGLYS (Shibuya-ku, Tokyo) đã bắt đầu cung cấp "Dòng sản phẩm AI khai thác", một giải pháp AI sử dụng kiến thức và dữ liệu của doanh nghiệp.

HPE công bố cơ sở hạ tầng HPC và AI mới

HPE công bố cơ sở hạ tầng HPC và AI mới

24/11/20 4:30

HPE (Houston, Texas, Hoa Kỳ) vừa công bố danh mục cơ sở hạ tầng mới dành cho điện toán hiệu suất cao (HPC) và trí tuệ nhân tạo (AI).

bottom of page