Ngay khi DeepSeek vẫn còn đang thu hút sự chú ý của giới công nghệ, một mô hình AI khác từ Trung Quốc đã xuất hiện và sẵn sàng soán ngôi. Gã khổng lồ thương mại điện tử Alibaba đã chính thức công bố phiên bản mới của dòng mô hình AI Qwen của mình, và nó sở hữu nhiều điểm đáng chú ý – thậm chí còn vượt trội hơn DeepSeek và ChatGPT ở một số khía cạnh quan trọng. Với những cải tiến vượt bậc về hiệu suất và khả năng xử lý, Qwen Max được kỳ vọng sẽ trở thành một trong những cái tên hàng đầu, định hình lại cuộc cạnh tranh khốc liệt trong lĩnh vực trí tuệ nhân tạo toàn cầu.
Qwen Max là gì? Điểm nổi bật của mô hình AI Alibaba
Qwen Max là mô hình AI mới nhất và mạnh mẽ nhất trong đại gia đình Qwen của Alibaba. Hiện tại, có nhiều phiên bản mô hình Qwen AI đang hoạt động, phục vụ đa dạng nhu cầu của người dùng và nhà phát triển:
- Qwen2.5-Plus
- Qwen2.5-Max
- Qwen2.5-VL-72B-Instruct
- Qwen2.5-14B-Instruct-1M
- QVQ-72B-Preview
- QwQ-32B-Preview
- Qwen2.5-Coder-32B-Instruct
- Qwen2.5-Turbo
- Qwen2.5-72B-Instruct
Tất cả các mô hình Qwen kể trên đều được cung cấp miễn phí cho người dùng sau khi tạo tài khoản thông qua email, Google, hoặc GitHub. Điểm đặc biệt khác là các mô hình AI của Qwen đều là mã nguồn mở, cho phép bạn dễ dàng tìm thấy chúng trên GitHub hoặc HuggingFace. Điều này cũng mở ra khả năng cài đặt và chạy các mô hình này cục bộ trên thiết bị của bạn (tùy thuộc vào cấu hình), giúp bạn có thể sử dụng AI ngay cả khi không có kết nối internet.
Sức mạnh vượt trội của Qwen2.5-Max
Qwen2.5-Max là một mô hình Mixture-of-Experts (MoE) với 72 tỷ tham số, được huấn luyện trên hơn 20 nghìn tỷ token và hỗ trợ tới 29 ngôn ngữ khác nhau. Khả năng xử lý lên đến 128.000 token trong một cuộc hội thoại duy nhất đồng nghĩa với việc Qwen Max có thể xử lý các tài liệu cực kỳ dài mà không gặp vấn đề. Đối với những ai làm việc với dữ liệu, Qwen cũng nổi bật với khả năng xử lý các định dạng cấu trúc như bảng, CSV và tệp JSON một cách hiệu quả.
Giao diện trang chủ Qwen Chat, hiển thị khu vực nhập câu lệnh và các tùy chọn mô hình AI
Khả năng chuyên biệt và tính năng độc đáo
Đúng như tên gọi, một số mô hình Qwen được tối ưu hóa cho các nhiệm vụ cụ thể. Chẳng hạn, Qwen2.5-Coder-32B-Instruct thể hiện sự vượt trội trong các tác vụ lập trình, trong khi QwQ-32B-Preview lại có khả năng tư duy và lập luận ấn tượng. Mặc dù không phải tất cả các mô hình đều đa năng, nhưng hầu hết chúng đều có thể xử lý các câu lệnh văn bản, cùng với khả năng tạo hình ảnh và video với nhiều tỷ lệ khung hình khác nhau.
Một tính năng khá độc đáo khác của Qwen là khả năng kết hợp hai mô hình với nhau. Trong trải nghiệm thực tế, việc kết hợp hai phiên bản thường mang lại kết quả tốt hơn. Ví dụ, việc ghép nối Qwen2.5-Max với Qwen2.5-Coder-32B-Instruct đã giúp tạo ra mã nguồn với ít lỗi và yêu cầu ít câu lệnh hơn. Website chính thức của Qwen là nơi duy nhất để truy cập mô hình AI này một cách hợp pháp. Ngoài việc nhập câu lệnh và xử lý văn bản, bạn còn có thể sử dụng tính năng tạo hình ảnh và video. Một tính năng “Tìm kiếm web” (Web Search) cũng đã được công bố nhưng chưa chính thức ra mắt.
Qwen 2.5 Max đang tạo ảnh từ câu lệnh văn bản, minh họa khả năng AI tạo sinh hình ảnh
Những hạn chế cần lưu ý
Mặt khác, đôi khi Qwen cần một thời gian để xử lý các câu lệnh. Ban đầu, có thể bạn sẽ nghĩ rằng trang web không hoạt động chính xác. Thông thường, câu lệnh đầu tiên trong một cuộc hội thoại có thể mất khoảng 30 giây để tạo phản hồi, sau đó tốc độ phản hồi sẽ được cải thiện.
Tuy nhiên, khả năng tạo hình ảnh và video của Qwen lại nhanh hơn mong đợi. Mặc dù chất lượng hoặc độ chân thực chưa phải là hàng đầu, nhưng nếu bạn cần tạo nhanh một hình ảnh hoặc video tạm thời, chúng vẫn có thể đáp ứng được. Bạn cũng có thể thấy một lượng lớn các “lỗi ngẫu nhiên” (random artifacts) trong hầu hết các phương tiện được tạo ra. Thời gian phản hồi tăng lên này có thể chỉ là do tải máy chủ, tương tự như tình trạng của hầu hết các chatbot AI khi mới ra mắt, bao gồm cả DeepSeek và ChatGPT. Thỉnh thoảng, người dùng cũng gặp lỗi kết nối với Qwen do có quá nhiều yêu cầu trong hàng đợi.
Qwen có thực sự vượt trội hơn DeepSeek?
Về mặt kỹ thuật, Qwen thực sự vượt trội hơn DeepSeek trên mọi phương diện. Mô hình của Alibaba mang lại cảm giác tương tác tự nhiên hơn và hoạt động nhanh hơn một chút. Tuy nhiên, nếu bỏ qua các kết quả benchmark, bạn sẽ khó tìm thấy sự khác biệt rõ rệt giữa hai mô hình này trong trải nghiệm hàng ngày.
Lợi thế tương tác và độ chính xác
Lợi thế lớn của Qwen so với DeepSeek nằm ở khả năng tương thích tốt hơn với ý định của con người, giúp người dùng dễ dàng nhập các câu lệnh phức tạp và nhận được phản hồi chính xác mà không cần nhiều tinh chỉnh. Ngay cả những câu lệnh đơn giản cũng có thể tạo ra một phản hồi khá chi tiết với nhiều thông tin. Trong khi đó, DeepSeek, dù là một mô hình AI tuyệt vời, đôi khi cần vài lần thử và một số kỹ thuật “prompt engineering” (xây dựng câu lệnh) mới đạt được kết quả mong muốn. Khi nói đến kiến thức tổng quát và độ chính xác về thông tin, cả hai mô hình đều hoạt động tương tự nhau, nhưng Qwen có một chút lợi thế về tính nhất quán của thông tin thực tế.
Trang tải xuống chatbot DeepSeek AI trên Apple App Store, thể hiện sự phổ biến của mô hình AI này
So sánh chi phí sử dụng
Tuy nhiên, có một lĩnh vực mà DeepSeek rõ ràng là người chiến thắng: chi phí sử dụng. DeepSeek có giá 0.25 USD cho mỗi triệu token, trong khi Qwen có giá 0.38 USD. Mặc dù vậy, cả hai vẫn rẻ hơn đáng kể so với mức giá 5 USD và 3 USD của GPT-4o và Claude 3.5.
Bảng so sánh hiệu suất Benchmark
Như đã đề cập trước đó, Qwen vượt trội hơn DeepSeek gần như toàn diện khi xét về các kết quả benchmark:
Benchmark | Qwen 2.5 Max | DeepSeek V3 R1 |
---|---|---|
Arena-Hard | 89.4 | 85.5 |
MMLU-Pro | 76.1 | 75.9 |
GPQA-Diamond | 60.1 | 59.1 |
LiveCodeBench | 38.7 | 37.6 |
LiveBench | 62.2 | 60.5 |
Các chỉ số benchmark rõ ràng cho thấy khả năng hiểu và tương thích tốt hơn của Qwen với các giá trị con người. Ngoài ra, xét về kiến thức và khả năng suy luận, kiến thức tổng quát, mã hóa và khả năng tổng thể, nó chỉ tốt hơn DeepSeek một chút.
Vấn đề bảo mật và tương lai của AI Trung Quốc
Hai mô hình AI này từ Trung Quốc đã đặt ra một tiêu chuẩn mới cho sự phát triển AI. Tuy nhiên, vẫn còn những lo ngại về an ninh và quyền riêng tư, đặc biệt khi DeepSeek đã từng gặp sự cố rò rỉ dữ liệu lần đầu tiên. Dù vậy, các mô hình AI của Qwen và DeepSeek rõ ràng vượt trội hơn các đối thủ phương Tây về hiệu suất và thực sự đã khiến thế giới AI phải cảnh giác.
Kết luận
Qwen Max của Alibaba thực sự là một bước tiến đáng kể trong lĩnh vực trí tuệ nhân tạo, mang đến sức mạnh xử lý vượt trội, khả năng hỗ trợ đa ngôn ngữ và các tính năng chuyên biệt ấn tượng. Mặc dù vẫn còn một số hạn chế nhỏ về tốc độ phản hồi ban đầu và chất lượng hình ảnh tạo sinh, nhưng lợi thế về khả năng tương tác tự nhiên và hiệu suất benchmark cao hơn DeepSeek đã khẳng định vị thế của nó. Dù DeepSeek vẫn giữ ưu thế về chi phí, sự cạnh tranh giữa Qwen và DeepSeek đang thúc đẩy một làn sóng đổi mới mạnh mẽ, đưa các mô hình AI từ Trung Quốc lên bản đồ công nghệ toàn cầu.
Bạn nghĩ sao về Qwen Max và cuộc đua AI đầy hấp dẫn này? Hãy chia sẻ ý kiến của bạn trong phần bình luận bên dưới, hoặc khám phá thêm các bài đánh giá chuyên sâu khác về các mô hình AI tại Thuthuatmobile.net để cập nhật những thông tin công nghệ mới nhất!