Anh em ơi, không biết ai trong đây từng đặt trọn niềm tin vào DeepSeek R1 như tôi không

Chuyện là thế này: Hồi đầu tưởng R1 là best boy trong làng mã nguồn mở, ai ngờ một ngày đẹp trời (28/4, đánh dấu vô sòng), Alibaba tung ra Qwen3 và bam! nó vượt mặt R1 trên LiveBench luôn. LiveBench không phải kiểu bảng xếp hạng ao làng đâu nhé, mà là nơi đánh giá sức mạnh LLM đỉnh cao, từ lập trình tới toán học, phân tích dữ liệu, nói chung là nơi để các mô hình AI "ra vã" nhau cho công bằng.

deepseek-chinh-thuc-22rung-vuong-mien22-qwen3-len-ngoi-va-toi-la-nguoi-chung-kien-cu-lat-keo-nay-1-1746588008.jpg

Và Qwen3 không chỉ thắng , nó thắng đẹp, như kiểu đá vào góc chữ A ở phút bù giờ ấy

Qwen3 xịn đến mức Alibaba còn mạnh miệng tuyên bố: "Chúng tôi chơi sòng phẳng với cả OpenAI và Google" mà không hề thấy ngượng mồm. Tự tin là đúng thôi, vì Qwen3 có đến 235 tỷ tham số, gần bằng DeepSeek-V2 (236B) và vượt qua GPT-4 (175B). Trong khi đó, tôi mới lên đc 100GB RAM mà còn thấy tốn... 

Nó còn dùng kiến trúc "mixture of experts" giống DeepSeek, kiểu như chia bài cho đúng tay chơi. Khi nào cần suy nghĩ sâu, Qwen3 sẽ "ngồi thiền", khi nào cần phản hồi nhanh, nó "bật chế độ turbo". Cũng thông minh đấy chứ

deepseek-chinh-thuc-22rung-vuong-mien22-qwen3-len-ngoi-va-toi-la-nguoi-chung-kien-cu-lat-keo-nay-1746587809.jpg

Dữ liệu huấn luyện: 36.000 tỷ token

Qwen3 còn hỗ trợ 119 ngôn ngữ

Tuy nhiên, đừng mừng hụt, Qwen3 dù đứng đầu bảng mã nguồn mở, nhưng vẫn bị bỏ xa bởi hàng khủng "nhà giàu" như OpenAI o3, Gemini Pro 2.5 và Claude 3.7. Đỉnh bảng hiện tại là em o3-mini high, hỗ trợ bởi Microsoft, đúng kiểu nhà có điều kiện thì cái gì cũng mạnh.

Tóm lại: DeepSeek ngã ngựa, Qwen3 lên ngôi, còn tôi thì quay về góc phòng, tự hỏi liệu mình nên "chuyển hộ khẩu" sang team Alibaba không kkk