Bản cập nhật mới nhất của ChatGPT từ OpenAI đã mang đến một nâng cấp mạnh mẽ cho khả năng tạo hình ảnh của mô hình GPT-4o. Giờ đây, người dùng có thể tạo ra những hình ảnh chất lượng cực kỳ cao trực tiếp với GPT-4o mà không cần chuyển đổi sang DALL-E 3 hay bắt đầu một cuộc trò chuyện mới. Tuy nhiên, tính năng này vẫn có một số hạn chế nhất định đối với người dùng ChatGPT miễn phí ở thời điểm hiện tại.
Nâng Cấp Đột Phá Khả Năng Tạo Hình Ảnh Của ChatGPT
Mô hình GPT-4o của OpenAI đang trở thành lựa chọn mặc định cho hầu hết các cuộc trò chuyện trên ChatGPT, được đánh giá là “Tuyệt vời cho hầu hết các câu hỏi” nhờ khả năng xử lý thông tin nhanh chóng và chính xác, dù trước đây chủ yếu chỉ hỗ trợ văn bản.
Với bản cập nhật ngày 25 tháng 3 năm 2025, GPT-4o đã được trang bị khả năng tạo ra những hình ảnh chất lượng cao và chi tiết đáng kinh ngạc, vượt trội hoàn toàn so với DALL-E 3 – mô hình mà nó cơ bản thay thế. Không chỉ dừng lại ở việc tạo ảnh, GPT-4o còn có thể thực hiện các thao tác chỉnh sửa và điều chỉnh hình ảnh phức tạp hơn nhiều so với DALL-E 3. Các tác vụ như:
- Chỉnh sửa hình ảnh, màu sắc và phong cách
- Thay đổi tinh tế các chi tiết
- Điều chỉnh đối tượng tiền cảnh và hậu cảnh
Tất cả đều có thể được thực hiện một cách dễ dàng và hiệu quả.
Người đàn ông tóc trắng, phong trần với vết sẹo trên mặt, giống thợ săn quái vật trong thế giới giả tưởng, đang mua sắm tại siêu thị hiện đại
Người đàn ông tóc trắng phong trần với vết sẹo trên mặt, mang phong cách thợ săn quái vật trong một siêu thị hiện đại, được tạo bởi ChatGPT GPT-4o
Cải Thiện Đáng Kể Văn Bản Trong Ảnh Và Chi Tiết Hình Ảnh
Khả năng tạo văn bản cũng có sự cải tiến vượt bậc. Nếu như việc tạo văn bản của DALL-E 3 (và hầu hết các mô hình AI khác) chưa bao giờ là điểm mạnh, thì giờ đây, GPT-4o có thể tạo ra các infographic chi tiết với phần giải thích rõ ràng về hầu hết mọi chủ đề. Vị trí văn bản trong hình ảnh trở nên chính xác, sử dụng các kiểu chữ và hướng cụ thể mà không lo gặp phải tình trạng văn bản bị mờ hay méo mó.
Việc duy trì chi tiết cũng là một cải tiến rõ ràng khác, với các đặc điểm cụ thể dễ dàng được chuyển từ hình ảnh này sang hình ảnh khác mà không khiến ChatGPT thay đổi hoàn toàn bối cảnh hoặc tạo ra một hình ảnh hoàn toàn mới.
Người đàn ông giống Einstein đang ăn kem tại Công viên Trung tâm, được tạo bởi DALL-E
Người đàn ông giống Einstein đang thưởng thức kem tại Công viên Trung tâm, hình ảnh được tạo bằng ChatGPT GPT-4o
Phần lớn chất lượng hình ảnh nâng cấp này đến từ sự hợp tác của OpenAI với các công ty như Shutterstock và một nhóm các chuyên gia đã dành nhiều giờ để xác định lỗi mà GPT-4o mắc phải trong quá trình tạo hình ảnh. Trao đổi với Wall Street Journal, nhà nghiên cứu trưởng Gabriel Goh giải thích rằng kỹ thuật học tăng cường này cho phép GPT-4o tuân thủ chính xác các hướng dẫn của con người trên một phạm vi rộng lớn các yêu cầu tạo hình ảnh, và quá trình này chỉ cần “hơn 100 nhân viên” để hoàn thành.
Khả năng tạo ảnh mới của ChatGPT thực sự đáng kinh ngạc và bạn nên trải nghiệm nó với bất kỳ chủ đề nào bạn muốn. Dù chưa hoàn hảo – không công cụ tạo ảnh AI nào là hoàn hảo – nhưng đây là một bước nhảy vọt đáng kể về chất lượng từ DALL-E 3, vốn hữu ích nhưng chưa thực sự ấn tượng, lên đến đẳng cấp mà GPT-4o hiện có thể đạt được.
Khả Năng Tạo Ảnh Tuyệt Vời Của ChatGPT Đang Dần Triển Khai Đến Mọi Người
Đáng tiếc, do nhu cầu sử dụng GPT-4o tăng đột biến, người dùng miễn phí của ChatGPT một lần nữa phải chờ đợi tính năng mới này. Vào ngày 26 tháng 3 năm 2025, Giám đốc điều hành OpenAI Sam Altman đã xác nhận sự chậm trễ nhưng không đưa ra thời gian cụ thể cho việc kết thúc giai đoạn chờ đợi.
Sự bùng nổ quan tâm là điều được mong đợi, nhưng ở mức độ cao hơn dự kiến. Điều này đồng nghĩa với việc bạn sẽ phải chờ đợi thêm một thời gian hoặc nâng cấp lên ChatGPT Plus với chi phí 20 đô la mỗi tháng. Công bằng mà nói, với những nâng cấp như thế này, việc nâng cấp lên ChatGPT Plus trở nên đáng giá hơn nhiều so với thời điểm ra mắt mô hình trước đó của OpenAI, GPT-4.5.
Cần lưu ý rằng, như một phần của bản nâng cấp GPT-4o, DALL-E 3 sẽ trở thành “mô hình tạo hình ảnh kế thừa của OpenAI”. Điều này có nghĩa là OpenAI cuối cùng sẽ loại bỏ DALL-E 3 khỏi ChatGPT, mặc dù hiện tại chưa có khung thời gian cụ thể cho sự thay đổi này.
Với những cải tiến vượt trội về khả năng tạo và chỉnh sửa hình ảnh, cùng với sự nâng cấp về tạo văn bản trong ảnh, GPT-4o khẳng định vị thế là một trong những mô hình AI toàn diện và mạnh mẽ nhất hiện nay. Dù vẫn còn một số hạn chế cho người dùng miễn phí, tiềm năng của GPT-4o trong việc cách mạng hóa cách chúng ta tương tác với trí tuệ nhân tạo để tạo nội dung trực quan là không thể phủ nhận. Hãy sẵn sàng trải nghiệm một kỷ nguyên mới của sự sáng tạo hình ảnh do AI hỗ trợ.