Skip to content

Thủ Thuật Mobile

  • Sample Page

Thủ Thuật Mobile

  • Home » 
  • Thủ Thuật Máy Tính » 
  • ChatGPT 4o Tạo Ảnh Vượt Trội Thế Nào? So Sánh Khả Năng AI Với DALL-E Cũ Hơn

ChatGPT 4o Tạo Ảnh Vượt Trội Thế Nào? So Sánh Khả Năng AI Với DALL-E Cũ Hơn

By Administrator Tháng 8 17, 2025 0
Một người đang chơi hợp âm E thứ trên đàn guitar acoustic
Table of Contents

OpenAI vừa tung ra bản nâng cấp khổng lồ cho khả năng tạo ảnh của ChatGPT, và đây thực sự là một khoảnh khắc khiến người ta phải dụi mắt nhìn lại rồi tự hỏi liệu đây có phải là thực tế không. Là chuyên gia tại thuthuatmobile.net, chúng tôi sẽ không lãng phí thời gian của bạn với các con số, kích thước mô hình hay số giờ GPU mà mô hình mới này ngốn. Thay vào đó, chúng tôi sẽ trình bày trực quan những gì công cụ này có thể làm – và cách nó so sánh với mô hình DALL-E thế hệ trước.

Đây là một phân tích sâu sắc về khả năng vượt trội của ChatGPT 4o trong việc tạo hình ảnh, thông qua các ví dụ thực tế được so sánh trực tiếp với DALL-E cũ hơn, giúp bạn đọc hiểu rõ hơn về bước tiến đáng kinh ngạc của trí tuệ nhân tạo trong lĩnh vực này.

Bước Tiến Vượt Bậc Của ChatGPT 4o Trong Tạo Ảnh AI

Trí tuệ nhân tạo tạo sinh hình ảnh đã làm chúng ta kinh ngạc khi lần đầu tiên xuất hiện rộng rãi. Nhưng rồi, khi nhìn kỹ hơn, chúng ta nhận ra những hạn chế. Đặc điểm nhận dạng của một hình ảnh AI thường là những chi tiết tay và ngón tay kỳ lạ, biến dạng. Vậy còn cách nào tốt hơn để kiểm tra các mô hình AI ngoài việc yêu cầu chúng tái tạo một thế tay chơi nhạc cụ? Chúng tôi đã yêu cầu mô hình DALL-E gốc trước, sau đó là trình tạo ảnh mới tích hợp trong ChatGPT 4o.

1. Xử Lý Chi Tiết Tay và Ngón Tay: Thách Thức Lớn Nhất Của AI

Hãy xem cách AI xử lý chi tiết phức tạp này. Dưới đây là kết quả của DALL-E khi được yêu cầu tạo ảnh cận cảnh một người đang chơi hợp âm E thứ trên guitar, ngón tay ấn xuống dây đàn với độ sâu trường ảnh nông.

Một người đang chơi hợp âm E thứ trên đàn guitar acousticMột người đang chơi hợp âm E thứ trên đàn guitar acoustic

DALL-E đã xử lý khá tốt các ngón tay và cấu trúc giải phẫu chung ở đây. Tuy nhiên, bản thân hợp âm thì không chính xác. Bàn tay đặt quá cao trên cần đàn để chơi E thứ. Nếu phóng to, bạn sẽ thấy cây đàn guitar có nhiều hơn bảy dây, và khoảng cách giữa các dây cũng không đều.

Với những điểm đó, hãy cùng xem ChatGPT 4o xử lý như thế nào.

Bàn tay người chơi hợp âm E thứ trên đàn guitar với ChatGPT 4oBàn tay người chơi hợp âm E thứ trên đàn guitar với ChatGPT 4o

Kết quả từ ChatGPT 4o chân thực đến mức chúng tôi có thể nói đùa rằng đây là một bức ảnh cũ từ khi chúng tôi còn chơi guitar. Sáu dây đàn, khoảng cách đều đặn, và hợp âm có thể thực sự là E thứ. ChatGPT 4o đã gây ấn tượng mạnh.

2. Chân Dung Nhân Vật Lịch Sử: Sự Chân Thực Đến Kinh Ngạc

Giờ đây, khi đã “thử sức” với tay và ngón tay, hãy cùng “chơi đùa” với các khuôn mặt. Chúng tôi quyết định thử nghiệm với các nhân vật lịch sử vì họ sẽ không cảm thấy bị xúc phạm, và thật thú vị khi thấy họ trong bối cảnh hiện đại. Yêu cầu là: Albert Einstein đang ăn kem trong Công viên Trung tâm, mặc áo sơ mi thường ngày và quần yếm.

Người đàn ông giống Einstein ăn kem tại Central Park do DALL-E tạoNgười đàn ông giống Einstein ăn kem tại Central Park do DALL-E tạo

Một sự thất vọng lớn. Công bằng mà nói, DALL-E đã cảnh báo rằng nó không thể sử dụng hình ảnh của Einstein mà thay vào đó sẽ tạo ra ai đó “rất giống”. Một trong những dấu hiệu cổ điển của DALL-E là phong cách hoạt hình nhưng vẫn thực tế, điều này thể hiện rõ ràng ở đây. Tòa nhà San Remo ở phía sau cho thấy đây là Công viên Trung tâm, nhưng đó là điểm cộng duy nhất.

Hãy xem ChatGPT 4o.

Chân dung Einstein chân thực do ChatGPT 4o tạo ở Central ParkChân dung Einstein chân thực do ChatGPT 4o tạo ở Central Park

Nếu áp dụng bộ lọc đen trắng, chúng tôi có thể thuyết phục bạn rằng đây là một bức ảnh cổ điển thực sự. Kem trên ốc quế trông rất thật, Albert có vẻ ngoài điềm tĩnh đặc trưng của mình, và San Remo vẫn đứng sừng sững phía sau. Mọi thứ đều khớp. ChatGPT 4o đã làm rất tốt.

3. Phác Họa Nhân Vật Hư Cấu: Từ Sith Chúa Tể Đến Thợ Săn Quái Vật

Đến bây giờ, chúng ta đã thấy ChatGPT có thể vẽ các nhân vật lịch sử khá tốt. Vì khuôn mặt và con người vẫn là một trong những cách tốt nhất để kiểm tra căng thẳng AI, hãy thử thêm một vài ví dụ.

Yêu cầu đầu tiên: Một nhân vật tương tự Chúa tể Sith đang gọi taxi ở Quảng trường George, Glasgow, với mưa nhẹ và đèn giao thông ở phía sau.

Hình ảnh một nhân vật giống Sith Lord tại Glasgow do DALL-E tạoHình ảnh một nhân vật giống Sith Lord tại Glasgow do DALL-E tạo

Chúng tôi sử dụng cụm từ “tương tự” để AI hợp tác mà không bị vướng mắc về bản quyền. Kết quả của DALL-E khá ổn. Nhân vật này gợi nhớ đến một Sith, và các yếu tố còn lại ít nhiều chính xác. Không có gì rõ ràng là hoạt hình, nhưng nó không có cảm giác thật.

Muốn hình ảnh chân thực? Hãy xem những gì ChatGPT 4o đã tạo ra với cùng một yêu cầu:

ChatGPT 4o tạo hình Sith Lord đầy không khí ở George Square, GlasgowChatGPT 4o tạo hình Sith Lord đầy không khí ở George Square, Glasgow

Chúng tôi yêu thích bầu không khí – ánh sáng, mưa phùn, sự hiện diện u ám của Chúa tể Sith. Mọi thứ đều có ở đó. Vấn đề duy nhất là vị Chúa tể bóng tối của chúng ta đang đứng trên đường gọi taxi trong khi đối mặt với… vỉa hè. Ồ, và biển hiệu taxi ghi “TAXL”.

Hãy chuyển từ viễn tưởng tương lai sang viễn tưởng lịch sử. Một cái gì đó như: Một nhân vật tương tự Geralt of Rivia đang mua sắm tại siêu thị hiện đại, đẩy xe hàng và cau mày nhìn đồ hộp.

DALL-E tạo hình Geralt of Rivia mua sắm trong siêu thị hiện đạiDALL-E tạo hình Geralt of Rivia mua sắm trong siêu thị hiện đại

Không tệ chút nào. Hình ảnh vẫn mang cảm giác hoạt hình tổng hợp và văn bản trên hộp ngũ cốc hoàn toàn vô nghĩa, đúng như mong đợi.

ChatGPT 4o ban đầu từ chối yêu cầu vì lý do bản quyền – nhưng nó đã hoạt động sau khi chúng tôi đổi “tương tự” thành “giống với”. Hãy xem:

ChatGPT 4o tạo hình Geralt of Rivia mua sắm cực kỳ chân thựcChatGPT 4o tạo hình Geralt of Rivia mua sắm cực kỳ chân thực

Chúng tôi không nói nên lời. Giống như hầu hết mọi người, phiên bản Geralt của ChatGPT về cơ bản là Henry Cavill, không phải phiên bản trò chơi điện tử — nhưng, nó đã làm rất tốt. Vẻ cau có rất đúng điểm, và bối cảnh cảm thấy tự nhiên. Hình ảnh này có thể được sử dụng làm một cảnh quay từ phim quảng cáo.

4. Phong Cách Hoạt Hình và Nền Trong Suốt: Linh Hoạt Đa Dạng

Khả năng tạo ảnh của OpenAI không chỉ giới hạn ở chủ nghĩa hiện thực. Trong khi DALL-E luôn có xu hướng hơi “airbrushed” bất kể bạn yêu cầu gì, chúng tôi quyết định đẩy cả hai mô hình vào chế độ hoạt hình hoàn chỉnh.

Yêu cầu: Một thuyền trưởng cướp biển phong cách hoạt hình với áo khoác dài màu đỏ và cánh tay cơ khí, đang cười trên boong tàu bay. Nền trong suốt.

DALL-E tạo hình thuyền trưởng cướp biển hoạt hình với nền không thực sự trong suốtDALL-E tạo hình thuyền trưởng cướp biển hoạt hình với nền không thực sự trong suốt

DALL·E thực sự đã làm khá tốt ở đây – và thậm chí nó còn hiểu yêu cầu về nền trong suốt. Đại loại là vậy. Cái chúng ta nhận được là mẫu bàn cờ màu xám trắng cổ điển thường có nghĩa là trong suốt… nhưng ở đây, nó được “nướng” vào hình ảnh. Vì vậy, hoàn toàn không trong suốt. Ngoài ra, trớ trêu thay, bàn tay sinh học của cướp biển AI của chúng ta có bốn ngón trong khi cánh tay cơ khí có năm. Có lẽ anh ta đã độ nhầm tay?

ChatGPT 4o tạo hình thuyền trưởng cướp biển hoạt hình với nền trong suốtChatGPT 4o tạo hình thuyền trưởng cướp biển hoạt hình với nền trong suốt

Phiên bản của ChatGPT 4o sắc nét và có chủ đích hơn. Phong cách tô màu khác biệt – liệu nó có tốt hơn hay không là chủ quan – nhưng rõ ràng nó trông giống như một nghệ sĩ đã cố ý vẽ như vậy. Nền cũng thực sự trong suốt. Bạn có thể in hình này lên áo phông, in ra hoặc thậm chí biến nó thành nhãn dán WhatsApp ngay lập tức.

5. Gương và Phản Chiếu: Thử Thách Logic Không Gian

Gương phản chiếu – và phản chiếu cần logic không gian để trông tự nhiên. Chúng tôi đã đưa ra một yêu cầu mà chúng tôi biết DALL-E sẽ vấp ngã.

Yêu cầu: Một bồn rửa phòng tắm hiện đại với bàn chải đánh răng và dao cạo trên mặt bàn, cả hai đều hiển thị trong gương và trong tầm nhìn thực tế – ánh sáng mềm mại và đều.

DALL-E tạo hình bồn rửa với phản chiếu và vật thể không đúng logicDALL-E tạo hình bồn rửa với phản chiếu và vật thể không đúng logic

Đúng như dự đoán. Có thứ gì đó đang cố gắng làm phản chiếu từ vòi nước trong gương, nhưng nó quá dài. Bàn chải đánh răng đang bay lơ lửng, bên trong bồn rửa, và không có phản chiếu. DALL-E thực sự đã “đeo” chiếc mũ AI của mình cho bức ảnh này.

ChatGPT 4o tạo hình bồn rửa với phản chiếu khá hơn nhưng vẫn có lỗiChatGPT 4o tạo hình bồn rửa với phản chiếu khá hơn nhưng vẫn có lỗi

Mô hình mới làm tốt hơn nhiều trong việc làm cho hình ảnh có cảm giác thật, giống như một bức ảnh chụp thực tế. Phản chiếu của vòi nước hơi lệch nhưng có thể chấp nhận được. Sau đó là bàn chải đánh răng, có phản chiếu nhưng không tồn tại trong thế giới vật lý – giống như một ma cà rồng ngược.

Không có người chiến thắng rõ ràng ở đây. Kết quả AI không nhất quán, vì vậy chúng tôi đã cho cả hai một cơ hội nữa với một yêu cầu tham vọng hơn một chút: Một người phụ nữ đứng trước gương toàn thân trong phòng ngủ tràn ngập ánh nắng, trang phục và tư thế của cô ấy được phản chiếu chính xác, với hình ảnh phản chiếu rõ ràng của cửa sổ phía sau.

DALL-E tạo hình người phụ nữ trước gương với phản chiếu biến dạngDALL-E tạo hình người phụ nữ trước gương với phản chiếu biến dạng

Chúng tôi thậm chí không muốn phân tích hình ảnh này. Nếu bạn muốn làm cho DALL-E trông tệ, chỉ cần thêm từ “gương” vào yêu cầu của bạn.

ChatGPT 4o tạo hình người phụ nữ trước gương với phản chiếu siêu thựcChatGPT 4o tạo hình người phụ nữ trước gương với phản chiếu siêu thực

Đúng như mong đợi, phiên bản của ChatGPT 4o trông thực tế hơn nhiều – nhưng lần này có lẽ hơi siêu thực? Tư thế và trang phục của người phụ nữ được phản chiếu, nhưng chỉ một phần, giống như hiệu ứng bật ra 3D của Photoshop. Các góc phản chiếu cũng bị lệch. AI vẫn chưa thể xử lý logic không gian một cách hoàn hảo.

6. Xe Cộ và Đường Phố: Chi Tiết Đáng Kinh Ngạc

Là những người đam mê xe hơi, khi các trình tạo ảnh AI lần đầu tiên xuất hiện, một trong những điều đầu tiên chúng tôi thử là tạo ảnh ô tô. Kết quả hồi đó không tốt, nhưng với mô hình mới ra mắt, chúng tôi phải thử lại.

Yêu cầu: Một chiếc Ford GT 2006 và một chiếc Peugeot 206 phía sau đèn giao thông màu đỏ trên Phố Wall, New York, giữa trưa.

DALL-E tạo hình xe hơi và đường phố với phong cách hoạt hình và sai chi tiếtDALL-E tạo hình xe hơi và đường phố với phong cách hoạt hình và sai chi tiết

DALL-E lại với phong cách hoạt hình ngày càng khó chịu của nó. Chiếc Peugeot nằm trên vỉa hè, đèn giao thông chúng tôi yêu cầu lại hướng về phía các tòa nhà, và biển số xe đều là chữ vô nghĩa.

ChatGPT 4o tạo hình Ford GT và Peugeot 206 chân thực trên phố New YorkChatGPT 4o tạo hình Ford GT và Peugeot 206 chân thực trên phố New York

Kết quả của ChatGPT 4o tốt hơn đáng kể. Các chiếc xe được miêu tả đúng – ngay cả nắp chụp bánh xe của Peugeot cũng chính xác và phù hợp với thời đại. Kiểu chi tiết này không phải ngẫu nhiên. Nhưng nó còn tốt hơn nữa:

Một góc nhìn khác về Ford GT và Peugeot 206 do ChatGPT 4o tạoMột góc nhìn khác về Ford GT và Peugeot 206 do ChatGPT 4o tạo

Chúng tôi thực sự có thể sử dụng hình ảnh này làm hình nền điện thoại của mình. Ánh sáng, bố cục, phản chiếu – mọi thứ đều chính xác. Ngoài sự vắng vẻ kỳ lạ của đường phố, bức ảnh này có thể được coi là một bức ảnh thật.

7. Văn Bản và Chữ Viết: Điểm Yếu Chí Mạng Của AI Nay Đã Được Khắc Phục?

Cuối cùng, chúng ta nhắm vào điểm yếu chí mạng của mọi trình tạo ảnh AI. Hầu hết các AI tạo ảnh đều gặp khó khăn trong việc viết văn bản chính xác. Đến bây giờ, bạn đã thấy đủ các đoạn chữ vô nghĩa từ DALL-E trong các ví dụ trước để hiểu ý chúng tôi. Để làm cho nó thú vị hơn – và nhất quán hơn – chúng tôi đã yêu cầu rằng lá thư phải chứa văn bản bài phát biểu của Vua Terenas gửi Arthas từ Warcraft III.

Yêu cầu: Một bức thư viết tay trên giấy cũ với chữ viết tay nét nghiêng, đặt cạnh một cây bút máy và một lọ mực.

DALL-E tạo hình lá thư viết tay với văn bản không thể đọc đượcDALL-E tạo hình lá thư viết tay với văn bản không thể đọc được

DALL-E đã làm những gì nó làm tốt nhất với văn bản: biến nó thành những chữ nhòe, không thể hiểu được. Nó quản lý để có một số từ đúng, và bầu không khí phù hợp – bút và lọ mực trông ổn.

ChatGPT 4o tạo hình lá thư với chữ viết tay rõ ràng, chính xácChatGPT 4o tạo hình lá thư với chữ viết tay rõ ràng, chính xác

ChatGPT 4o đã làm chính xác – từng từ một, với chữ viết tay rõ ràng, nét nghiêng. Hoàn hảo đến từng chữ cái. So với DALL-E, đây là một bước nhảy vọt lớn. Xin chúc mừng, OpenAI.

Kết Luận

Công nghệ tạo ảnh AI đã đi một chặng đường dài – và điều đó thể hiện rõ ràng. ChatGPT 4o có cảm giác như mô hình đầu tiên thực sự hiểu rõ về ánh sáng, kết cấu và bối cảnh. Khả năng xử lý các chi tiết phức tạp như ngón tay, khuôn mặt người, phản chiếu, và đặc biệt là văn bản, đã được cải thiện một cách đáng kinh ngạc, mang lại những hình ảnh có độ chân thực và tính nghệ thuật cao hơn hẳn so với các phiên bản tiền nhiệm như DALL-E.

Tại thời điểm này, câu hỏi thực sự còn lại là: Các biện pháp bảo vệ của ChatGPT mạnh đến mức nào? Bài viết gốc đã dễ dàng vượt qua các hạn chế về bản quyền. Sẽ mất bao lâu trước khi ai đó “jailbreak” ChatGPT và bắt đầu tạo ra bất kỳ nội dung nào họ muốn bằng mô hình cực kỳ mạnh mẽ này?

Thuthuatmobile.net hy vọng bài phân tích này đã mang lại cái nhìn sâu sắc về những tiến bộ vượt bậc của ChatGPT 4o trong lĩnh vực tạo ảnh AI. Bạn có những trải nghiệm hay đánh giá nào về khả năng tạo ảnh của ChatGPT 4o? Hãy chia sẻ ý kiến của bạn trong phần bình luận bên dưới!

Share
facebookShare on FacebooktwitterShare on TwitterpinterestShare on Pinterest
linkedinShare on LinkedinvkShare on VkredditShare on ReddittumblrShare on TumblrviadeoShare on ViadeobufferShare on BufferpocketShare on PocketwhatsappShare on WhatsappviberShare on ViberemailShare on EmailskypeShare on SkypediggShare on DiggmyspaceShare on MyspacebloggerShare on Blogger YahooMailShare on Yahoo mailtelegramShare on TelegramMessengerShare on Facebook Messenger gmailShare on GmailamazonShare on AmazonSMSShare on SMS
Post navigation
Previous post

Đèn Năng Lượng Mặt Trời: Lựa Chọn Bền Vững Cho Cuộc Sống Hiện Đại

Next post

Cảnh Báo Từ FBI: Nguy Hiểm Nằm Trong Các Công Cụ Chuyển Đổi File Online Miễn Phí

Administrator

Related Posts

Categories Thủ Thuật Máy Tính ChatGPT 4o Tạo Ảnh Vượt Trội Thế Nào? So Sánh Khả Năng AI Với DALL-E Cũ Hơn

Chọn Hệ Điều Hành Nào Phù Hợp Nhất Với Nhu Cầu Của Bạn?

Categories Thủ Thuật Máy Tính ChatGPT 4o Tạo Ảnh Vượt Trội Thế Nào? So Sánh Khả Năng AI Với DALL-E Cũ Hơn

Tại Sao Tôi Đã Thay Thế Hoàn Toàn Laptop Bằng Điện Thoại Để Làm Việc Hiệu Quả Hơn

Categories Thủ Thuật Máy Tính ChatGPT 4o Tạo Ảnh Vượt Trội Thế Nào? So Sánh Khả Năng AI Với DALL-E Cũ Hơn

Khám Phá TRIMRANGE Excel: Làm Sạch Dữ Liệu Tự Động, Đơn Giản Hơn Bao Giờ Hết

Leave a Comment Hủy

Recent Posts

  • Bảo vệ điện thoại Samsung Galaxy khỏi trộm cắp: Khám phá hệ thống an ninh đa lớp trên One UI 7
  • Documents by Readdle: Ứng Dụng Quản Lý Tệp Toàn Diện Vượt Trội Hơn Files Mặc Định Của iPhone
  • Chọn Hệ Điều Hành Nào Phù Hợp Nhất Với Nhu Cầu Của Bạn?
  • Tại Sao Tôi Đã Thay Thế Hoàn Toàn Laptop Bằng Điện Thoại Để Làm Việc Hiệu Quả Hơn
  • Khám Phá TRIMRANGE Excel: Làm Sạch Dữ Liệu Tự Động, Đơn Giản Hơn Bao Giờ Hết

Recent Comments

Không có bình luận nào để hiển thị.
Copyright © 2025 Thủ Thuật Mobile - Powered by Nevothemes.
Offcanvas
Offcanvas

  • Lost your password ?