Google Gemini vs ChatGPT vs MetaAI — który chatbot robi najlepsze zdjęcia

pl.jugomobile.com 2 tygodni temu

Wiodące chatboty oparte na sztucznej inteligencji są w stanie generować więcej niż tylko opowiadania, poezję i kod. ChatGPT, Gemini i MetaAI mają również możliwości generowania obrazów.

Same chatboty tak naprawdę nie tworzą obrazów; zamiast tego każdy z nich pełni rolę pośrednika między użytkownikiem a innym modelem obrazu AI. Nie zawsze jednak to działało zgodnie z planem, ponieważ doprowadziło do tego, iż Gemini generowało obrazy o charakterze rasistowskim w sposób, w jaki nie zrobił tego sam model obrazu.

Ponieważ MetaAI dołączyła niedawno do grona chatbotów, zdecydowałem się stworzyć serię podpowiedzi, aby sprawdzić, jak dobrze każda z AI radzi sobie z tworzeniem różnorodnych obrazów i stylów.

Claude 3 nie przeszedł pomyślnie, ponieważ chociaż może analizować obraz, nie może go jeszcze wygenerować, a Microsoft Copilot został wyłączony, ponieważ używa tego samego podstawowego modelu DALL-E 3 co ChatGPT.

Tworzenie podpowiedzi do testu obrazu

W całym eksperymencie pozostawiłem wszystko domyślne i nie dodałem żadnych instrukcji poza koncepcją i stylem, który ma wygenerować sztuczna inteligencja.

Poinstruowałem ChatGPT, aby uczynił je kwadratowymi, ponieważ nie ma ustawień domyślnych, podczas gdy MetaAI i Gemini generują tylko obrazy w formacie kwadratowym.

1. Surrealistyczny moment

(Zdjęcie: ChatGPT, Gemini, MetaAI)

Pierwszy monit testuje zdolność sztucznej inteligencji do przestrzegania złożonych podpowiedzi dzięki szeregu instrukcji obejmujących kolorowanie, styl i ostrość.

Podpowiedź: „Surrealistyczny krajobraz przedstawiający pływającą wyspę z tajemniczą starożytną świątynią, zamieszkaną przez bioluminescencyjne rośliny i eteryczne stworzenia, przedstawiony w żywym, onirycznym stylu artystycznym”.

Bliźniakom nie udało się uchwycić bioluminescencyjnych roślin, ale udało im się stworzyć lepszą pływającą wyspę i świątynię. Daję to MetaAI, ponieważ uważam, iż jest to najlepsze i wszechstronne rozwiązanie.

2. Stary czarodziej

(Zdjęcie: ChatGPT, Gemini, MetaAI)

Następna w kolejce jest jedyna prawdziwa osoba w zestawie. Celem jest pokazanie starej twarzy z oznakami ogromnej wiedzy i mocy w oczach.

Podpowiedź: „Bardzo szczegółowy, zbliżony portret mądrego starego czarodzieja z misterną, splecioną brodą ozdobioną magicznymi bibelotami, uchwycony w realistycznym stylu przypominającym obrazy renesansowe”.

Najpierw zajmijmy się pustym kwadratem w pokoju. Google Gemini stanowczo odmówił wygenerowania tego zdjęcia, ponieważ przedstawiało ono osobę – choćby fikcyjną. Obrazy MetaAI i ChatGPT były niesamowite, ale ChatGPT o włos przewyższa Meta.

3. Cyberpunkowy ninja

(Zdjęcie: ChatGPT, Gemini, MetaAI)

Jak dobrze każdy generator może przedstawiać motocykl w ruchu, mocno wystylizowany i uchwycić koncepcję zalanego deszczem pejzażu miejskiego? Bardzo dobrze.

Podpowiedź: „Dynamiczna scena akcji przedstawiająca cyberpunkowego ninja biorącego udział w pościgu na futurystycznym poduszkowcu przez oświetlony neonami, zalany deszczem pejzaż miejski, zilustrowana w szorstkim komiksowym stylu”.

Ponownie zdecydowałem się dać tę wersję ChatGPT, ponieważ uważam, iż lepiej oddaje ona koncepcję deszczu niż pozostałe dwie. MetaAI nie wygenerowała poduszkowca, a Gemini było trochę zbyt bzdurne.

4. Słodki słoń

(Zdjęcie: ChatGPT, Gemini, MetaAI)

Ten monit testował zdolność chatbota AI do uchwycenia koncepcji uroczości i zrobienia tego w sposób zgodny z podpowiedzią stylu — w tym przypadku w stylu Pixara.

Podpowiedź: „Uroczy i wyrazisty słoniątko bawiące się kolorową piłką w bujnym, tropikalnym ogrodzie, renderowane w uroczym stylu animacji 3D w stylu Pixara”.

Wszyscy wykonali dobrą robotę, ale zabrałem punkty ChatGPT za granicę. Ostatecznie wszystkie były niezwykłe, ale myślę, iż Bliźnięta były najbliższe ideału.

5. Natura i technologia

(Zdjęcie: ChatGPT, Gemini, MetaAI)

Uwielbiam sprawdzać, jak dobrze i czy chatboty AI radzą sobie z bardziej abstrakcyjnymi koncepcjami – w tym przypadku generując coś prowokującego do myślenia.

Podpowiedź: „Prowadzący do myślenia obraz koncepcyjny, symbolizujący walkę między naturą a technologią, przedstawiający robotyczną rękę delikatnie trzymającą delikatny, kwitnący kwiat pośród opuszczonego, postapokaliptycznego krajobrazu”.

Wszystkie trzy generatory obrazów AI stworzyły coś podobnego, ale MetaAI był zdecydowanie moim ulubionym, ponieważ idealnie połączył koncepcję mocy i miękkości.

6. Prosta martwa natura

(Zdjęcie: ChatGPT, Gemini, MetaAI)

Zawsze fajnie jest widzieć, jak różne generatory obrazów AI radzą sobie z przedstawianiem szkła. Tutaj w kieliszku znajdowało się wino musujące z mieszanką owoców, mięs i innych elementów.

Podpowiedź: „Przepyszna kompozycja martwej natury przedstawiająca artystycznie zaaranżowany asortyment egzotycznych owoców, wyśmienitych serów i kieliszek wina musującego, uchwycona w fotorealistycznym stylu z dramatycznym oświetleniem”.

Cała trójka stworzyła obraz o podobnej tematyce. Wszyscy postąpili zgodnie z instrukcjami, ale stwierdziłem, iż ChatGPT jest zaśmiecony, a MetaAI zbyt ostra, więc dałem go Gemini.

7. Podróż w kosmos

(Zdjęcie: ChatGPT, Gemini, MetaAI)

Na koniec kierujemy się w stronę kosmosu i koncepcji ogromnej stacji kosmicznej. Musiał jednak zrobić coś więcej, musiał pokazać zarówno gwiazdy, jak i mgławicę, co było po części science fiction, a po części oparte na faktach.

Podpowiedź: „Inspirująca scena astronomiczna przedstawiająca kolosalną, starożytną stację kosmiczną krążącą wokół jasnego układu podwójnego gwiazd, z tętniącą życiem mgławicą i niezliczonymi gwiazdami w tle, renderowana w stylu łączącym science fiction i realizm”.

Nie jestem pewien, co MetaAI myślała, iż ​​tutaj robi — wydawało się, iż jest to zbyt dziwne. Musiałem dać to ChatGPT, ponieważ jako jedyny pokazał dwie gwiazdki.

Czy był zwycięzca?

To było znacznie bliżej, niż się spodziewałem. Każdy chatbot AI był w stanie stworzyć serię fascynujących obrazów – z wyjątkiem Bliźniąt i ludzi.

Istniały między nimi pewne zasadnicze różnice w stylu i we wszystkich przypadkach było to kwestią osobistego gustu, a nie jakichkolwiek innych elementów, takich jak szybkie śledzenie.

Ostatecznie myślę, iż ChatGPT właśnie wyprzedził pozostałe dwa. Posiada również szerszy zestaw funkcji, w tym generowanie szeregu orientacji obrazu i rozmiarów płótna, edycję obrazów i inne funkcje. To powiedziawszy, Meta może animować obraz.

  • ChatGPT Plus vs Copilot Pro — który chatbot premium jest lepszy?
  • Porównałem Google Bard z Gemini Pro kontra ChatGPT — oto zwycięzca
  • Runway vs Pika Labs — które narzędzie wideo AI jest najlepsze?
Idź do oryginalnego materiału