Bard vs ChatGPT: Który lepszy? Porównanie chatbotów AI


Bard vs ChatGPT
Bard, chatbot od Google, pojawił się na rynku w marcu 2023, cztery miesiące po premierze ChataGPT. Była to odpowiedź Google na przełomową technologię sztucznej inteligencji od OpenAI.
Oba narzędzia zbudowane są na zaawansowanych modelach językowych AI (Large Learning Model). LLM-y oparte są na głębokich sieciach neuronowych, które umożliwiają im uczenie się z dużych zbiorów tekstów, analizowanie, rozumienie, przetwarzanie i generowanie treści naśladujących ludzki język. Do ich zadań zalicza się m.in. tłumaczenia, rozpoznawanie mowy, analizę sentymentu, tworzenie, podsumowywanie lub streszczanie tekstów, a także kodowanie czy rozwiązywanie złożonych zadań. Choć oba chatboty mają podobne funkcje, w praktyce różnią się od siebie. Jakie są różnice między Google Bard a ChatGPT?
Dostęp
Dostęp do Barda jest darmowy dla wszystkich posiadaczy konta Google. Z chatu od OpenAI można także korzystać bez opłat, ale tylko w jego starszej wersji opartej na modelu GPT-3.5. Wersja oparta na nowszym GPT-4 daje znacznie większe możliwości i jest dostępna wyłącznie dla subskrybentów ChatGPT Plus i kosztuje 20 dolarów miesięcznie +VAT.
Baza wiedzy
Zarówno najnowszy model ChataGPT, jak i Bard AI mają dostęp do Internetu, dzięki czemu mogą dostarczać najnowsze wiadomości i korzystać z aktualnych danych i statystyk.
ChatGPT był szkolony na danych dostępnych do września 2021, a najświeższe odpowiedzi wynikające z możliwości przeszukiwania Internetu za pomocą Binga są dostępne tylko dla subskrybentów Plus i Enterprise. Model GPT-3.5 nadal opiera się na danych z 2021 roku. OpenAI zapowiada, że wkrótce zostanie udostępniona wszystkim użytkownikom.
Modele językowe i trening
Chatbot od Google początkowo wykorzystywał model LaMDa, jednak przejście na PaLM (Pathways Language Model), a następnie PaLM 2 pozwoliło mu znaczne rozszerzyć możliwości i zwiększyć umiejętności w zakresie rozumowania zdroworozsądkowego i matematycznego oraz logiki. Model został przeszkolony w ponad 100 językach, aby zapewnić lepsze zrozumienie kontekstu i możliwości tłumaczenia, interpretowania i generowania bardziej złożonych tekstów, kodowania oraz rozwiązywania trudnych zadań.
Algorytm chata od OpenAI — GPT (Generative Pre-trained Transformer) skupia się bardziej na przetwarzaniu języka naturalnego. Modele GPT są szkolone na ogromnych ilościach danych, takich jak książki i strony internetowe, w celu wygenerowania spójnego i odpowiedniego kontekstowo tekstu. W rezultacie ich język jest podobny do ludzkiego, dzięki czemu dobrze sobie radzą z odpowiadaniem na pytania, tłumaczeniami i podsumowaniem tekstu.
OpenAI przedstawił cztery wersje GPT. Najnowszy model GPT-4 jest lepszy w generowaniu tekstu i odpowiadaniu na pytania od swojego poprzednika. Prawdopodobieństwo udzielania odpowiedzi zgodnych z faktami wzrosło o 40% w porównaniu z GPT-3.5. Z drugiej strony, badania przeprowadzone w kilku największych uniwersytetach w Stanach Zjednocoznych wykazały, że model GPT-4 bardziej precyzyjnie podąża za wprowadzającymi w błąd informacjami i chętniej podąża za podchwytliwymi podpowiedziami.
Obecnie zarówno Google, jak i OpenAI nie podają rozmiarów zbiorów danych szkoleniowych.
Sposób odpowiadania
Jedną z głównych różnic pomiędzy chatem od Google, a chatbotem od OpenAI jest sposób odpowiadania na zapytania, co wynika z różnic w modelach językowych, na których są oparte. ChatGPT ma obecnie większy potencjał do odpowiadania na pytania w języku naturalnym, a Bard AI jest bardziej nastawiony na prowadzenie konwersacji z człowiekiem.
Różnice w sposobie odpowiadania są widoczne na przykładzie generowanych przez ChatGPT i Barda artykułów. Na podstawie wcześniej przeprowadzonego badania słów kluczowych oraz przygotowanych przez chatboty briefu poprosiłam Barda i ChataGPT o napisanie tekstu dotyczącego narzędzi AI w marketingu, spełniającego następujące kryteria:
Jestem ekspertem w dziedzinie sztucznej inteligencji. Na podstawie przedstawionego briefu proszę stworzyć artykuł popularnonaukowy. Tekst powinien mieć minimum 6000 znaków.
#keyword= AI marketing tools
Skorzystaj z poniższych kryteriów:
- Unikaj żargonu
- Podaj analogie, aby uprościć złożone temat
- Podaj unikalne informacje
- Nie powtarzaj się
- Jeśli coś spekulujesz lub przewidujesz, poinformuj mnie
- Jeśli cytujesz źródła, upewnij się, że istnieją i podaj adresy URL na końcu
- Zaproponuj nieszablonowe przykłady
- Podsumuj najważniejsze wnioski na końcu szczegółowych wyjaśnień
Na podstawie poniższego fragmentu odpowiedzi widać, że ChatGPT świetnie radzi sobie z zadaniami związanymi z językiem naturalnym. Artykuły przygotowane przez modele GPT-3.5 i GPT-4 zawierają analogie i barwne metafory, są wręcz poetyckie. Linki do źródeł zostały podane na końcu artykułu.
Fragment artykułu ChataGPT-4
Co ciekawe, tekst wygenerowany przed GPT-3.5 okazał się bardziej rozbudowany i spełnił wymóg dotyczący długości tekstu — miał prawie 8000 znaków. Z kolei treść wygenerowana przez GPT-4 miała nieco ponad 5 tysięcy znaków. Chatboty opisowo odpowiedziały na zadany temat, przytaczając szereg przykładów, jednak zabrakło głębszej analizy.
Fragment artykułu ChataGPT-3.5
Google Bard wygenerował trzy wersje tekstu o długości ok. 5 tys. znaków. Podobnie jak w przypadku artykułu zaproponowanego przez model GPT-4, jego tekst okazał się krótszy niż wymagany. Informacje zostały przedstawione w sposób treściwy i bardzo konkretny, bez dodatkowych analogii i metafor. Podsumował najważniejsze wnioski, a źródła, na podstawie których stworzył treści są dostępne dzięki wbudowanej funkcji Double-Check.
Fragment artykułu Google Bard
Niezależnie od kryteriów, Bard zawsze dostarcza zwięzłych informacji na dany temat. Podsumowuje i przedstawia najtrafniejsze z nich w punktach. Podaje konkrety, nie leje wody, nie tworzy długich, wyczerpujących wypowiedzi. Natomiast teksty generowane przez ChataGPT mogą być bardziej złożone i opisowe.
W zależności od potrzeb użytkownika, oba narzędzia są bardzo pomocne przy tworzeniu treści i mogą się sprawdzić przy różnych projektach.
Modyfikacja odpowiedzi
Bard pozwala na dostosowanie każdej odpowiedzi bez potrzeby wprowadzania nowego promptu. Przycisk "Modyfikuj" umożliwia zmianę długości lub tonu odpowiedzi, np. na bardziej swobodny lub profesjonalny, bez zmiany parametrów naszego zapytania.
Kolejną przewagą Barda jest proponowanie trzech różnych wersji roboczych na to samo zapytanie. Jeśli nie jesteśmy zadowoleni z żadnej z nich, możemy ponownie wygenerować odpowiedzi. Wyniki są do siebie bardzo podobne w przypadku pytań ogólnych, dotyczących faktów. Wersje zaczynają się od siebie bardziej różnić kiedy zadajemy bardziej abstrakcyjne pytania, wymagających kreatywnych odpowiedzi.
Modyfikacja odpowiedzi ChataGPT jest możliwa przy użyciu opcji “Regenerate”. Dodatkowo, Chatbot od OpenAI oferuje jednak inną funkcję, która zapewnia bardziej dopasowane odpowiedzi do naszych preferencji.
Za sprawą opcji “Niestandardowe instrukcje” (“Custom Instructions”) ChatGPT uwzględnia osobiste wytyczne podczas każdej interakcji. Można określić m.in. swój zawód, zainteresowania, lokalizację oraz oczekiwany sposób i styl odpowiedzi. Eliminuje to potrzebę powtarzania swoich preferencji lub tych samych informacji w każdej rozmowie.
Halucynacje
Chaty AI mają tendencje do halucynacji, czyli podawania zmyślonych odpowiedzi w taki sposób, jakby były prawdziwe. Zapytane o coś, czego nie wiedzą, budują odpowiedzi na podstawie dalekich skojarzeń i zaczynają konfabulować. W badaniach porównawczych chatów stwierdzono, że Google Bard dopuszcza się halucynacji w aż 57% przypadków, a ChatGPT - 2.3%. W tym zestawieniu zdecydowanie lepiej wypada ChatGPT, choć jeszcze kilka miesięcy temu, był w tym samym miejscu, w którym teraz jest narzędzie od Google.
Przykładowo, Bardowi zdarza się halucynować podając informacje o miesięcznym wolumenie wyszukiwań dla fraz kluczowych. Mimo że powołuje się na narzędzia takie jak Google Keyword Planner lub Ahrefs, przedstawiane wyniki bardzo często mijają się z prawdą. Co więcej, liczby różnią się w każdej z trzech wersji odpowiedzi Barda.
ChatowiGPT również zdarza się halucynować, czasem nawet “przewiduje przyszłość”. Mimo że świetnie poradził sobie z najnowszą informacją, kto został nowym kapitanem reprezentacji Polski w piłce nożnej przed meczem Polska - Wyspy Owcze, w kolejnej części odpowiedzi użył nieaktualnych informacji dotyczących najbliższego meczu.
Choć pytanie zostało zadane dwa dni przed meczem, ChatGPT poinformował, że spotkanie piłkarskie już się odbyło, a następnie podał wynik meczu. Informacja dotyczyła jednak poprzedniego spotkania z Wyspami Owczymi, w którym dwa gole strzelił Robert Lewandowski*. Tymczasem w meczu, który miał miejsce 12 października, miał nie wystąpić z powodu kontuzji.
*Ostatecznie, tak jak “przewidywał" ChatGPT mecz zakończył się wynikiem 2:0, ale gole strzelili Sebastian Szymański i Adam Buksa.
Weryfikacja źródeł odpowiedzi
Ze względu na problem z halucynacjami botów, oba narzędzia umożliwiają weryfikację informacji.
W przypadku Barda weryfikacja danych jest jeszcze bardziej rozbudowana. Po wybraniu opcji “Double-check response” chatbot od Google zaznacza na zielono informacje z linkami do źródeł, umożliwiając ich dalsze przeglądanie. Na razie ta funkcja jest dostępna w tylko w języku angielskim. W polskiej wersji Barda, po wybraniu ikonki Google, pojawi się lista tematów powiązanych z naszym zapytaniem. Wybranie jednego z nich przeniesie do strony z wynikami wyszukiwania w Google.
Dodanie linków do źródeł na końcu odpowiedzi zostało wdrożone w wersji GPT-4 podczas korzystania z ChataGPT z dostępem do Internetu w czasie rzeczywistym.
Rozpoznawanie obrazków
Bard AI umożliwia dodawanie obrazków do promptów oraz przesyłanie zdjęć z obiektywem Google (Google Lens). Sztuczna inteligencja może dokonać analizy przesłanego obrazu, napisać tekst na podstawie zdjęcia lub skonwertować obraz na tekst. Ta funkcja ma być wkrótce dostępne w usłudze ChatGPT (jest już dostępna u niektórych użytkowników)
Bard ma możliwość dodawania grafik do odpowiedzi. Sam ich jednak nie generuje, ale wyszukuje obrazy w sieci dopasowane do intencji użytkownika. Model GPT-4 dzięki pluginowi DALL-E 3 umożliwia generowanie obrazów.
Rozpoznawanie mowy
Dyktowanie zapytań jest dostępne w Google Bard po kliknięciu ikony mikrofonu przy polu tekstowym. ChatGPT umożliwia dyktowanie promptów w swojej aplikacji mobilnej.
Wtyczki i integracje
Chatbot od Google może skanować Gmaila, Dokumenty i Dysk, aby szybciej wyszukać potrzebnych informacji. Dzięki integracji użytkownicy mogą poprosić Barda o znalezienie i podsumowanie wiadomości w skrzynce odbiorczej Gmail, a nawet wyróżnienie najważniejszych punktów zawartych w dokumencie przechowywanym na Dysku. Integracje obejmują także rozszerzenia takie jak Google Flights, Hotels i Maps, a także Youtube.
Obecnie te funkcje są dostępne w wersji angielskiej, co oznacza, że za jakiś czas zostaną rozszerzone na język polski. Już dziś z odpowiedzi Barda możemy tworzyć drafty maili, czy eksportować odpowiedzi do Google Docs, a tabele do Arkuszy.
Model GPT-4 oferuje natomiast szereg dodatkowych możliwości dzięki API, która pozwala integrować się z różnymi aplikacjami, a także instalacji wtyczek, które znacznie podnoszą użyteczność narzędzia. Pluginy umożliwiają interakcje z plikami PDF, wizualizację danych czy zaawansowane obliczenia.
Potężnym narzędziem modelu GPT-4 jest “Advanced Data Analysis”, który może stać się narzędziem do analizy danych. Dzięki wbudowanej wtyczce możliwe jest:
- Pisanie i uruchamianie kodu w języku Python
- Analizowanie i interpretowanie danych
- Wizualizowanie danych
- Edytowanie kodu
Google Bard jest wyraźnie nastawiony na konwersację z człowiekiem. Ma większy potencjał jako asystent, któremu możemy zadawać pytania, wysyłać prośby związane z różnymi aplikacjami Google — od streszczenia najważniejszych wiadomości w skrzynce Gmail, wyszukania informacji o lotach i hotelach, po znalezienie trasy mapach Google. Potencjał ChataGPT możemy wykorzystać w różnych projektach, dzięki możliwości integracji z różnymi aplikacjami, a także narzędziu do analizy danych.
User Experience
Interfejs Barda jest bardziej przyjazny od ChataGPT. Wygląda ładniej, ale przede wszystkim tekst jest sformatowany w sposób, który jest o wiele łatwiejszy do zeskanowania wzrokiem. Przy niektórych odpowiedziach pojawiają się obrazki razem z linkami do źródeł, które wzbogacają otrzymane wyniki.
Zarówno Bard, jak i ChatGPT pozwalają zobaczyć w panelu bocznym historię poprzednich rozmów. Można również udostępniać rozmowy znajomym i współpracownikom. Oba narzędzia pozwalają na edycję zapytań w trakcie rozmowy.
Aplikacja mobilna
ChatGPT jest dostępny na smartfonach z Androidem i iOS. Użytkownicy, którzy chcą korzystać z Barda na swoich telefonach mobilnych, mogą to zrobić tylko za pośrednictwem przeglądarki internetowej.
ChatGPT vs. Google Bard - który lepszy?
Porównanie najważniejszych cech i funkcji Barda oraz ChataGPT pokazuje, że oba modele są potężnymi technologiami AI, rozwijającymi się w wielu dziedzinach. Każdy z nich ma swoje mocne i słabe strony, a to, czy ich wyniki są przydatne, często zależy od preferencji użytkownika. Sprawdźmy jeszcze, jak narzędzia oceniają siebie nawzajem. Zakres wiedzy GPT-3.5 nie uwzględnia jeszcze istnienia narzędzia od Google, dlatego do porównania skorzystamy z usług Barda i Chata opartego na modelu GPT-4.
Prompt został sformułowany w języku angielskim i brzmiał następująco:
ChatGPT kontra Bard. Który jest lepszy? Stosując różne kryteria, porównaj oba narzędzia AI. Przedstaw dane w tabeli i wyjaśnij je bardziej szczegółowo poniżej. (Chat GPT versus Bard. Which one is better? Please compare both AI tools, using various criteria. Present data in the table and explain them in more detail below).
Oba narzędzia zaprezentowały odpowiedzi w czytelny sposób, zgodnie z wymaganiami — przedstawiły dane w tabeli, a poniżej opisały wyniki. Przyjęły jednak nieco inne kryteria oraz sposób oceny. Poza ogólnymi, obiektywnymi parametrami takimi jak model językowy, Bard ocenił oba narzędzia i ich funkcje korzystając ze skali, a ChatGPT skupił się raczej na jednoznacznej ocenie, pozwalającej na stwierdzenie czy dana funkcja występuje, czy nie.
Porównanie ChataGPT z Bardem według Barda
Ocena przeprowadzona przez Barda, skłoniła go do przypisania sobie większości zalet. W efekcie wydał werdykt stwierdzający, że jest lepszym narzędziem niż ChatGPT. Pomimo przyznanych atutów, Bard w swoich odpowiedziach… halucynował.
Bard nie tylko nie zorientował się, że ChatGPT Plus daje możliwość korzystania z Internetu, ale także podał przestarzały model językowy (LaMDA), na podstawie którego działa. Od kilku miesięcy używa już modelu PaLM, a od maja 2023 jego ulepszonej wersji - PaLM 2. Na niekorzyść narzędzia od Google przemawia to, że zweryfikował większość informacji i podał linki do źródeł. Co z tego, kiedy informacje w nich zawarte są już nieaktualne?
Jak zatem poradził sobie z tym zadaniem model GPT-4? Jego ogólna ocena narzędzi była bardziej wyważona i mniej stronnicza. ChatGPT wskazał, że wybór, które narzędzie jest lepsze, zależy od osobistych preferencji użytkownika, a także przedstawił mocniejsze strony każdego z nich. Jednak podobnie jak swój konkurent, nie ma miał aktualnych informacji na swój temat. Chatbot korzystał z Internetu do wygenerowania odpowiedzi i podał źródła do każdego akapitu, opisującego poszczególne parametry. Jednak artykuł, z którego czerpał informacje, nie zawierał jeszcze aktualnych danych. W konsekwencji ChatGPT korzystający z Internetu poinformował, że nie ma jeszcze do niego dostępu…
Porównanie ChataGPT z Bardem według ChataGPT-4
O ile oba narzędzia mają dostęp do Internetu, nie potrafią jeszcze poprawnie z niego korzystać. Pomimo że opierają się na źródłach pochodzących z rzetelnych stron, nie radzą sobie z weryfikowaniem ich aktualności. Choć żadne z narzędzi nie poradziło sobie do końca z tym zadaniem, obiektywnie przeprowadzona ewaluacja narzędzi przemawia na korzyść ChataGPT.
Chatboty reprezentują dwa ważne osiągnięcia w świecie interaktywnej technologii AI. Mają ogromny potencjał, lecz wymagają jeszcze wielu ulepszeń.
Porównanie narzędzi pokazuje, że każde z nich ma swoje mocne i słabe strony. Bard, choć ciągle jeszcze oznaczony jako eksperyment, ma ogromny potencjał dla użytkowników korzystających z aplikacji od Google. Może stać się asystentem w codziennych, cyfrowych zadaniach. ChatGPT może przynieść więcej korzyści tym, którzy szukają możliwości integracji i zaawansowanej analizy danych.
Z drugiej strony tendencja tych narzędzi do halucynacji i prezentowania przestarzałych informacji wymaga uwagi. Pomimo dostępu do Internetu mają problem z odpowiednią interpretacją informacji. Odpowiedzi ChataGPT-4 były bardziej stabilne, kiedy posiadał ograniczoną bazę danych. W konsekwencji jakość treści GPT-3.5 bywa lepsza, a odpowiedzi bardziej rozbudowane.
Decyzja o tym, które narzędzie jest lepsze, w dużej mierze zależy od indywidualnych preferencji. Warto korzystać z obu chatbotów w zależności od konkretnych wymagań danego zadania, a także eksperymentować i porównywać wyniki, by znaleźć te, które najlepiej odpowiadają naszym potrzebom.
Walka o zapewnienie najbardziej innowacyjnej i wydajnej oferty dla użytkowników trwa. W wyścigu startuje nie tylko ChatGPT i Bard AI, ale chociażby BingAI, czy xAI od Elona Muska. Zapowiada się więc, że w kolejnych miesiącach będziemy świadkami zaciekłej rywalizacji o prymat na rynku sztucznej inteligencji.