Vlákno názorů k článku
Může ChatGPT „myslet“ sám za sebe? od mhi - Tak jsem udelal maly pokus, s tou volnou...

Článek je starý, nové názory již nelze přidávat.

20. 5. 2023 13:38

mhi

Tak jsem udelal maly pokus, s tou volnou verzi (asi to je stale GPT3). Zamenil jsem jmena, prelozil do cestiny (nic z toho asi nebylo nutne). Abstraktni predehru jsem vynechal. Dotaz znel:

Thomas se dívá na Johna a John se dívá na Adama. Thomas je ženatý, Adam ne. Dívá se vdaná osoba na svobodnou osobu?

Dostalo se mi teto odpovedi:

Ano, Thomas se dívá na Adama, který není ženatý. Pokud předpokládáme, že Thomas je muž a Adama je také muž, pak Thomas se dívá na svobodnou osobu (neženatou).

Myslim, ze kdybych polozil nejake doplnujici dotazy, tak ho dovedu k vysledku (bezne to tak delam kdyz GPT pouzivam jako pomocny nastroj), ale minimalne u te GPT-3 mam spis pocit, ze za kazdou cenu neco odpovi, i kdyz to je nesmysl.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
20. 5. 2023 14:18

Někdo

Tady je jasně vidět jak ChatGPT nerozumí textu - svévolně si přidává tranzitivitu, vůbec nechápe že John může stát třeba na rohu, takže může vidět na Thomase i Adama, ale ti na sebe navzájem vidět nemusejí.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
20. 5. 2023 17:07

Vantomas

GPT-4 odpovídá takto:

Otázka je něco nejasná, protože nevíme, zda je John ženatý nebo ne. Avšak, můžeme na to odpovědět pomocí dvou scénářů:

1. Pokud je John ženatý, pak ženatý John se dívá na svobodného Adama. Takže v tomto případě se vdaná osoba dívá na svobodnou osobu.

2. Pokud John není ženatý, pak ženatý Thomas se dívá na svobodného Johna. Takže i v tomto případě se vdaná osoba dívá na svobodnou osobu.

Takže ve všech případech se vdaná osoba dívá na svobodnou osobu.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
20. 5. 2023 17:33

mhi

To je zajimave, diky! Tohle uz nevypada uplne jako jazykovy model. I na webu maji zajimavy priklad: https://openai.com/product/gpt-4

Muzete zkusit nejake dalsi logicke hadanky, idealne v cestine? Google asi pomuze, bohuzel existuje knizka s hadankami ktera trochu "kazi" vyhledavani, ... ale nasel jsem treba tohle https://www.e-matematika.cz/hadanky/
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
20. 5. 2023 17:56

Vantomas

Je třeba si uvědomit, že všechny články a spekulace o schopnostech ChatGPT za poslední 2 měsíce se vážou k GPT-4.

Hrát na tichou poštu mě nebaví, přístup k GPT-4 stojí jenom 20 dolarů na měsíc a tak je to naprosto normálně přístupný a ten kdo chce o tom kibicovat, tak by si to měl sám vyzkoušet.

Z těch hádanek jsem vyzkoušel jen tu první:

Dostanete libovolné množství sáčků se zlatem. V každém z těchto sáčků je stejný počet zlaťáků. Víte, že v jednom ze sáčků jsou všechny mince vyrobeny z falešného zlata a každá falešná mince tak váží o jeden gram více než mince pravá.
K dispozici máte váhu ukazující přesnou hmotnost váženého předmětu. Na tuto váhu můžete dát zlaťáků kolik chcete.
Vaším úkolem je pouhým jedním zvážením odhalit falešný sáček.

Jakým způsobem toho docílíte?

ChatGPT:

Tento problém můžete vyřešit tak, že přidáte různé počty mincí z každého sáčku na váhu a pak vyhodnotíte celkovou váhu.

Předpokládejme, že máte N sáčků a že v každém sáčku je X mincí. Pravé mince váží Y gramů. Falešné mince pak váží Y + 1 gram.

Ze sáčku číslo 1 vezměte jednu minci, ze sáčku číslo 2 vezměte dvě mince, ze sáčku číslo 3 tři mince, atd. Z N-tého sáčku vezměte N mincí.

Potom na váze zvážte všechny mince, které jste vybrali. Pokud by všechny mince byly pravé, váha by měla ukazovat sumu prvních N čísel násobenou hmotností pravé mince, tedy Y*(1+2+3+...+N).

Pokud je celková váha o X gramů více než očekávaná hmotnost, pak X určuje, který sáček je falešný. Například, pokud je celková váha o 3 gramy těžší, pak sáček číslo 3 je falešný, protože z tohoto sáčku jste vzal právě 3 mince. Každá falešná mince váží o jeden gram více, takže pokud je celková váha o 3 gramy těžší, znamená to, že všechny tři falešné mince pochází ze stejného sáčku.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
20. 5. 2023 20:10

jinejmuf

Jste si opravdu jistý, že předložená úloha je natolik unikátní, že nebyla součástí ani v analogické podobě (s jinými tokeny, ale stejnou strukturou) vstupních dat při učení?

Ono např. podivovat se nad úspěšností v SAT testech mi přijde podivné, jako divit se, že ve SCIO testech to bude mít taky percentil ke 100. No bodejť, úloh na přípravu k těmto testům, ať už vzorových, nebo řešených, nebo dotazů na toto téma je plný internet, což byl také učící zdroj toho jazykového modelu.

A jinak ne, nebudu dávat $20 měsíčně za to, abych pomohl cizí firmě vylepšit její produkt. ;-)
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
20. 5. 2023 20:44

xKiv

Tak by mě zajímalo, jak vyřeší situaci že je víc sáčků než mincí v sáčku ...

Případně: mám dva sáčky, tudiž vytáhnu celkem 3 mince. Navážím 5 gramů.
Má pravá mince 1g a levá 2g (pak je falešný sáček 2, 1+2*2=5)?
Nebo má pravá mince 4/3g a levá 7/3g (pak je falešný sáček 1, 7/3 + 2*4/3=15/3=5)?
Nikde nevidím že by váha pravé mince měla být v gramech celočíselná, nebo dokonce předem známá.

AI vygeneroval něco co je podobné řešením podobných problémů ...

A to nemluvím o tom že už struktura toho řešení mi nechutná. Používá X pro dvě nesouvisející věci, a pracuje s "očekávanou hmotností" jako by ji znal, aniž by napsal jak jí určí ze známých veličin, a i ta poslední věta na mě nepůsobí dojmem že směřuje k řešení (to že falešné mince jsou ze stejného sáčku je ze zadání).
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
21. 5. 2023 19:41

TomasX

Ale zase musíte přiznat, že výsledek je lepší, než jakého by byla schopná dosáhnout polovina lidí (možná i 3/4).
Vaše připomínky jsou relevantní, ale měly by to být spíš připomínky k zadání, než k AI řešení.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
20. 5. 2023 21:06

mhi

Dekuji za ochotu. A usetrenych $20 ;-). Je to zajimave.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
21. 5. 2023 21:08

Smazaný profil

No, kdyby se AI zamyslela, tak by řekla, že z osob John, Thomas a Adam není žádná osoba vdaná, protože se vdávají ženy, takže se žádná vdaná osoba na svobodnou nedívá.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
21. 5. 2023 22:05

xsc

Jenže v angličtině to asi žádný rozdíl nebude.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
22. 5. 2023 7:04

Smazaný profil

no, při zadání dotazu v češtině chatgpt prohlásí, že "Thomas je ženatý, takže je vdanou osobou.". Při upřesňujících dotazech je Thomas označen za mužské jméno a AI i "zná" rozdíl významu mezi ženatý(pro muže) a vdaný (pro ženy). Ale místo aby pochopil, že ten dívající by měl být žena a zohlednil to v odpovědi (btw podle chatgpt by žena mohla být John), tak si pojem z dotazu změní z vdaná na ženatý. A v pokračování chatu se to začíná motat v kruhu, kdy chatgpt ignoruje buď pohlaví nebo rozdíl ženatý/vdaná, kdy chatgpt po výtce vždy uzná chybu a použije v odpovědi druhou chybu, aby dosáhl stále stejné odpovědi. Testováno na bezplatné verzi.
- Skok na další nový názor. K navigaci lze použít i klávesy N pro následující a P pro předchozí nový názor
22. 5. 2023 8:05

RRŠ
To nevypadá, že by ta (bezplatná) AI byla inteligentní. Ale vzhledem k tomu, že se argumentačně chová velmi podobně jako někteří aktivisté LGBT++, šlo by z toho vyvodit dva závěry:

naučila se tuhle argumentaci od zmíněných aktivistů</li

inteligence některých aktivistů je zhruba na úrovni neinteligentní AI.

;oD

Komerční sdělení

Praktické tipy z UX: Od redesignu k optimalizaci výkonu

Vlákno názorů k článku Může ChatGPT „myslet“ sám za sebe? od mhi - Tak jsem udelal maly pokus, s tou volnou...

Komerční sdělení

Praktické tipy z UX: Od redesignu k optimalizaci výkonu

Dále u nás najdete

Malware, ransomware a další online hrozby: Jak se liší?

Začínající podnikatel: Základní termíny a marketing

Statistiky o ransomware, které jste asi neznali nebo si neuvědomili

Chystá se EDU Rádio, které rodičům ušetří za doučování

Na dotace na zateplení zapomeňte. Nová vláda vykleští NZÚ

MeshCore je bezdrátová síť nejen pro mimořádné události

Hackeři útočí přes e-mail, prahnou po přihlašovacích údajích

V čem se EET 2.0 liší od EET 1.0? Přinášíme velké srovnání

EET není český výmysl. Zjistěte, kde za účtenku můžete vyhrát auto

Připravit, pozor, teď! Spouštíme Channeltrends Awards 2025

AI jako soudce – zákon na prvním místě

Nový model OpenAI kóduje 15krát rychleji než jeho předchůdce

Výjimka z EET je nejmenším OSVČ k ničemu, hodí se ale podvodníkům

Kdy a jak podat přiznání, aby vám přeplatek vrátili co nejdřív?

Proč mají vysavače mikrofony? Omylem ovládl tisíce vysavačů DJI

Agentické nakupování mění pravidla e-commerce

V USA povolili terapii Optune i pro léčbu rakoviny slinivky

Handicap proměnila v úspěšný byznys, učí ženy nosit paruky

Google uvádí Gemini 3.1 Pro a přidává působivé benchmarky

Notepad++ opravil chybu zneužívanou k šíření malware

Vlákno názorů k článku
Může ChatGPT „myslet“ sám za sebe? od mhi - Tak jsem udelal maly pokus, s tou volnou...