in Dagelijks

GPT-4o

Mijn tijdlijn ontplofte gisteravond. Ik zag allerlei mensen interacteren met een computer/smartphone op een manier die je normaal alleen in films zou zien.

Audio, video en text in realtime. Praten met en tegen een computer.

GPT-4o (“o” voor “omni”) is een stap in de richting van een veel natuurlijkere mens-computerinteractie: het accepteert als invoer elke combinatie van tekst, audio en beeld en genereert elke combinatie van tekst, audio en beelduitvoer. Het kan reageren op audio-invoer in slechts 232 milliseconden, met een gemiddelde van 320 milliseconden, wat vergelijkbaar is met de menselijke reactietijd

OpenAI

Ik merkte dat m’n brein het niet wou geloven. Ja maar. Dit zal wel vooropgezet zijn. Die filmpjes zijn allemaal geprepped. Toch? Is dit echt? Wat als dit echt is? Dit moet wel echt zijn. LLMs kunnen dit. Weet je wel wat dat betekent?

De film Her werd heel veel aangehaald. In tien jaar tijd van Sci-Fi naar echt.

En alles wat je tot gister toe met AI of LLM kon, lijkt ineens kinderspel. Maar tegelijkertijd weet je ook dat GPT-4o nooit meer zo dom zal zijn als nu.

Dus waar eindigt dit, wat is de volgende stap?

Dezelfde vragen als een jaar geleden. Nu nog een keer uitvergroot.

Er zijn een miljoen tweets, hier een willekeurige die een deel van het sentiment vastlegt (klik door naar de tweet eronder).

Ik wil hier wat over zeggen!

Reactie