OpenAI GPT-4 arriveert in 2023 medio maart en is enorm

OpenAI GPT-4 arriveert in 2023  medio maart en is enorm post thumbnail image

Andreas Braun, CTO van Microsoft Duitsland, bevestigde dat GPT-4 binnen een week na 2023 wordt gelanceerd. 9 maart en dat het multimodaal zal zijn. Multimodale AI betekent dat het kan werken op verschillende soorten invoer, zoals video, afbeeldingen en audio.

Multimodale modellen van grote talen

Een groot hoogtepunt van de aankondiging is dat GPT-4 multimodaal is (SEJ voorspelde dat GPT-4 in januari 2023 multimodaal zal zijn). Een modaliteit is een verwijzing naar het type invoer dat (in dit geval) het grote taalmodel gebruikt. Multimodaal kan tekst, spraak, afbeeldingen en video omvatten. GPT-3 en GPT-3.5 werkten maar op één manier, tekst. Volgens een Duits nieuwsbericht kan GPT-4 op minstens vier manieren werken: beeld, geluid (audio), tekst en video.
dr. Andreas Braun, CTO van Microsoft Duitsland, wordt als volgt geciteerd:
“Volgende week introduceren we GPT-4, en we zullen daar multimodale modellen hebben die totaal andere mogelijkheden zullen bieden – zoals video…” Het rapport miste details over GPT-4, dus het is onduidelijk of wat er werd gedeeld over multimodaliteit was specifiek voor GPT. -4 of gewoon in het algemeen. Holger Kenn, directeur bedrijfsstrategie van Microsoft, legde multimodaliteit uit, maar het rapport was onduidelijk of hij het had over multimodaliteit of multimodaliteit in GPT-4. Ik denk dat zijn verwijzingen naar multimodaliteit specifiek waren voor GPT-4.
Het nieuwsbericht gedeeld:
“Kenn legde uit wat een multimodale AI is die tekst niet alleen in afbeeldingen kan omzetten, maar ook in muziek en video. Een ander interessant feit is dat Microsoft werkt aan “meetwaarden vertrouwen“om hun AI op feiten te baseren en betrouwbaarder te maken.

Microsoft Cosmos-1

Iets dat blijkbaar in de Verenigde Staten te weinig is gerapporteerd, is dat Microsoft’s 2023 Maart. heeft in het begin het multimodale taalmodel “Kosmos-1” uitgebracht. Volgens een rapport van de Duitse nieuwswebsite Heise.de: “… het team heeft het model vooraf getraind voor verschillende tests, met goede resultaten op het gebied van beeldclassificatie, het beantwoorden van vragen over beeldinhoud, het automatiseren van beeldtagging, optische tekstherkenning en spraakgenererende taken . …Visueel redeneren, dat wil zeggen conclusies trekken over afbeeldingen zonder taal als tussenstap te gebruiken, lijkt hier de sleutel te zijn…” Kosmos-1 is een multimodale modaliteit die de modaliteit van tekst en afbeeldingen integreert. GPT-4 gaat verder dan Kosmos-1 doordat het een derde modaliteit, video, toevoegt en een audiomodaliteit lijkt te bevatten.

Werkt in meerdere talen

GPT-4 lijkt in alle talen te werken. Er wordt beschreven dat het een vraag in het Duits kan ontvangen en deze in het Italiaans kan beantwoorden. Dit is een vreemd voorbeeld, want wie stelt nu een vraag in het Duits en wil een antwoord in het Italiaans? Dit werd bevestigd: “…de technologie is zo geavanceerd dat het in principe “in alle talen werkt”: je kunt een vraag stellen in het Duits en antwoord krijgen in het Italiaans. Met multimodaliteit zal Microsoft (-OpenAI) “modellen alomvattend maken”. Ik denk dat het punt van de doorbraak is dat het model de taal overtreft in zijn vermogen om kennis in verschillende talen over te brengen. Dus als het antwoord in het Italiaans is, weet hij dat en kan hij het antwoord geven in de taal waarin de vraag is gesteld. Dat zou vergelijkbaar zijn met het doel van de multimodale AI van Google, MUM genaamd. De moeder zou antwoorden in het Engels kunnen geven met alleen gegevens in een andere taal, zoals Japans.

GPT-4-programma’s

Er is momenteel geen aankondiging waar GPT-4 zal verschijnen. Azure-OpenAI werd echter specifiek genoemd. Google probeert Microsoft in te halen door concurrerende technologie in zijn zoekmachine te integreren. De ontwikkeling versterkt verder de perceptie dat Google achterloopt en geen leiderschap heeft op het gebied van consumenten-AI. Google integreert AI al in verschillende producten, zoals Google Lens, Google Maps en andere gebieden waar gebruikers interactie hebben met Google. Het is alleen zo dat de manier waarop Microsoft het implementeert beter zichtbaar is.
Lees hier het originele Duitse rapport:
GPT-4 komt volgende week – en het zal multimodaal zijn, zegt Microsoft Duitsland.
Afbeelding met dank aan Shutterstock/Master1305

Relevante berichten