Uw gegevens. Uw keuze.

We gebruiken cookies en soortgelijke technologieën om je de beste winkelervaring te bieden en voor marketingdoeleinden. Accepteer, weiger of beheer het gebruik van je informatie.

Achtergrond

Van foto naar recept: MiniGPT-4 genereert tekst uit afbeeldingen

Michelle Brändle
25/4/2023
Vertaling: machinaal vertaald

Terwijl AI-modellen zoals ChatGPT reageren op teksten of afbeeldingen maken van teksten zoals MidJourney, pakt MiniGPT-4 het anders aan. Het creëert teksten uit afbeeldingen.

OpenAI presenteerde GPT-4 in maart 2023, waarop ook ChatGPT is gebaseerd. Het is een multimodaal model dat meer aankan dan alleen tekst. De functie voor het uploaden van afbeeldingen om teksten te maken is nog niet beschikbaar. Om het potentieel van de tool te testen, heeft een onderzoeksgroep een kleinere versie van het programma met deze afbeeldingsfunctie gemaakt: MiniGPT-4.

MiniGPT-4 vult momenteel een leemte, omdat andere taalmodellen (LLM) nog geen afbeeldingen verwerken. Wat dat betreft laat het programma al zien wat er mogelijk is als chatbots ook kunnen "zien". En dat is heel wat: MiniGPT-4 maakt een gedicht van een geüploade afbeelding, kan HTML-codes maken van schetsen voor een website en weet wat er mis is met je zieke plant. Je kunt het programma momenteel uitproberen. Ik kon de kans niet voorbij laten gaan en was geamuseerd door de resultaten.

Het programma werkt eenvoudig: je uploadt een afbeelding en schrijft in korte woorden wat je wilt dat MiniGPT-4 ermee doet. In een demovideo kun je zien wat er allemaal mogelijk is. Het programma geeft je bijvoorbeeld tips over hoe je een zieke plant weer gezond kunt maken. En het maakt een gedetailleerde beschrijving van een kunstwerk voor je.

Ik kan me al voorstellen dat ik wil weten welke bloemen ik tegenkom als ik aan het wandelen ben. En MiniGPT-4 vertelt me dan of ik ze kan gebruiken voor mijn volgende koude thee of dat ik mezelf gewoon zou vergiftigen ...

Maar ik begin met iets onschuldigers. Aan de hand van een foto van mijn lievelingsgerecht, Pad Thai, wil ik het recept voor je uitspugen.

Pad Thai recept van een foto

De chatbot begrijpt en reageert in het Engels. Daarom heb ik die passages in het Duits vertaald.
Ik neem een foto van het noedelgerecht en schrijf:
Wat is het recept voor dit gerecht?

Het antwoord van MiniGPT-4 is kort en krachtig, maar niet zoals ik had gehoopt:

Dit gerecht lijkt een roerbakgerecht te zijn met kip, noedels en limoen. Het is waarschijnlijk gemaakt met een combinatie van ingrediënten zoals kip, noedels en limoen. Het gerecht kan ook worden geserveerd met een bijgerecht van rijst of een ander zetmeel. Het is waarschijnlijk een populair gerecht in Zuidoost-Azië

Zo ziet MiniGPT-4 eruit met mijn Pad Thai gesprek.
Zo ziet MiniGPT-4 eruit met mijn Pad Thai gesprek.
Bron: Michelle Brändle

MiniGPT-4 formuleert heel zorgvuldig. Maar niet precies waar ik op hoopte. Ik kan direct op het gesprek inhaken en specifieker zijn:
Hoe bereid ik het?

En beloond worden met een recept (met de nadruk op een recept):
Je hebt de volgende ingrediënten nodig voor dit gerecht:

  • 1 pond kip zonder bot en vel, in dunne reepjes gesneden
  • 1/2 kopje sojasaus
  • 1/4 kopje limoensap
  • 2 eetlepels maïzena
  • 2 eetlepels plantaardige olie
  • 1/4 kop gehakte groene uien
  • 1/4 kop gehakte groene paprika
  • 1/4 kop gehakte champignons
  • 1/4 kop gehakte waterkastanjes
  • 1/4 kop gehakte selderij
  • 2 eetlepels boter
  • Zout en peper naar smaak
  • Houten lepel om te roeren en te bakken

Instructies:

  1. Verwarm de plantaardige olie in een grote koekenpan of wok op middelhoog vuur
  2. Voeg de kip toe aan de pan en roerbak ongeveer 5 minuten tot deze door en door gaar is.
  3. Verwijder de kip uit de pan en zet apart.
  4. Voeg de sojasaus, limoensap, maïzena en boter toe aan dezelfde pan. Roer tot de saus glad en goed gemengd is.
  5. Voeg lente-uitjes, paprika, champignons en water toe

Goed. Op de een of andere manier een beetje half af en niet helemaal goed. Boter hoort niet echt in het recept. Ik mis tamarindepasta. En ei. Dus ik zou het (voorlopig) niet nog een keer koken, maar het komt aardig in de buurt. En op basis van een foto. Nu al behoorlijk indrukwekkend.

Talent als Goethe? MiniGPT-4 kan poëzie schrijven

Het programma kan ook liedregels en gedichten schrijven op basis van een foto. Ik neem een foto die ik zelf heb geschilderd en laat het programma er een paar romantische regels van maken. Ik instrueer MiniGPT-4:

Creëer een gedicht voor mij op basis van deze afbeelding

Ik wil dat MiniGPT-4 een gedicht voor mij maakt van mijn tekening van een meisje dat naar muziek luistert.
Ik wil dat MiniGPT-4 een gedicht voor mij maakt van mijn tekening van een meisje dat naar muziek luistert.
Bron: Michelle Brändle

Het resultaat:

Het meisje met blauw haar en koptelefoon
Is omringd door bubbels in de lucht
Ze luistert naar muziek op haar telefoon
Met een koptelefoon op is ze in haar eigen hol

Het blauw-witte dambordpatroon
Creëert een leuke en speelse sfeer
Het meisje met blauw haar en koptelefoon
Is omringd door bubbels in de lucht
Ze luistert naar muziek op haar telefoon
Met een koptelefoon op is ze in haar eigen hol

Ik glimlach. Het gedicht is in twee minuten geschreven. Het is spannend wat MiniGPT-4 kan voorlezen. Maar het programma is waarschijnlijk nog geen partij voor Goethe.

Leden van de Foo Fighters

Ik hou van rockmuziek. Bijvoorbeeld de Foo Fighters. Maar ik ben altijd heel slecht met namen. Afgezien van Dave Grohl en zijn overleden drummer Taylor Hawkins, heb ik geen idee hoe de bandleden heten. Een gevalletje voor detective MiniGPT-4: ik upload een bandfoto, vraag naar hun namen en laat het programma de rekensom maken.

Ik vraag eerst wie ze zijn op de foto en MiniGPT-4 herkent ze meteen als de band Foo Fighters. Na verdere vragen noemt het programma daadwerkelijk alle leden. Waarschijnlijk komt dit meer door voorkennis over wie er lid zijn van de Foo Fighters, want de volgorde van hun namen komt niet overeen met de foto.

MiniGPT-4 kent de band beter dan ik.
MiniGPT-4 kent de band beter dan ik.
Bron: Michelle Brändle

De mogelijkheden zijn ongelooflijk gevarieerd

De antwoorden zijn niet altijd perfect, maar zeker indrukwekkend.
Mijn hoofd loopt over van de ideeën. Kan MiniGPT-4 misschien ook uitvinden wat voor cake ik zou kunnen bakken van ingrediënten uit mijn voorraadkast? Of weet het spannende weetjes over kunstwerken die ik in het museum ontdek? Of ...

Ik weet zeker dat je zelf ook ideeën hebt. Laat me in de comments weten wat je aan MiniGPT-4 hebt gevraagd en of je blij bent met de resultaten.

13 mensen vinden dit artikel leuk


User Avatar
User Avatar

In mijn wereld achtervolgt Super Mario Stormtroopers met een eenhoorn en mixt Harley Quinn cocktails voor Eddie en Peter in de strandbar. Overal waar ik mijn creativiteit kan uitleven, tintelen mijn vingers. Of misschien komt het omdat er niets anders door mijn aderen stroomt dan chocolade, glitter en koffie. 


Achtergrond

Interessante feiten uit de wereld van producten, een kijkje achter de schermen van fabrikanten en portretten van interessante mensen.

Alles tonen

Deze artikelen kunnen je ook interesseren

  • Achtergrond

    Van sprookjesland naar horrorscenario in een flits met "DALL-E" beeld-AI

    van Michelle Brändle

  • Achtergrond

    Van koffermobieltjes tot hondenmassages: IFA gadgets om je te laten glimlachen

    van Stefanie Lechthaler

  • Achtergrond

    Waar digitale kunst zijn grenzen heeft: Mijn muurschildering met het Huion Kamvas Pro 27 grafisch tablet

    van Michelle Brändle

5 opmerkingen

Avatar
later