Startseite » ChatGPT und Midjourney – KI Bilder
KI Bilder
OpenAI ChatGpt -vs- Midjourney
Gesamte Lesezeit ca. 25 Minuten
Sie finden hier Informationen zu diesen Punkten:
- Texte in Bildern mit KI schreiben
- Vergleich Midjourney mit OpenAI ChatGpt
- Neues bei OpenAI ChatGpt
- KI Bilder mit Beschreibung erstellen
- Fehler in den Texten
- Texteingabe für KI Bild mittels Promt
Aktualisierung: 28.03.2025
Inhaltsverzeichnis mit Schnellzugriff
Texte in KI Bildern
Mit KI lassen sich wunderbar Grafiken und Bilder erzeugen. Es ist aber auch möglich, lesbaren Text in diese Grafiken zu generieren. ChatGpt 4o zeigt derzeit neue Maßstäbe, sowohl in der Bilderstellung als auch im Text.
KI Bilder mit Midjourney

Midjourney ist als KI Bildgenerierungsprogramme das Maß aller Dinge. Allerdings simuliert Midjourney Texte nur.
Das bedeutet Schriften sehe auf den ersten Blick aus wie Wörter sind aber nur generierte Grafiken, die so aussehen.
Man kann jedoch Textbausteine im Prompt (Eingabebefehl) einbauen. Das gelingt auch einigermaßen, auch wenn bei webmarketing das i fehlt.
Der Prompt war hier: „A blonde woman writing „hapo webmarketing – www.hapo.at“ in rapid cursive handwriting on a flipchart. The flipchart is located in a modern office. The woman is supposed to cover the writing slightly. Desks and computers are in the background.“
-Midjourney versteht besser Englisch.-
KI Bilder mit OpenAI ChatGpt

Chat GPT hat jetzt einen gewaltigen Techniksprung hingelegt. Diese Bilder wurden auf der Seite https://openai.com/index/introducing-4o-image-generation/ vorgestellt.
Besonders auffällig ist:
- Das T-Shirt mit Open AI Logo mit den Stofffalten und natürlichen Verformungen
- Die Reflektionen des Fensters mit der Landschaft und der Brücke
- Die Reflektion der schreibenden Frau
- Die Reflektion des Mannes mit dem Handy
- Der lesbare Text in authentischer Handschrift mit Buchstaben, die sich ähnlich sind aber nicht kopiert.
Beachten Sie bei Bild 2 die körperliche Ähnlichkeit des Mannes mit seiner vorherigen Reflektion. Das es sich um eine Neugenerierung handelt erkennt man z.B. am Textteil „Fixes“, der weiter unten ist und andere Aufzählungszeichen hat.
Das die Hände sich nicht genau treffen, muss nicht als Fehler gesehen werden, da beide Personen nach vorne sehen. Das könnte echten Personen auch passieren.
Unser Versuch mit dem original Prompt
Hier haben wir exakt den gleichen Prompt eingegeben wie in der Beispielseite von ChatGpt. Obwohl die grundsätzlichen Anweisungen relativ kurz sind, ist das Ergebnis doch sehr ähnlich. Lediglich eine dritte Person ist aufgetaucht und der Blickwinkel hat sich etwas geändert. Auch der Text ist gleich geblieben, wenn auch in etwas anderer Schreibweise.
Das bei dem vagen Befehl (shows a woman writing, sporting a tshirt wiith a large OpenAI logo) exakt die gleiche Frau kommt, könnte an den weltweit vielen Versuchen mit diesem Prompt liegen. Die KI erfüllt vermutlich die Erwartungshaltungen der User.
Original Prompt von OpenAI ChatGpt
A wide image taken with a phone of a glass whiteboard, in a room overlooking the Bay Bridge. The field of view shows a woman writing, sporting a tshirt with a large OpenAI logo. The handwriting looks natural and a bit messy, and we see the photographer’s reflection.
The text reads:
(left)
„Transfer between Modalities:
Suppose we directly model
p(text, pixels, sound) [equation]
with one big autoregressive transformer.
Pros:
* image generation augmented with vast world knowledge
* next-level text rendering
* native in-context learning
* unified post-training stack
Cons:
* varying bit-rate across modalities
* compute not adaptive“
(Right)
„Fixes:
* model compressed representations
* compose autoregressive prior with a powerful decoder“
On the bottom right of the board, she draws a diagram:
„tokens -> [transformer] -> [diffusion] -> pixels“
Midjourney vs OpenAI ChatGpt


Prompt:
A blonde woman writing „hapo webmarketing – www.hapo.at“ in quick cursive handwriting on a flipchart with a marker. The flipchart is located in a modern office. Desks and computers are in the background. –ar 16:9
Im direkten Vergleich zeigt sich, dass Midjourney mehr Fantasie entwickelt und fehlende Anweisungen mit eigener Kreativität ersetzt. Da wird ein Büro bunt und modern. Auf der Flipchart sind Zeichnungen und kleben Postits. Das macht Midjourney so beliebt, da die Prompts sehr simpel sein können. Dafür hakt es immer noch bei Händen und Augen.
Chat GPT4o braucht exaktere Anweisungen. Auf der Flipchart steht nur hapo webmarketing – www.hapo.at und wenn man im Hintergrund Schreibtische und Computer haben möchte und keine weiteren Angaben macht, dann kann es sein, dass man ein Klassenzimmer bekommt. Ein Besonderheit von Chat GPT4o ist aber, dass Marken angezeigt werden. Eine Nikon ist tatsächlich eine Nikon. Aber beim Wald hat Midjourney wieder etwas mehr Fantasie.
Bilder mit Texten generieren lassen

Was es bedeutet, die Text KI mit der Bild KI kombinieren zu können zeigt dieser Prompt:
„Erstelle eine Tafel mit österreichischen Süßwasserfischen mit Bild und Namen auf Deutsch.“
Und hier sind wir auch schon bei den Problemen. Die Fischkenner werden feststellen, dass zwar die Namen richtig sind, aber manche Fische in Wirklichkeit einfach anders aussehen.
Wir sind aber überzeugt, dass sich das bessern wird.
Diese Pilztafel ist so unsinnig, dass wir sie sogar mit einem Wasserzeichen gekennzeichnet haben. Denn über die Google Bildsuche könnte jemand darauf stoßen.
Prompt:
Erstelle eine Schautafel für ca. 20 Pilze mit Namen und aufgeteilt in giftig und ungiftig in Deutsch.
Es ist aber erstaunlich, welches bildliche Feuerwerk Midjourney bei dem selben Prompt abbrennt. 🙂
Texte für KI Bilder vorgeben
Classic Spareribs
Was ist aber, wenn man den Text mitliefert. Mit englischen Texten funktioniert das schon recht gut. Die Anweisung war, erstelle ein Kochbuch mit aufgeschlagener Seite. Links ein Bild und rechts das Rezept von Classic Spareribs.
Prompt:
Show a page in a new cookbook with Classic Spareribs. On one side, a picture of the Spareribs, on the other side, the recipe:
Marinate
In a bowl, mix the remaining ingredients, but the barbecue sauce. Add the ribs, turning them to coat well. Cover and chill in a refrigerator overnight (up to 48 h).
Barbecue or bake
Preheat the outdoor grill to low temperature (about 120ºC/250ºF) and lightly oil the rack. Place the ribs on the rack then cook about 45 min, turning the ribs from time to time.
Raise the temperature to 200ºC/400ºF, then transfer the ribs to a lower rack. Cook 10 min on each side. Brush them with the barbecue sauce, then cook an additional 5 min per side.
Alternatively, wrap the ribs in aluminum foil and cook 2 h in the oven at 120ºC/375ºF. Baste with the sauce and cook under the oven grill at ‚broil‘, 10 min per side.
Serve the ribs with the remaining sauce on the side.
Midjourney kann mit dem selben Prompt textlich gar nichts anfangen. Im Gegensatz zur nüchternen Sachlichkeit von OpenAI ChatGpt liefert Midjourney allerdings ein regelrechtes Kunstwerk ab.

Kaiserschmarrn
Diesen Kaiserschmarrn wird man nicht nachkochen können. 🙂
Prompt:
Zeige eine Seite in einem neuen Kochbuch mit von einem Kaiserschmarrn. Auf einer Seite das Bild vom Kaiserschmarrn, auf der anderen Seite das Rezept: „Für diesen köstlichen Kaiserschmarrn zuerst in einer Schüssel Mehl, Zucker, Salz und Dotter mit der Milch zu einem glatten, dickflüssigen Teig verrühren.
In einer anderen Schüssel Eiklar zu einem steifen Schnee schlagen und danach unter den dickflüssigen Teig heben.
Die Butter in einer großen, flachen Pfanne (Ø 22-24 cm) aufschäumen lassen, sodass es sehr heiß ist, den Teig langsam eingießen und mit Hilfe eines Pfannenwenders beidseitig anbacken.
Anschließend die Pfanne in ein vorgeheiztes Backrohr bei mäßiger Hitze (Heißluft ca. 180°C) für 10-12 Min. fertig backen – bis der Kaiserschmarren leicht goldbraun ist.
Danach die Pfanne aus dem Backrohr nehmen und den fertigen Teig mit zwei Löffeln in unregelmäßige Stücke zerreißen.“
Auch hier wurde der gleiche Prompt in Englisch bei Midjourney versucht. Der Text ging natürlich total daneben. Und auch der Kaiserschmarrn ist seltsam gewürfelt. Wir sehen aber eine schöne Bildkomposition die typisch für Midjourney ist.
Fazit
Es läuft noch nicht alles rund. Speziell im nichtenglischem Bereich ist ein gutes Bildbearbeitungsprogramm wie Photoshop Gold wert. Dennoch ist die Geschwindigkeit atemberaubend.
Midjourney ist wesentlich schneller und generiert sofort 4 Versionen des Prompts. Ebenso hat Midjourney erheblich mehr künstlerisches Potenzial.
Aller Kritik zum Trotz wurde hier von OpenAI ChatGpt in der KI Bilderstellung jedoch wieder ein riesen Sprung gemacht. Wir werden sehen, was die nächsten Monate bringen. Bleiben wir gespannt. 🙂
Gründer von hapo webmarketing und Spezialist für Suchmaschinenoptimierung und Suchmaschinenwerbung