OpenAIs DALL-E 2 – Kunst erzeugen mit KI


Vor der Veröffentlichung von DALL-E 2 lud OpenAI 23 externe Forscher ein, die Software auf Schwachstellen zu untersuchen. Eine ihrer Empfehlungen war, die erste Version nur vertrauenswürdigen Nutzern zugänglich zu machen. Dieser Vorschlag wurde vom Unternehmen angenommen, das 400 Personen die Erlaubnis erteilt hat, DALL-E 2 für nicht-kommerzielle Zwecke zu nutzen. Hier sind einige der Ergebnisse:

Das Bilderzeugungssystem von OpenAI

DALL-E 2 basiert auf dem Bilderzeugungssystem von OpenAI, das mithilfe eines neuronalen Netzwerks erstellt wurde. Es nutzt dieses Netzwerk, um die Beziehungen zwischen verschiedenen Elementen in einem Bild zu verstehen. Das Endergebnis des Prozesses kann vom Originalbild abweichen, aber die Beziehungen sind immer gleich. So kann DALL-E 2 zum Beispiel die Beziehungen zwischen zwei Bildern wiedergeben, die zwar ähnlich aussehen, aber nicht genau gleich sind.

Das System arbeitet mit einem 3,5-Milliarden-Parameter-Modell, das mit Tausenden von Bildpaaren und beschreibenden Texten trainiert wurde. Es ist in der Lage, Beziehungen zwischen visuellen Konzepten und beschreibenden Texten herzustellen und kann auch die Auflösung von digital erstellten Bildern erhöhen. DALL-E 2 befindet sich derzeit im Beta-Test und es gibt eine Warteliste für dieses System. Sobald das System genauer wird, wird es in der Lage sein, hochauflösende Fotos und Videos zu erstellen.

OpenAI hat eine Sicherheitsrichtlinie für alle Bilder eingeführt, die von seinem DALL-E Bilderzeugungssystem erzeugt werden. Das System lehnt Bilder ab, die obszön, gewalttätig oder anderweitig anstößig sind. OpenAI arbeitet aktiv daran, die Sicherheit des Systems und die Inhaltsfilter zu verbessern. Es versucht nicht nur, anstößige Inhalte zu vermeiden, sondern auch Bilder, die gegen die Richtlinien und Standards des Unternehmens verstoßen.

Die Nutzung des DALL-E 2 Bilderzeugungssystems ist derzeit kostenlos, wird aber bald auf ein kostenpflichtiges Modell umgestellt. Erstnutzer/innen erhalten eine begrenzte Anzahl von Credits, die sie für die Erstellung von Bildern, die Bearbeitung von Bildern und die Erstellung von Variationen von Bildern verwenden können. Jeden Monat wird das Guthaben erneuert, und die Nutzer/innen können weitere Guthaben in Schritten von 15 $ kaufen. Für Künstler/innen, die finanzielle Unterstützung benötigen, gibt es eine subventionierte Option.

Das DALL-E-Modell, das auf der KI-Software von OpenAI basiert, hat eine Reihe von Vorteilen. Es hat die Qualität der Bilder verbessert und die Latenzzeit deutlich verringert. Allerdings kann das System nur dann realistische Bilder erzeugen, wenn der Benutzer ihm genügend Daten zur Verfügung stellt. Das bedeutet, dass es nicht ideal ist, um Bilder zu erzeugen, die unpassend sind. Es wird sich jedoch weiter verbessern, je mehr Menschen es nutzen.

Dall-e 2 kann Illustrationen erzeugen

DALL-E 2 kann zum Beispiel Illustrationen mit unterschiedlichen Objektivspezifikationen erstellen, so dass du verschiedene Versionen desselben Bildes erstellen kannst. Die Software ist auch in der Lage, verschiedene Stile und Kompositionen zu reproduzieren, wodurch sie verschiedene Kunststile nachahmen kann. Sie ist in der Lage, viele Arten von Kunstwerken zu reproduzieren, darunter Steampunk, Cyberpunk und historische Gemälde. Außerdem kannst du ein beliebiges Bild hochladen und DALL-E erstellt verschiedene Versionen auf der Grundlage dieses Bildes.

Der DALL-E Bildgenerator kostet $15, inklusive Steuern, für 115 Credits. Das sind 13 bis 14 Cent pro Generierungsvorgang. Du kannst die Bilder für kommerzielle Projekte verwenden, z. B. für Kinderbücher, Konzeptzeichnungen für Spiele und Marketingbroschüren. Die KI-Technologie steckt noch in den Kinderschuhen, aber das Unternehmen hat angekündigt, dass es sie schrittweise einführen wird. Die Nutzer werden über Probleme informiert, sobald sie auftreten.

Open AI Dall-2 2

Die Software ist so fortschrittlich, dass du sie sogar darauf trainieren kannst, ein bestehendes Bild zu bearbeiten. Es ist jedoch wichtig zu wissen, dass DALL-E keine Rohdaten aus dem Internet verwendet. Stattdessen haben die Forscher das System mit 650 Millionen Bildern gefüttert. Das Unternehmen hütet noch seine Geheimnisse über das DALL-E-System, aber die Entwickler sagen, dass sie den KI-Algorithmus auf Tausende von Bildern und die dazugehörigen Textunterschriften trainiert haben. Auf diese Weise ist die DALL-E-Kunst nicht einfach ein Haufen zufälliger Bilder. Stattdessen basiert sie auf einem fortschrittlichen KI-Modell – einem neuronalen Netzwerk, das die Funktionsweise des menschlichen Gehirns nachahmt.

DALL-E 2 ist ein Beispiel dafür. Der Computer ist in der Lage, verschiedene Kunststile, Orte und Lichtverhältnisse zu imitieren. Seine Fähigkeit, Kunst zu schaffen, wurde mit viel Ehrfurcht und Befürchtungen aufgenommen. Einige dachten, dass dies viele Branchen umkrempeln würde, und hofften, dass sich der Computer irgendwann als Standardwerkzeug für die Erstellung und Bearbeitung von Kunst durchsetzen würde. Die Tatsache, dass DALL-E Illustrationen erstellen kann, ist ein Beweis für seine beeindruckenden Fähigkeiten.

Das System kann realistische Bilder aus Textbeschreibungen erstellen. DALL-E 2 soll noch fortschrittlicher sein als sein Vorgänger und kann Bilder mit höherer Auflösung und geringerer Latenzzeit erzeugen. Das System lässt auch mehr kreative Freiheit zu. Es ist auch in der Lage, Konzepte zu mischen. Das System lässt sich auch besser anpassen und kann darauf trainiert werden, Grafiken in verschiedenen Stilen zu erstellen. Das könnte sich als großer Segen für die kreative Gemeinschaft erweisen.

OpenAIs KI kann natürlichsprachliche Eingabeaufforderungen verstehen

Dall-E 2 ist ein Roboter, der Aufforderungen in natürlicher Sprache erkennen und verstehen kann. Er ist ein Beispiel für maschinelles Lernen, aber er ist kein vollständiges KI-System. Das Unternehmen hat die vollständige Arbeit nicht veröffentlicht, aber es behauptet, dass der Roboter in der Lage ist, Aufforderungen in natürlicher Sprache zu verstehen. Er arbeitet mit der Architektur des neuronalen Netzwerks Transformer, das 2017 entdeckt wurde. Der Transformer ist eine Art neuronales Netzwerk, das auf großen Datensätzen trainiert werden kann. Es hat den Bereich der natürlichen Sprachverarbeitung revolutioniert und bereits die Übersetzungs- und Google-Suchergebnisse verbessert. Er kann sogar Proteinstrukturen vorhersagen.

Eine große Sorge ist, dass Sprachsysteme, die auf öffentlichen Daten trainiert wurden, persönliche Informationen preisgeben könnten. Das Unternehmen sagt, dass dies zu Urheberrechtsverletzungen führen könnte, wenn der Roboter so programmiert ist, dass er eine Vielzahl von natürlichsprachlichen Aufforderungen versteht. Eine weitere Sorge ist, dass der Roboter Bilder produzieren könnte, die nur für bestimmte Zwecke verwendet werden dürfen. Ein Pferd, das in einer Pfütze mit roter Flüssigkeit liegt, wäre zum Beispiel eine potenziell unpassende Aufforderung.

DALL-E 2 von OpenAI ist ein Text-zu-Bild-Generator, der Bilder auf der Grundlage von Aufforderungen in natürlicher Sprache erstellen kann. Er nutzt eine künstliche Intelligenz (GPT-3), um natürlichsprachliche Aufforderungen zu verstehen und die gewünschten Bilder zu erzeugen. Das Programm kann auch Originalbilder auf der Grundlage von Texteingaben erstellen. Es ist auch in der Lage, natürlichsprachliche Aufforderungen im Kontext zu verstehen.

DALL-E 2 ist auch in der Lage, Bilder auf der Grundlage von Beschreibungen zu bearbeiten. Das Programm kann auch Bilder erstellen, die fotorealistisch oder in einem von dir festgelegten Stil sind. Es kann auch bestehende Bilder bearbeiten, z. B. ein Bild von einem Flamingo. Diese Fähigkeit wird die Branche revolutionieren und die Art und Weise verändern, wie Menschen Bilder erstellen und teilen. Diese Technologie kann ein Segen für Vermarkter sein.

Das System der künstlichen Intelligenz DALL-E 2 wurde auch darauf trainiert, fotorealistische Bilder von Menschen zu erstellen. Es besteht jedoch immer noch die Möglichkeit, dass das DALL-E 2 System von schlechten Akteuren missbraucht werden könnte. Zusätzlich zur Zensur hat OpenAI eine Schutzmaßnahme namens Deepfake eingebaut, die verhindert, dass sich das System Gesichter echter Menschen einprägt und sie realistisch darstellt. Aus diesem Grund schneidet das System gut ab, wenn es um Porträts von imaginären Personen geht, aber schlecht, wenn es um Szenen in Menschenmengen geht.

Dall-e 2 hat eine kreditbasierte Gebührenstruktur

DALL-E 2 ist jetzt mit einer kreditbasierten Gebührenstruktur erhältlich, eine Änderung gegenüber dem bisherigen kostenlosen Modell. Neue Nutzer/innen erhalten eine bestimmte Anzahl von Credits, mit denen sie Bilder erstellen, bearbeiten und verändern können. Nachdem das kostenlose Guthaben aufgebraucht ist, können die Nutzer/innen weitere Guthaben in Schritten von 15 $ kaufen. Eine Gebührenstruktur auf Guthabenbasis ist für Künstler/innen erschwinglicher, aber es ist wichtig zu wissen, dass die Plattform immer noch nicht kostenlos ist.

Das Dokument der DALL-E 2 Systemkarte warnt die Verbraucher vor diesen Risiken. Es ist jedoch wichtig zu wissen, dass sich DALL-E 2 noch in der Beta-Phase befindet und das Unternehmen es genau beobachtet. Das Unternehmen ist besorgt, dass Desinformation oder böswillige Akteure seine Popularität ausnutzen könnten. Eine weitere Sorge ist, dass die DALL-E 2 Plattform sehr viel Energie verbraucht. Deshalb ist es wichtig, dass die Nutzer/innen ihre Systeme nicht überlasten.

Im Moment ist DALL-E noch nicht für den PC verfügbar. OpenAI führt jedoch einen Betatest für DALL-E2 durch. Anfänglich sind die Nutzer/innen auf 50 Bilder pro Tag und 15 Bilder pro Monat beschränkt. Wenn die Nutzer/innen jedoch mit ihrer Arbeit zufrieden sind, können sie $15 für weitere 115 Bilder pro Tag bezahlen. Das macht DALL-E zu einer attraktiven Lösung für Menschen, die mit ihren derzeitigen Computersystemen nicht zurechtkommen.

Um einen breiteren Zugang zu DALL-E zu ermöglichen, führt OpenAI für DALL-E 2 eine kreditbasierte Gebührenstruktur ein. Jeder Kredit entspricht einer Bilderzeugungsaufforderung. Jeder Prompt erzeugt bis zu vier Bilder, wobei jedes Bild bis zu 460 KI-generierte Motive pro Monat erzeugt. Nutzer/innen können zusätzliche Credits erwerben, indem sie ein Credit Pack für 15 $ kaufen. Dieser Zahlungsplan ist auch für Künstler/innen mit einem knappen Budget erschwinglich.

Das Unternehmen hat DALL-E 2 im April auch für eine ausgewählte Gruppe von Nutzern verfügbar gemacht. Das Unternehmen sagt, dass dies der erste Schritt zu einer breiteren Verfügbarkeit von DALL-E ist. Die neue Version unterliegt einer Schwelle von 100.000 Nutzern. OpenAI sagt, dass es möglich ist, das System durch weitere Verbesserungen in den Richtlinien für Bilder einem breiteren Publikum zugänglich zu machen. Außerdem werden neue Algorithmen und Ansätze zur Vermeidung von Verzerrungen getestet.

Ron

Das Internet bietet so viele Möglichkeiten und Informationen, von denen ich nur einen Bruchteil nutze. Trotzdem möchte ich mit diesem Blog einen kleinen Beitrag dazu leisten und mein Wissen in den verschiedenen Bereich mit euch teilen.

Opens in a new tab.

Ron

Das Internet bietet so viele Möglichkeiten und Informationen, von denen ich nur einen Bruchteil nutze. Trotzdem möchte ich mit diesem Blog einen kleinen Beitrag dazu leisten und mein Wissen in den verschiedenen Bereich mit euch teilen.

Neueste Beiträge