Το Openai αποκαλύπτει το Dall-e 3, μια γεννήτρια εικόνων που βασίζεται στο ChatGPT, Dall-e 3: Fusion μεταξύ του ChatGPT και της δημιουργίας εικόνων που θα κουνήσουν το Midjourney
Dall-e 3: Η σύντηξη μεταξύ του ChatGpt και της δημιουργίας εικόνων που θα ανακινήσουν το Midjourney
Με την ενσωμάτωση του Dall-E στο ChatGPT, η OpenAI ενισχύει τη θέση του ως ηγέτη στον γενετικό κόσμο AI. Chatgpt και Dall-e 3, μαζί, υπόσχονται να αποκρούσουν τα σύνορα του AI.
Το Openai αποκαλύπτει το Dall-e 3, μια γεννήτρια εικόνων με βάση το chatgpt
Η τελευταία έκδοση του μοντέλου βασίζεται στο GPT για να διευκολύνει τη δημιουργία σύνθετων και συνεκτικών εικόνων.
Η Openai, η εταιρεία πίσω από το βασικό GPT, μόλις αποκάλυψε το τελευταίο της γενετικό μοντέλο μέχρι σήμερα. Και αυτή τη φορά, είναι και πάλι η εικόνα που βρίσκεται στο προσκήνιο. Τα στρατεύματα του Sam Altman αποκάλυψαν την τρίτη έκδοση της γεννήτριας εικόνας Dall-e. Υποσχέθηκε Περισσότερες αποχρώσεις, λεπτομέρειες και πολυπλοκότητα.
Το πρώτο σημείο που τονίζεται από το OpenAI είναι η ακρίβεια του προτροπή. Ακόμα και οι καλύτερες γεννήτριες της στιγμής, όπως το midjourney ή το dreamstudio, υποφέρουν από ένα κοινό πρόβλημα: έχουν τάση να αγνοούν ορισμένα λόγια του κειμενικού αιτήματος.
Για να έχετε τα καλύτερα αποτελέσματα, είναι επομένως απαραίτητο Εμπειρικά μάθετε να επικοινωνείτε με τον αλγόριθμο. Αυτό συνεπάγεται πολλές δοκιμές στο λεξιλόγιο και στροφές για να βρουν όσους είναι πιο πιθανό να ερμηνευθούν σωστά. Αυτή είναι μια άσκηση που μπορεί να είναι λεπτή όταν ο χρήστης περιμένει ένα πολύ συγκεκριμένο αποτέλεσμα, εξ ου και ο όρος ” άμεση μηχανική »».
Το Chatgpt κινητοποιήθηκε για τη σύνθεση του προτροπή
Με το Dall-e 3, ο Openai θέλει να τερματίσει αυτήν την κατάσταση των πραγμάτων. “” Τα σύγχρονα συστήματα κειμένου σε εικόνα τείνουν να αγνοούν λέξεις ή περιγραφές, οι οποίες σχηματίζουν το χρήστη για να μάθει την προτροπή παραγωγής. Το Dall-e 3 αντιπροσωπεύει ένα μεγάλο βήμα προς τα εμπρός στην ικανότητά μας να δημιουργούμε εικόνες που τηρούν ακριβώς το κείμενο που παρέχεται “Υποδεικνύει την εταιρεία.
Και για να γίνει αυτό, η εταιρεία έχει ήδη το τέλειο εργαλείο: Chatgpt. Η νέα έκδοση του μοντέλου διάχυσης 3 είναι ” Κατασκευασμένο »Γύρω από το chatbot. Τώρα χρησιμεύει ως διαμεσολαβητής για Ερμηνεύστε κάθε λεπτομέρεια του αιτήματος. Το μοντέλο γλώσσας μπορεί επίσης να βοηθήσει τον χρήστη να δημιουργήσει προτροπή εξαιρετικά λεπτομερές έτσι ώστε ο Dall-E να καταλάβει ακριβώς τι αναμένεται από αυτόν χωρίς να χρησιμοποιεί τεχνικές άμεση μηχανική προχωρημένος.
Και αν το αρχικό αποτέλεσμα δεν είναι κατάλληλο, ότι δεν το κάνει. Αρκεί να πάει ξανά από το chatgpt να διεκδικήσει ακριβείς αλλαγές όσον αφορά το χρώμα, το σχήμα, το στυλ, μια συγκεκριμένη λεπτομέρεια … με άλλα λόγια, ο Openai έβαλε τα μικρά πιάτα στα μεγάλα που προσφέρουν ένα μέγιστος βαθμός ελέγχου με Ελάχιστη προσπάθεια και τεχνική εμπειρογνωμοσύνη.
Σχετικά με τα παραδείγματα που προτάθηκαν από το OpenAI, σημειώστε επίσης ότι το Dall-e 3 είναι σε θέση να δημιουργήσει συνεκτικά κείμενα. Αυτό είναι κάτι που οι γεννήτριες εικόνων είχαν πολλά προβλήματα μέχρι τώρα. Για παράδειγμα, η τελευταία έκδοση του Midjourney παράγει πάντα αρκετά … εξωτικά αποτελέσματα όταν του ζητείται να συμμετάσχει σε αυτήν την άσκηση.
Προστατέψτε τα δημόσια πρόσωπα
Η εταιρεία εξακολουθούσε να επιβάλλει ορισμένα όρια σε αυτήν την τρίτη έκδοση. Για παράδειγμα, οι μηχανικοί έχουν ενοποιήσει τις διασφαλίσεις που υπάρχουν ήδη στο Dall-E και το Dall-E 2 που εμποδίζουν τον χρήστη να δημιουργήσει περιεχόμενο ” βίαιο, ενήλικες ή μίσους »».
Επιπλέον, το Dall-e 3 έχει σχεδιαστεί για να αρνηθεί τα αιτήματα που αναφέρουν ρητά δημόσιο αριθμό. Ο στόχος είναι να αποφευχθεί η χρήση του για προπαγάνδα ή παραπληροφόρηση.
Σεβαστείτε την πνευματική ιδιοκτησία
Το άλλο σημαντικό σημείο αυτής της ενημέρωσης είναι ότι η Optai φαίνεται να έχει λάβει υπόψη τις πολλές επικρίσεις που έχουν απευθυνθεί στις διάφορες γεννήτριες εικόνων για πνευματική ιδιοκτησία. Το Dall-E πηγαίνει αρνούνται τα αιτήματα που του ζητούν να μιμηθεί το στυλ ενός ζωντανού καλλιτέχνη. Αυτό θα πρέπει να κλείσει την πόρτα σε πολυάριθμες πλαστές προσπάθειες.
Από την άλλη πλευρά, αυτό το σύστημα προστασίας θα είναι σίγουρα ατελές. Η ακρίβεια αυτής της τρίτης έκδοσης είναι ένα διπλό σπαθί. Θεωρητικά, ένας επαρκώς αντιληπτός χρήστης μπορεί πάντα να αποκτήσει ένα αρκετά στενό αποτέλεσμα. Θα πρέπει απλώς να είστε σε θέση να περιγράψετε το στυλ του στοχευμένου καλλιτέχνη με πολύ ακρίβεια χωρίς να ονομάσετε ρητά.
Το Openai προσφέρει επίσης δύο λύσεις που επιτρέπουν σε έναν καλλιτέχνη του απορρίπτεται ότι το έργο του χρησιμοποιείται για να εκπαιδεύσει το Dall-e. Το πρώτο είναι να συμπληρώσετε τη φόρμα σε αυτήν τη διεύθυνση. Αλλά αν θέλετε να προστατεύσετε έναν μεγάλο αριθμό, όπως αυτά που διατηρείτε στο ηλεκτρονικό σας χαρτοφυλάκιο, το ιδανικό είναι να απαγορεύσετε την πρόσβαση στο Crawler GptBot. Για να το κάνετε αυτό, ακολουθήστε τις διαθέσιμες οδηγίες σε αυτήν τη διεύθυνση.
Αυτό θα περιορίσει σημαντικά την ικανότητα του Dall-e 3 να μιμηθεί τα εν λόγω έργα. Τουλάχιστον, αν δεν έχουν ήδη περάσει στον κύλινδρο. Και δυστυχώς είναι αδύνατο να προσδιοριστεί στην πράξη, αφού τα δεδομένα πηγής δεν διατηρούνται μετά την ενσωμάτωσή τους στο μοντέλο.
Το Dall-E3 θα κυκλοφορήσει επισήμως τον επόμενο Οκτώβριο για τους πελάτες του ChatGpt Plus και του ChatGPT Enterprise Entreprise.
Dall-e 3: Η σύντηξη μεταξύ του ChatGpt και της δημιουργίας εικόνων που θα ανακινήσουν το Midjourney
Το Openai, η μητρική εταιρεία της μητέρας, δεν πρέπει πλέον να παρουσιαστεί. Αφού μας προσέφερε το ChatGpt, ανακοινώνει τώρα την ικανότητα του τελευταίου να παράγει ακριβείς εικόνες, χάρη στη σύντηξη του Dall-E και του ChatGpt στο Dall-e.
Φραντροειδές, Για όσους ακολουθούν, χρησιμοποιήστε ένα εργαλείο δημιουργίας εικόνων: midjourney. Εάν αυτό το όργανο αποδείχθηκε ισχυρό και καινοτόμο στον κόσμο της παραγωγής εικόνων, το Dall-e του OpenAI ήταν επίσης στην πίστα, με εξίσου εντυπωσιακή πορεία. Και το νέο opus Dall-e 3 κίνδυνος Λοιπόν για να αλλάξετε την κατάσταση.
Σύμφωνα με τις διαδηλώσεις που μοιράζονται ο OpenAI, είναι σαφές ότι το Dall-e 3 διακρίνεται από τους προκατόχους και τους ανταγωνιστές του. Όπου ο Midjourney υπερέχει στη φωτορεαλιστική αποκατάσταση, αλλά απαιτεί ακόμα πολλούς χειρισμούς, το Dall-e 3 υπόσχεται πολύ πιο αποτελεσματική και λιγότερο λανθασμένη παραγωγή εικόνων. Ένα αξιοσημείωτο κατόρθωμα, ειδικά λαμβάνοντας υπόψη το γεγονός ότι αυτή είναι μια σημαντική πρόοδος σε σύγκριση με το Dall-e.
Επιπλέον, αυτό το νέο εργαλείο φαίνεται να έχει αναπτύξει μια συγκεκριμένη ικανότητα για τη διαχείριση του κειμένου στις εικόνες, ξεπερνώντας τις ικανότητες ορισμένων ανταγωνιστών του, όπως η σταθερή διάχυση XL και Deepfloyd. Συγκεκριμένα, η Openai υπογραμμίζει την ικανότητά της να παράγει πειστικές εικόνες επιστολών, αριθμών και ακόμη και ανθρώπινων χεριών (μια πραγματική δυσκολία για αυτά τα εργαλεία).
Dall-e 3 // Πηγή: OpenAI
Dall-e 3 // Πηγή: OpenAI
Dall-e 3 // Πηγή: OpenAI
Dall-e 3 // Πηγή: OpenAI
Dall-e 3 // Πηγή: OpenAI
Dall-e 3 // Πηγή: OpenAI
Dall-e 3 // Πηγή: OpenAI
Dall-e 3 // Πηγή: OpenAI
Με την ενσωμάτωση του Dall-E στο ChatGPT, η OpenAI ενισχύει τη θέση του ως ηγέτη στον γενετικό κόσμο AI. Chatgpt και Dall-e 3, μαζί, υπόσχονται να αποκρούσουν τα σύνορα του AI.
Το chatbots όχι μόνο θα είναι σε θέση να συνομιλήσει με σχεδόν ανθρώπινο τρόπο, αλλά και να φανταστεί και να δημιουργήσει εικόνες από απλές περιγραφές. Δεν μπορούμε να περιμένουμε να δοκιμάσουμε.
Εάν θέλετε να δοκιμάσετε το Dall-e 3, θα είναι διαθέσιμο για χρήστες Chatgpt Plus και Enterprise. Που είναι πολύ πιο εύκολο στη χρήση από το midjourney … όπου χρειάζεστε έναν πελάτη διαφωνίας.
Σε ποιον δημιουργήθηκαν οι εικόνες ?
Το ζήτημα των πνευματικών δικαιωμάτων που συνδέονται με τις εικόνες που παράγονται από το AI είναι επί του παρόντος ένα καυτό θέμα. Οι τρέχοντες κανονισμοί υποδεικνύουν ότι οι εικόνες IA εισέρχονται στον δημόσιο τομέα. Ωστόσο, ο Openai δηλώνει σαφώς ότι η ιδιοκτησία των εικόνων που παράγεται από το Dall-e 3 επιστρέφει στους δημιουργούς τους. Και αυτή είναι μια άλλη συζήτηση στον τομέα.
Η Bing Cat δικαιούται επίσης στο Dall-e 3
Την Πέμπτη, 21 Σεπτεμβρίου, η Microsoft πραγματοποίησε συνέδριο για να ανακοινώσει την επόμενη άφιξη του Copilot, αλλά και το νέο εύρος Surface. Παράλληλα, η εταιρεία επικοινωνούσε κατά την άφιξη του μοντέλου Dall-e 3 στο Bing Image Creator. Ως υπενθύμιση, αυτό είναι το εργαλείο δημιουργίας εικόνων Bing Chat Images. Σύμφωνα με τη Microsoft, Bing Image Creator ” Κατανοεί επίσης τι ζητάτε, το οποίο σας επιτρέπει να έχετε πιο ακριβείς εικόνες. »»
Η Microsoft λέει επίσης ότι προχωράει περισσότερο προσθέτοντας ” Ένα ψηφιακό υδατογράφημα αόρατο σε όλες τις εικόνες που δημιουργείται από το AI στο Bing, συμπεριλαμβανομένου του χρόνου και της ημερομηνίας της δημιουργίας τους. “Δύσκολο να γνωρίζουμε πόσο ισχυρό θα είναι αυτό το υδατογράφημα, ούτε πώς μπορούμε να ελέγξουμε την παρουσία του ή όχι, αλλά αυτό είναι ένα πρώτο βήμα.
Για να μας ακολουθήσετε, σας προσκαλούμε να κατεβάσετε την εφαρμογή μας Android και iOS. Μπορείτε να διαβάσετε τα άρθρα, τα αρχεία μας και να παρακολουθήσετε τα πιο πρόσφατα βίντεο του YouTube.